Spaces:

ThanhNguyen1811
/

phobert-violence

Running

App Files Files Community

ThanhNguyen1811 commited on Jun 10

Commit

58445a7

verified ·

1 Parent(s): 949c8f8

Upload 2 files

Browse files

Files changed (2) hide show

app.py +31 -73
requirements.txt +2 -2

app.py CHANGED Viewed

@@ -1,73 +1,31 @@
-import gradio as gr
-import torch
-import whisper
-from transformers import AutoTokenizer, AutoModelForSequenceClassification
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-# Load PhoBERT model
-MODEL_NAME = "vinai/phobert-base-v2"
-phobert = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=3)
-phobert.load_state_dict(torch.load("best_model_state.bin", map_location=device))
-phobert.to(device)
-phobert.eval()
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-label_map = {0: "An toàn", 1: "Tiêu cực", 2: "Nguy cơ bạo lực"}
-# Load Whisper model
-asr_model = whisper.load_model("base")
-def predict_emotion_from_text(text):
-    inputs = tokenizer.encode_plus(
-        text.lower(),
-        return_tensors="pt",
-        max_length=128,
-        padding="max_length",
-        truncation=True
-    )
-    input_ids = inputs["input_ids"].to(device)
-    attention_mask = inputs["attention_mask"].to(device)
-    with torch.no_grad():
-        outputs = phobert(input_ids=input_ids, attention_mask=attention_mask)
-        probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
-        pred = torch.argmax(probs, dim=1).item()
-    return f"{label_map[pred]} (độ tin cậy: {probs[0][pred]:.2f})"
-# Hàm xử lý audio
-def analyze_from_audio(audio):
-    if audio is None:
-        return "Không có âm thanh"
-    # Whisper yêu cầu path tới file .wav
-    import tempfile
-    import scipy.io.wavfile
-    with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as tmp:
-        scipy.io.wavfile.write(tmp.name, 16000, audio[1])
-        result = asr_model.transcribe(tmp.name, language="vi")
-    text = result["text"]
-    if not text.strip():
-        return "Không nhận diện được giọng nói"
-    prediction = predict_emotion_from_text(text)
-    return f"Văn bản: {text}\n\nDự đoán: {prediction}"
-with gr.Blocks() as demo:
-    gr.Markdown("## 🎤 PhoBERT: Nhận diện cảm xúc học sinh từ giọng nói và văn bản")
-    with gr.Tab("📝 Nhập văn bản"):
-        text_input = gr.Textbox(label="Nhập câu tiếng Việt")
-        text_output = gr.Textbox(label="Kết quả")
-        text_btn = gr.Button("Dự đoán cảm xúc")
-        text_btn.click(fn=predict_emotion_from_text, inputs=text_input, outputs=text_output)
-    with gr.Tab("🎙️ Ghi âm giọng nói"):
-        audio_input = gr.Audio(source="microphone", type="numpy", label="Ghi âm")
-        audio_output = gr.Textbox(label="Kết quả cảm xúc")
-        audio_btn = gr.Button("Phân tích giọng nói")
-        audio_btn.click(fn=analyze_from_audio, inputs=audio_input, outputs=audio_output)
-demo.launch()

+import gradio as gr
+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+MODEL_NAME = "vinai/phobert-base-v2"
+model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=3)
+model.load_state_dict(torch.load("best_model_state.bin", map_location=device))
+model.to(device)
+model.eval()
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+label_map = {0: "An toàn", 1: "Tiêu cực", 2: "Nguy cơ bạo lực"}
+def predict(text):
+    inputs = tokenizer.encode_plus(
+        text.lower(), return_tensors="pt", max_length=128, padding="max_length", truncation=True
+    )
+    input_ids = inputs["input_ids"].to(device)
+    attention_mask = inputs["attention_mask"].to(device)
+    with torch.no_grad():
+        outputs = model(input_ids=input_ids, attention_mask=attention_mask)
+        probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
+        pred = torch.argmax(probs, dim=1).item()
+    return f"{label_map[pred]} (độ tin cậy: {probs[0][pred]:.2f})"
+demo = gr.Interface(fn=predict, inputs="text", outputs="text", title="PhoBERT - Phân tích cảm xúc học sinh")
+demo.launch()

requirements.txt CHANGED Viewed

@@ -1,3 +1,3 @@
-torch
-transformers
 gradio

+torch
+transformers
 gradio