Luigi's picture
Update README.md
54b5848 verified

A newer version of the Gradio SDK is available: 5.25.2

Upgrade
metadata
title: Dinercall Intent Demo
emoji: 🏆
colorFrom: red
colorTo: gray
sdk: gradio
sdk_version: 5.25.0
app_file: app.py
pinned: false
license: apache-2.0
short_description: restaurant reservation intent detector

🍽️ 餐廳訂位意圖識別系統 (Mandarin Reservation Intent Classifier)

🎙️ 本系統讓使用者可以透過語音錄音文字輸入,自動判斷是否具有「訂位意圖」,是語音助理或自動客服前端的理想元件之一。這個版本基於 Gradio 建構,具有簡單直觀的分頁式輸入模式切換(「麥克風」或「文字」)。


🔍 功能介紹

  • 🧠 語音辨識:使用 fine-tuned Whisper 模型 Jingmiao/whisper-small-zh_tw 將語音轉為繁體中文文字。
  • 🤖 意圖分類:使用微調的 ALBERT 中文模型或 Qwen 模型判斷輸入是否包含訂位意圖。
  • 📱 支援手機與桌機:介面具備良好響應性,適用於各類瀏覽器與行動裝置。
  • 🔊 雙重輸入模式:使用者可在「麥克風」和「文字」兩種模式間切換,以提供語音或手動輸入。

🚀 使用方式

  1. 選擇輸入模式:
    • 「麥克風」:點擊錄音按鈕開始錄音,錄製完成後自動轉文字並判斷意圖。
    • 「文字」:直接在文字框中輸入語句,再點擊「執行辨識」按鈕。
  2. 從下拉選單選擇使用的模型(例如 ALBERT-tiny、ALBERT-base 或 Qwen)。
  3. 按下「執行辨識」後,系統將顯示轉換後的文字、意圖判斷結果,並以 TTS(語音合成)的方式回應。

🤗 使用模型

Whisper 語音辨識:

中文意圖分類模型:


📦 依賴環境

llama-cpp-python
gradio>=5.0.0
transformers
torch
soundfile
outlines
numpy>=1.24,<2.0
kokoro
huggingface-hub
jieba
docopt
ordered-set
cn2an
pypinyin
sentencepiece

🛠️ 開發者備註

  • 本應用現改為 Gradio App,適合在 Hugging Face Spaces 上部署,並支援 Gradio V5 的最新功能。
  • 採用雙重輸入模式(麥克風與文字)讓使用者能靈活切換輸入方式。
  • 若需延伸本系統至其他語言或多輪對話,歡迎 fork 本專案進行改造!

© 2024 by Luigi. Made with ❤️ using Hugging Face + Gradio.