Spaces:

konieshadow
/

podcast-transcriber

Running

konieshadow commited on May 27

Commit

7803eb5

1 Parent(s): 6b9b193

优化spaces兼容

Files changed (6) hide show

README.md CHANGED Viewed

@@ -4,7 +4,6 @@ emoji: 📊
 colorFrom: blue
 colorTo: purple
 sdk: gradio
-python_version: 3.12
 sdk_version: 5.30.0
 app_file: app.py
 pinned: false

 colorFrom: blue
 colorTo: purple
 sdk: gradio
 sdk_version: 5.30.0
 app_file: app.py
 pinned: false

environment.yaml ADDED Viewed

+name: podcast_transcriber_env
+channels:
+  - defaults
+dependencies:
+  - python=3.10.13
+  - pip
+  - packaging

requirements.txt CHANGED Viewed

@@ -2,12 +2,13 @@ pydub>=0.25.1
 numpy>=2.2.5
 pyannote.audio>=3.3.2
 transformers>=4.51.3
-torch>=2.5.1
-torchaudio>=2.5.1
 soundfile>=0.13.1
 feedparser>=6.0.11
 requests>=2.32.3
 gradio>=5.30.0
 # 可选依赖 - whisper.cpp 绑定
 pywhispercpp>=1.3.0
@@ -17,5 +18,5 @@ accelerate>=1.6.0
 # MLX特定依赖 - 仅适用于Apple Silicon Mac
 # mlx>=0.25.2
 # mlx-lm>=0.24.0
-# parakeet-mlx=0.2.6
-# mlx-whisper=0.4.2

 numpy>=2.2.5
 pyannote.audio>=3.3.2
 transformers>=4.51.3
+torch==2.5.1
+torchaudio==2.5.1
 soundfile>=0.13.1
 feedparser>=6.0.11
 requests>=2.32.3
 gradio>=5.30.0
+spaces>=0.36.0
 # 可选依赖 - whisper.cpp 绑定
 pywhispercpp>=1.3.0
 # MLX特定依赖 - 仅适用于Apple Silicon Mac
 # mlx>=0.25.2
 # mlx-lm>=0.24.0
+# parakeet-mlx>=0.2.6
+# mlx-whisper>=0.4.2

src/podcast_transcribe/asr/asr_router.py CHANGED Viewed

@@ -6,6 +6,7 @@ ASR模型调用路由器
 import logging
 from typing import Dict, Any, Optional, Callable
 from pydub import AudioSegment
 from .asr_base import TranscriptionResult
 from . import asr_parakeet_mlx
 from . import asr_distil_whisper_mlx
@@ -195,7 +196,7 @@ class ASRRouter:
 # 创建全局路由器实例
 _router = ASRRouter()
 def transcribe_audio(
     audio_segment: AudioSegment,
     provider: str = "distil_whisper_transformers",

 import logging
 from typing import Dict, Any, Optional, Callable
 from pydub import AudioSegment
+import spaces
 from .asr_base import TranscriptionResult
 from . import asr_parakeet_mlx
 from . import asr_distil_whisper_mlx
 # 创建全局路由器实例
 _router = ASRRouter()
+@spaces.GPU(duration=180)
 def transcribe_audio(
     audio_segment: AudioSegment,
     provider: str = "distil_whisper_transformers",

src/podcast_transcribe/diarization/diarizer_router.py CHANGED Viewed

@@ -6,6 +6,7 @@
 import logging
 from typing import Dict, Any, Optional, Callable
 from pydub import AudioSegment
 from ..schemas import DiarizationResult
 from . import diarization_pyannote_mlx
 from . import diarization_pyannote_transformers
@@ -185,7 +186,7 @@ class DiarizerRouter:
 # 创建全局路由器实例
 _router = DiarizerRouter()
 def diarize_audio(
     audio_segment: AudioSegment,
     provider: str = "pyannote_mlx",

 import logging
 from typing import Dict, Any, Optional, Callable
 from pydub import AudioSegment
+import spaces
 from ..schemas import DiarizationResult
 from . import diarization_pyannote_mlx
 from . import diarization_pyannote_transformers
 # 创建全局路由器实例
 _router = DiarizerRouter()
+@spaces.GPU(duration=180)
 def diarize_audio(
     audio_segment: AudioSegment,
     provider: str = "pyannote_mlx",

src/podcast_transcribe/llm/llm_router.py CHANGED Viewed

@@ -5,6 +5,8 @@ LLM模型调用路由器
 import logging
 from typing import Dict, Any, Optional, List, Union
 from .llm_base import BaseChatCompletion
 from . import llm_gemma_mlx
 from . import llm_gemma_transfomers
@@ -367,7 +369,7 @@ class LLMRouter:
 # 创建全局路由器实例
 _router = LLMRouter()
 def chat_completion(
     messages: List[Dict[str, str]],
     provider: str = "gemma-mlx",
@@ -461,7 +463,7 @@ def chat_completion(
         **params
     )
 def reasoning_completion(
     messages: List[Dict[str, str]],
     provider: str = "phi4-transformers",

 import logging
 from typing import Dict, Any, Optional, List, Union
+import spaces
 from .llm_base import BaseChatCompletion
 from . import llm_gemma_mlx
 from . import llm_gemma_transfomers
 # 创建全局路由器实例
 _router = LLMRouter()
+@spaces.GPU(duration=60)
 def chat_completion(
     messages: List[Dict[str, str]],
     provider: str = "gemma-mlx",
         **params
     )
+@spaces.GPU(duration=60)
 def reasoning_completion(
     messages: List[Dict[str, str]],
     provider: str = "phi4-transformers",