cortex-hub/ai-hub/app/core/providers/stt/general.py at 993875569fc6d6e5db8b9865d6cbac2dffd6f5c6

Fork: 0

yangyangxie / cortex-hub

Find file

Newer

Older

cortex-hub / ai-hub / app / core / providers / stt / general.py

Antigravity AI 1 day ago 1 KB Refactor STT model selection to dropdown, add YAML config import/export, and refine Voice/Coding Assistant UI

Raw Blame History

import litellm
import io
from app.core.providers.base import STTProvider

class GeneralSTTProvider(STTProvider):
    """General Speech-to-Text provider using LiteLLM."""
    def __init__(self, model_name: str, api_key: str, **kwargs):
        self.model_name = model_name
        self.api_key = api_key
        self.kwargs = kwargs

    async def transcribe_audio(self, audio_data: bytes) -> str:
        """Transcribes audio data using LiteLLM atranscription."""
        try:
            # We must pass file-like object for the LiteLLM (OpenAI) underlying handler
            buffer = io.BytesIO(audio_data)
            buffer.name = "audio.wav"
            
            response = await litellm.atranscription(
                model=self.model_name,
                file=buffer,
                api_key=self.api_key,
                **self.kwargs
            )
            
            # Response object has 'text' for generic transcription
            return getattr(response, "text", "")
                
        except Exception as e:
            raise RuntimeError(f"Failed to transcribe audio with LiteLLM for model '{self.model_name}': {e}")