cortex-hub/ai-hub/app/api/routes/stt.py at 24ae73dec91658179ea38e5c477d36ecc5b47263

Fork: 0
yangyangxie / cortex-hub
Find file
Newer
Older
cortex-hub / ai-hub / app / api / routes / stt.py
Antigravity AI 23 hours ago 4 KB fix: implement system-settings fallback in STT/TTS routes and resolve missing key 500 error
Raw Blame History
import logging
from fastapi import APIRouter, HTTPException, UploadFile, File, Depends
from sqlalchemy.orm import Session
from app.api.dependencies import ServiceContainer, get_db
from app.api.routes.user import get_current_user_id
from app.api import schemas
from app.core.services.stt import STTService

# Configure logging
logger = logging.getLogger(__name__)

def create_stt_router(services: ServiceContainer) -> APIRouter:
    """
    Creates and configures the API router for Speech-to-Text (STT) functionality.
    """
    router = APIRouter(prefix="/stt", tags=["STT"])

    @router.post(
        "/transcribe",
        summary="Transcribe audio to text",
        response_description="The transcribed text from the audio file.",
        response_model=schemas.STTResponse
    )
    async def transcribe_audio_to_text(
        audio_file: UploadFile = File(...),
        provider_name: str | None = None,
        db: Session = Depends(get_db),
        user_id: str = Depends(get_current_user_id)
    ):
        """
        Transcribes an uploaded audio file into text using the configured STT service.

        The audio file is expected to be a common audio format like WAV or MP3,
        though the specific provider implementation will determine supported formats.
        """
        logger.info(f"Received transcription request for file: {audio_file.filename}")

        if not audio_file.content_type.startswith("audio/"):
            logger.warning(f"Invalid file type uploaded: {audio_file.content_type}")
            raise HTTPException(
                status_code=415,
                detail="Unsupported media type. Please upload an audio file."
            )

        try:
            # Read the audio bytes from the uploaded file
            audio_bytes = await audio_file.read()

            # Resolve provider: User Prefs > Global Settings
            prefs = {}
            system_prefs = services.user_service.get_system_settings(db)
            if user_id:
                user = services.user_service.get_user_by_id(db=db, user_id=user_id)
                if user and user.preferences:
                    prefs = user.preferences.get("stt", {})
            
            from app.config import settings
            active_provider = provider_name or prefs.get("active_provider") or system_prefs.get("stt", {}).get("active_provider") or settings.STT_PROVIDER
            active_prefs = prefs.get("providers", {}).get(active_provider, {})
            
            # --- Fallback to System Settings if personal key is missing ---
            if not active_prefs or not active_prefs.get("api_key") or "*" in str(active_prefs.get("api_key")):
                system_provider_prefs = system_prefs.get("stt", {}).get("providers", {}).get(active_provider, {})
                if system_provider_prefs:
                    # Merge but prioritize system key if personal is masked/empty
                    merged = system_provider_prefs.copy()
                    if active_prefs: merged.update({k: v for k, v in active_prefs.items() if v})
                    active_prefs = merged

            logger.info(f"Resolving STT. user_id={user_id}, provider={active_provider}")
            
            from app.core.providers.factory import get_stt_provider
            kwargs = {k: v for k, v in active_prefs.items() if k not in ["api_key", "model"]}
            provider_override = get_stt_provider(
                provider_name=active_provider,
                api_key=active_prefs.get("api_key"),
                model_name=active_prefs.get("model", ""),
                **kwargs
            )
            
            logger.info(f"Using STT provider: {type(provider_override).__name__}")
            
            # Use the STT service to get the transcript
            transcript = await services.stt_service.transcribe(
                audio_bytes, 
                provider_override=provider_override
            )
            
            # Return the transcript in a simple JSON response
            return schemas.STTResponse(transcript=transcript)

        except HTTPException:
            # Re-raise Fast API exceptions so they're handled correctly
            raise
        except Exception as e:
            logger.error(f"Failed to transcribe audio file: {e}")
            raise HTTPException(
                status_code=500, detail=f"Failed to transcribe audio: {e}"
            ) from e
    
    return router