Phase 2: Lokale Sprachsynthese mit Supertonic-3

Problemstellung

Neben der Textgenerierung sollte auch eine vollständig lokale Sprachsynthese ermöglicht werden.

Dabei traten insbesondere bei der Integration verschiedener OpenAI-kompatibler Clients zahlreiche Kompatibilitätsprobleme auf.

Read Aloud
      │
      ▼
OpenAI-kompatibler Proxy
      │
      ▼
Supertonic-3
      │
      ▼
Lokale Sprachsynthese

Der Proxy übernimmt:

Unter anderem:

/v1/models
/v1/audio/speech

Automatische Anpassung zwischen:

Gelöst wurden unter anderem:

Es entstand eine vollständig lokale, OpenAI-kompatible Sprachsyntheseplattform.