Skip to content

Speech-to-Text API

Production-Speech-to-Text auf Deepgram Nova, in der EU gehostet.

Transkribiere Echtzeit- und aufgenommenes Audio über eine API auf Deepgram Nova-2 und Nova-3, betrieben mit erneuerbarer Energie in Europa.

Über 40 Sprachen, Sprechererkennung, smarte Formatierung und Wort-Zeitstempel, auf derselben EU-gehosteten, Privacy-first-Grundlage wie der Rest von GreenPT.

Warum GreenPT

Sprachfunktionen, ohne Europa zu verlassen.

Die meisten Transkriptions-APIs leiten dein Audio über globale Pipelines mit US-Fallback. GreenPT betreibt Deepgram Nova vollständig auf europäischer Infrastruktur mit erneuerbarer Energie, und behält dein Audio nicht.

  • Deepgram Nova-2 und Nova-3, Modell und Modus pro Anfrage wählbar.

  • Echtzeit über WebSocket und Batch für aufgenommene Dateien, eine API.

  • Über 40 Sprachen, Nova-3 wechselt mehrsprachig mitten im Satz.

  • Sprechererkennung, smarte Formatierung und Wort-Zeitstempel inklusive.

  • In der EU verarbeitet, nicht gespeichert, nie zum Training verwendet.

  • Mit erneuerbarer Energie betrieben und DSGVO-konform.

API-Funktionen

Alles, was der Transkriptions-Endpunkt kann.

  • Echtzeit-Streaming

    Stream Audio über WebSocket und erhalte Teil- und Endtranskripte mit geringer Latenz, gebaut für Live-Untertitel und Voice-Agents.

  • Batch-Transkription

    Sende aufgenommene Dateien an dieselbe API für durchsatzstarke, asynchrone Verarbeitung. Eine Integration deckt beide Modi ab.

  • Sprechererkennung

    Beschrifte, wer was gesagt hat, über das ganze Gespräch, eingebaut. Kein separates Modell, keine extra Anfrage.

  • Smarte Formatierung

    Lesbare Ausgabe von Haus aus: Satzzeichen, Großschreibung, Zahlen, Datums- und Währungsangaben, wie Menschen sie schreiben.

  • Keyterm-Prompting

    Stärke die Erkennung von Namen, Produkten und Fachbegriffen, indem du Schlüsselbegriffe pro Anfrage mitgibst. Kein Retraining, sofort wirksam.

  • PII-Schwärzung

    Erkenne und schwärze personenbezogene Daten im Transkript, damit Sensibles nie in deinem Speicher landet.

  • Mehrkanal

    Transkribiere jeden Audiokanal separat, ideal für zweiseitige Telefonate und Stereoaufnahmen.

  • Entitätserkennung

    Hol strukturierte Entitäten wie Personen, Orte und Beträge aus dem Audio, bereit für nachgelagerte Logik.

  • Wort-Zeitstempel

    Jedes Wort trägt Start- und Endzeit und einen Konfidenzwert, sodass du präzise ausrichten, suchen und bearbeiten kannst.

Leistungskennzahlen

Die Rechenzentren von GreenPT erreichen einen PUE von 1,25 (Branchenschnitt 1,55) und einen WUE von 0,25 (Branchenschnitt 1,8), also deutlich höhere Energie- und Wassereffizienz. Der Strom stammt zu 100% aus erneuerbaren Quellen, gegenüber den branchenüblichen 60%.

  1. 1,25 PUE Branchenschnitt 1,55
  2. 0,25 WUE Branchenschnitt 1,8
  3. 100% Grüner Strom Branchenschnitt 60%
↳ Quelle: Scaleway Impact Report 2025

Der Unterschied

Liefere Sprachfunktionen, ohne Europa zu verlassen .

Hol dir einen API-Schlüssel und transkribiere auf Deepgram Nova-2 und Nova-3, in der EU mit erneuerbarer Energie gehostet. Echtzeit und Batch, 40+ Sprachen, Privacy-first.

Keine Kreditkarte nötig.

  • 100% erneuerbar
  • EU-gehostet
  • DSGVO-konform