Speech-to-Text API

Production-Speech-to-Text auf Deepgram Nova, in der EU gehostet.

Transkribiere Echtzeit- und aufgenommenes Audio über eine API auf Deepgram Nova-2 und Nova-3, betrieben mit erneuerbarer Energie in Europa.

Über 40 Sprachen, Sprechererkennung, smarte Formatierung und Wort-Zeitstempel, auf derselben EU-gehosteten, Privacy-first-Grundlage wie der Rest von GreenPT.

Create an account 14-day free trial Jump to the comparison

Warum GreenPT

Sprachfunktionen, ohne Europa zu verlassen.

Die meisten Transkriptions-APIs leiten dein Audio über globale Pipelines mit US-Fallback. GreenPT betreibt Deepgram Nova vollständig auf europäischer Infrastruktur mit erneuerbarer Energie, und behält dein Audio nicht.

Deepgram Nova-2 und Nova-3, Modell und Modus pro Anfrage wählbar.
Echtzeit über WebSocket und Batch für aufgenommene Dateien, eine API.
Über 40 Sprachen, Nova-3 wechselt mehrsprachig mitten im Satz.
Sprechererkennung, smarte Formatierung und Wort-Zeitstempel inklusive.
In der EU verarbeitet, nicht gespeichert, nie zum Training verwendet.
Mit erneuerbarer Energie betrieben und DSGVO-konform.

API-Funktionen

Alles, was der Transkriptions-Endpunkt kann.

Echtzeit-Streaming

Stream Audio über WebSocket und erhalte Teil- und Endtranskripte mit geringer Latenz, gebaut für Live-Untertitel und Voice-Agents.
Batch-Transkription

Sende aufgenommene Dateien an dieselbe API für durchsatzstarke, asynchrone Verarbeitung. Eine Integration deckt beide Modi ab.
Sprechererkennung

Beschrifte, wer was gesagt hat, über das ganze Gespräch, eingebaut. Kein separates Modell, keine extra Anfrage.
Smarte Formatierung

Lesbare Ausgabe von Haus aus: Satzzeichen, Großschreibung, Zahlen, Datums- und Währungsangaben, wie Menschen sie schreiben.
Keyterm-Prompting

Stärke die Erkennung von Namen, Produkten und Fachbegriffen, indem du Schlüsselbegriffe pro Anfrage mitgibst. Kein Retraining, sofort wirksam.
PII-Schwärzung

Erkenne und schwärze personenbezogene Daten im Transkript, damit Sensibles nie in deinem Speicher landet.
Mehrkanal

Transkribiere jeden Audiokanal separat, ideal für zweiseitige Telefonate und Stereoaufnahmen.
Entitätserkennung

Hol strukturierte Entitäten wie Personen, Orte und Beträge aus dem Audio, bereit für nachgelagerte Logik.
Wort-Zeitstempel

Jedes Wort trägt Start- und Endzeit und einen Konfidenzwert, sodass du präzise ausrichten, suchen und bearbeiten kannst.

Leistungskennzahlen

Die Rechenzentren von GreenPT erreichen einen PUE von 1,25 (Branchenschnitt 1,55) und einen WUE von 0,25 (Branchenschnitt 1,8), also deutlich höhere Energie- und Wassereffizienz. Der Strom stammt zu 100% aus erneuerbaren Quellen, gegenüber den branchenüblichen 60%.

1,25 PUE Branchenschnitt 1,55
0,25 WUE Branchenschnitt 1,8
100% Grüner Strom Branchenschnitt 60%

↳ Quelle: Scaleway Impact Report 2025

Der Unterschied

Liefere Sprachfunktionen, ohne Europa zu verlassen .

Hol dir einen API-Schlüssel und transkribiere auf Deepgram Nova-2 und Nova-3, in der EU mit erneuerbarer Energie gehostet. Echtzeit und Batch, 40+ Sprachen, Privacy-first.

Konto erstellen 14 Tage kostenlos (opens in a new tab)

Keine Kreditkarte nötig.

100% erneuerbar
EU-gehostet
DSGVO-konform

Sprachfunktionen, ohne Europa zu verlassen.

Echtzeit-Streaming

Batch-Transkription

Sprechererkennung

Smarte Formatierung

Keyterm-Prompting

PII-Schwärzung

Mehrkanal

Entitätserkennung

Wort-Zeitstempel

Liefere Sprachfunktionen, ohne Europa zu verlassen .