Skip to content
Luftaufnahme eines türkisfarbenen Sees am Rand eines dichten grünen Waldes.

Scraper API

Mach aus jeder Webseite sauberen, KI-fertigen Inhalt.

Ein API-Aufruf extrahiert den Inhalt jeder öffentlichen URL und gibt ihn als Markdown, HTML, rohes HTML oder Liste von Links zurück. JavaScript-Seiten werden gerendert, Werbung und Cookie-Banner entfernt, nur der Hauptinhalt.

Warum GreenPT

Ein Endpunkt zwischen jeder Webseite und deiner KI-Pipeline.

Scraping für KI heißt meist: einen Headless-Browser, einen Werbeblocker und einen Readability-Parser zusammenstecken und alle drei pflegen. Die Scraper API fasst das in einer einzigen Anfrage zusammen.

  • Jede öffentliche URL in einem POST-Aufruf zu strukturiertem Inhalt.

  • JavaScript-Seiten werden automatisch gerendert, kein eigenes Headless-Setup.

  • Werbung blockiert und Cookie-Banner entfernt, bevor extrahiert wird.

  • Nur der Hauptinhalt: Header, Navigation und Footer fallen weg.

  • Vier Ausgabeformate: Markdown, HTML, rohes HTML oder alle Links der Seite.

  • In der EU gehostet, mit derselben Privacy-Haltung wie die ganze Plattform.

Was Teams damit bauen

Fünf Wege, wie sich die Scraper API auszahlt.

  • RAG-Pipelines

    Wandle Seiten in sauberes Markdown, das direkt in einen Retrieval-Index passt, ohne den HTML-Müll, der Embeddings verunreinigt.

  • Trainingsdaten

    Sammle strukturierten Haupttext im großen Stil für Fine-Tuning und Evaluation, ohne für jede Seite einen Scraper zu schreiben.

  • Content-Monitoring

    Beobachte Wettbewerber- und Quellseiten auf Änderungen, ohne eigene Scraping-Infrastruktur aufzubauen.

  • Link-Erkennung

    Hol alle URLs einer Seite in einem Aufruf, für Crawling, Sitemaps oder SEO-Analyse.

  • Web-Archivierung

    Bewahre Seiten als beständiges Markdown oder HTML, das du speichern und durchsuchen kannst, statt brüchiger Screenshots.

  • Datenerhebung

    Extrahiere Seiteninhalt für Analyse, Reporting und Weiterverarbeitung, in einem Format, das deine Tools lesen.

Leistungskennzahlen

Die Rechenzentren von GreenPT erreichen einen PUE von 1,25 (Branchenschnitt 1,55) und einen WUE von 0,25 (Branchenschnitt 1,8), also deutlich höhere Energie- und Wassereffizienz. Der Strom stammt zu 100% aus erneuerbaren Quellen, gegenüber den branchenüblichen 60%.

  1. 1,25 PUE Branchenschnitt 1,55
  2. 0,25 WUE Branchenschnitt 1,8
  3. 100% Grüner Strom Branchenschnitt 60%
↳ Quelle: Scaleway Impact Report 2025

Der Unterschied

Bau auf der KI, die für Organisationen ohne Kompromisse gemacht ist.

Starte 14 Tage kostenlos, ohne Kreditkarte. In der EU gehostet ab der ersten Anfrage.

Keine Kreditkarte nötig.

  • 100% erneuerbar
  • EU-gehostet
  • DSGVO-konform