Dokumente rein.
Daten raus.
Rohdaten werden zu strukturierten Daten.
Scans, Fotos und PDFs automatisch verarbeiten — als Markdown, Word, JSON, CSV, mit automatischer Dokumentklassifizierung oder direkt befragen.
Wo Pixel zu Wissen werden.
{
"jobId": "a3f8c2d1-...",
"status": "DONE",
"result": {
"documentType": "Rechnung",
"processedPages": 1,
"fields": [{
"key": "betrag",
"label": "Rechnungsbetrag",
"value": "1234.50",
"confidence": 0.97,
"boundingBox": {
"page": 1, "x": 142, "y": 380,
"width": 195, "height": 24,
"unit": "px"
},
"image": "data:image/png;base64,iVBORw0KGgo..."
}]
}
}Beispiel — Feldextraktion aus einer gescannten Rechnung
Features
Sechs Modi — ein Ergebnis
Von der unleserlichen Seite zum strukturierten, weiterverwendbaren Format — wählen Sie was passt oder nutzen Sie alle sechs.
Dokument-Extraktion
Wandeln Sie gescannte Seiten, Fotos oder PDFs in sauber strukturierten Text um — mit Überschriften, Listen und Tabellen, direkt als Markdown oder Word-Dokument. Ideal für Archivierung, Volltextsuche und Weiterbearbeitung.
- Vollständige Textextraktion aus Scans & Bildern
- Automatische Struktur: Überschriften, Listen, Tabellen
- Multi-Page PDF — Seite für Seite
- Export als Markdown (.md) oder Word (.docx)
Feldextraktion (Key/Value)
Definieren Sie Felder wie «Rechnungsbetrag», «IBAN» oder «Datum» — die KI lokalisiert sie im Scan, liefert den Wert, die genaue Position im Dokument und einen Bildausschnitt zur Verifikation.
- Präzise Bounding Boxes (Koordinaten & Seite)
- Confidence Score pro extrahiertem Feld
- Bildausschnitt je Feld für manuelle Prüfung
- Export als JSON oder CSV
Klassifizierung
Definieren Sie Kategorien wie «Rechnung», «Vertrag» oder «Lieferschein» — die Engine bestimmt automatisch, zu welcher Klasse das Dokument gehört und liefert Konfidenzwerte für jede Kategorie.
- Eigene Klassen frei definierbar
- Konfidenzwert pro Klasse
- Mindestschwelle (Threshold) einstellbar
- Ideal für automatische Dokumentensortierung
Dokument befragen
Stellen Sie dem Dokument direkt eine Frage — die KI liest den Inhalt und liefert eine präzise Antwort. Ideal für schnelle Informationssuche in Verträgen, Berichten oder Formularen.
- Freitext-Frage in natürlicher Sprache
- Antwort basierend ausschliesslich auf dem Dokument
- Unterstützt Scans, Fotos und PDFs
- Prompt-Injection-Schutz integriert
Daten Konvertierung
Konvertieren Sie strukturierte Daten zwischen Formaten — Input als JSON, XML, CSV oder beliebiger Text, Output nach XSD, JSON Schema oder CSV-Spaltendefinition. Das Mapping erfolgt automatisch per KI anhand der Benennung.
- Input: JSON, XML, CSV oder Freitext
- Output: XML, JSON oder CSV
- Schema via XSD, JSON Schema oder CSV-Spalten
- Enum-Mapping mit Beschreibungen (xs:documentation)
Text Korrektur
Korrigieren Sie OCR-Fehler, Rechtschreibung und Grammatik automatisch — die KI bereinigt den extrahierten Text, ohne den Inhalt zu verändern. Ideal als Nachbearbeitungsschritt für maschinell erkannte Texte.
- OCR-typische Zeichenfehler automatisch bereinigen
- Rechtschreibung & Grammatik korrigieren
- Inhalt und Struktur bleiben erhalten
- Unterstützt Deutsch, Französisch, Italienisch, Englisch
Workflow
In vier Schritten zu Ihren Daten
Registrieren
Kostenloses Konto erstellen in unter 30 Sekunden.
Datei hochladen
Scan, Foto oder PDF — via Drag & Drop oder Dateiauswahl.
KI verarbeitet
OCR-Engine + LLM extrahiert Text asynchron im Hintergrund.
Daten verwenden
Markdown, Word, JSON oder CSV — sofort in Ihrer Applikation einsetzbar.
Praxisbeispiele
Zwei konkrete Anwendungsfälle
Wie Unternehmen datawork.dev heute einsetzen — vollständig automatisiert, DSG-konform.
Use Case 1
Automatische Rechnungsverarbeitung
Ein KMU erhält täglich Lieferantenrechnungen per E-Mail als PDF. Bisher wurden Betrag, IBAN und Rechnungsdatum manuell im ERP erfasst — zeitaufwändig und fehleranfällig.
Use Case 2
Lohnausweis-Prüfung für Kreditanträge
Ein Finanzdienstleister prüft Kreditanträge und benötigt strukturierte Einkommensdaten aus eingereichten Lohnausweisen. Bisher wurden Scans manuell ausgelesen — jetzt vollautomatisch.
Datensouveränität
Ihre Daten bleiben,
wo sie hingehören.
Jeder Byte Ihrer Dokumente wird ausschliesslich auf Schweizer Servern verarbeitet — niemals in der EU, niemals in den USA. Hosting und KI-Verarbeitung erfolgen durch in der Schweiz domizilierte Anbieter, die dem Schweizer Datenschutzrecht unterstellt sind.
Schweizer Rechenzentrum
Hosting ausschliesslich in der Schweiz — durch einen ISO-zertifizierten Schweizer Anbieter.
Ende-zu-Ende Verschlüsselung
TLS 1.3 für alle Übertragungen. Daten at rest verschlüsselt.
Datenschutzkonforme Infrastruktur
Beide Infrastruktur-Anbieter — Hosting und KI — sind in der Schweiz domiziliert und datenschutzkonform.
Kein KI-Training, keine Logs
Ihre Dokumente werden nie für KI-Training verwendet. Der KI-Anbieter speichert keinerlei Anfragen.
Schweizer Datenhoheit
Garantiert — Keine Ausnahmen
Integration & Support
Bestehende Systeme
nahtlos einbinden.
datawork.dev lässt sich über die REST API in jede bestehende Infrastruktur integrieren — ob ERP, DMS, Buchhaltungssoftware oder eigene Applikation. Wir helfen Ihnen dabei, die Lösung passend einzubinden.
Manuelle Prozesse digitalisieren
Rechnungen, Formulare, Lieferscheine — automatisch erfassen statt manuell abtippen.
REST API & Webhooks
Dokumentverarbeitung direkt in Ihre Applikation einbinden — asynchron, skalierbar.
ERP & DMS Integration
Anbindung an SAP, Abacus, DocuWare, SharePoint oder eigene Systeme.
JSON & CSV Output
Strukturierte Ausgabe, die direkt in Datenbanken oder Workflows fliesst.
Schweizer Datenschutz
Alle Daten verbleiben in der Schweiz — DSG-konform, ohne Ausnahmen.
Kontakt aufnehmen
Wir antworten innerhalb von 24 Stunden.
Technologie-Stack
OCR Engine
Text-Erkennung
LLM
Strukturierung
JWT Auth
Sicherheit
Async Jobs
Skalierbarkeit
REST API
Integration
CH Hosting
Datenschutz
FAQ
Häufige Fragen
Was ist OCR und wie funktioniert datawork.dev? +
OCR (Optical Character Recognition) erkennt Text in Bildern, Scans und PDFs automatisch. datawork.dev kombiniert OCR mit KI, um Dokumente vollständig zu extrahieren, Felder zu erkennen und Dokumente zu klassifizieren — alles über eine REST API.
Ist datawork.dev DSG- und datenschutzkonform? +
Ja. Hosting und KI-Verarbeitung erfolgen ausschliesslich durch in der Schweiz domizilierte Anbieter. Ihre Dokumente verlassen nie die Schweiz. Die Plattform ist konform mit dem Schweizer Datenschutzgesetz (DSG). Es werden keine Daten für KI-Training verwendet.
Wie viel kostet die OCR API? +
datawork.dev ist Pay-as-you-go: CHF 0.15 pro verarbeitete Seite oder Bild. Die Registrierung ist kostenlos — keine Kreditkarte erforderlich. Sie laden Guthaben auf und bezahlen nur was Sie nutzen.
Welche Dokumenttypen werden unterstützt? +
PDFs (mehrseitig), JPG, PNG und weitere Bildformate. Scans, Fotos von Dokumenten, Rechnungen, Verträge, Formulare und Lieferscheine werden zuverlässig erkannt — auch bei schlechter Bildqualität.
Gibt es eine REST API für die Dokumentenverarbeitung? +
Ja, datawork.dev bietet eine vollständige REST API mit asynchroner Verarbeitung. Dokumente werden per Multipart-Upload hochgeladen, im Hintergrund verarbeitet und das Ergebnis (JSON, CSV, Markdown) per Polling abgeholt. Ideal für ERP-, DMS- und eigene App-Integrationen.
Kann ich Rechnungen automatisch verarbeiten? +
Ja. Mit der Feldextraktion definieren Sie Felder wie «Rechnungsbetrag», «IBAN» oder «Datum» — die KI lokalisiert die Werte im Scan, liefert Koordinaten (Bounding Boxes) und einen Bildausschnitt zur Verifikation. Ausgabe als JSON oder CSV.
Bereit, Dokumente in Daten zu verwandeln?
datawork.dev
Starten Sie kostenlos. Keine Kreditkarte erforderlich. Dokumente rein — strukturierte Daten raus. Ihre Daten bleiben in der Schweiz.