ZU DEN PARTNERN
Seit 25 Jahren ist Paradatec ausschließlich auf die Analyse von Dokumenten, deren OCR, Klassifikation und Datenextraktion spezialisiert. Lösungen der PARADATEC werden i.d.R. in unternehmenskritischen Anwendungen für komplexe Anforderungen bei extrem hohen Dokumentendurchsätzen und für höchste Genauigkeit eingesetzt. Diese Lösungen bilden das Kernelement des Tagesgeschäfts Posteingang und Leistungsabrechnung in Versicherungen, Beihilfestellen und Banken.
SINC ist der führende Anbieter für rechtsinformatische Lösungen im deutschsprachigen Raum. Mit einem großen interdisziplinären Team aus Informatikern und Juristen bietet SINC Lösungen um die Analyse rechtlicher Texte und die Automation von Rechtstexten und sonstigen Regeln.
ERFAHRUNG IM JUSTIZBEREICH
Paradatec und SINC sind mit der Erstellung der Grundbuchanalysekomponente im Rahmen der Erstellung eines bundeseinheitlichen Datenbankgrundbuchs betraut. Eine Umgebung für PROSAR-AIDA von PARADATEC muss daher in nahezu jedem Rechenzentrum der Justiz zukünftig ohnehin betrieben werden. Mitarbeiter von SINC und PARADATEC sind bereits von der Justiz nach VerpflG verpflichtet und Sicherheitsüberprüfungen in vielen Rechenzentren der öffentlichen Hand unterzogen worden.
1
SCANNEN NACH DER TR-RESISCAN
TECHNISCHE UND ORGANISATORISCHE LÖSUNG
Scannen nach der TR-RESISCAN ist nicht nur eine technische, sondern v.a. auch eine organisatorische Herausforderung. Die Lösung von SINC auf Basis von Komponenten von Kodak und Scanfabrik bietet daher nicht nur technische Lösungsbausteine, sondern auch die Unterstützung der Mitarbeiter durch eine ergonomische Prozessführung.
INTEGRIERTE OBERFLÄCHEN
Die barrierefreie und ergonomische Handhabung der Scan-Clients aus dem Hause Scanfabrik ermöglicht die Bedienung des Scanners sowie die Durchführung des gesamten Scanprozesses incl. Signatur und Qualitätsprüfung unmittelbar am Gerät. Bei einigen Geräten ist die gesamte Anwendung für TR-RESISCAN sogar physisch in den Scanner integriert (RESISCAN embedded).
2
EXTRAKTION VON METADATEN
AUS EINGEHENDEN DOKUMENTEN
SINC und Paradatec bieten keine übliche Posteingangsverarbeitung, wie sie aus der Rechnungsbearbeitung bekannt ist, sondern eine spezialisierte Extraktionslösung für die bundesdeutsche Justiz. Dabei wird das Hauptaugenmerk auf die Extraktion derjenigen Daten gelegt, die für eine automatisierte Weiterverarbeitung in den nachfolgenden Fachsystemen notwendig und sinnvoll sind. Wo bereits begleitend Metadaten übersandt wurden, etwa im XJustiz-Format, sollen diese anhand einer Analyse der Dokumente überprüft werden können.
NACHVOLLZIEHBARE ERKENNUNG: REGELBASIERTE VERARBEITUNG
MIT AI-ELEMENTEN
Jedes Klassifikations- und Extraktionsergebnis der Paradatec Technologie ist nachvollziehbar (wiederholbar), durch das ResComp Tool detailliert analysierbar und damit effizient zu optimieren. Andere „selbstlernende“ Verfahren am Markt verändern durch jeden verarbeiteten Beleg den Trainingszustand des Systems und verhindern spätere Nachvollziehbarkeit von Ergebnissen (Revision).
MEHRFACH-OCR MIT AUF DAS JEWEILIGE DOKUMENT/METADATUM OPTIMIERTEN PARAMETERN
Paradatec Technologie ermöglicht es, für Teile eines jeden Dokuments die jeweils optimale Parametrisierung der OCR zu finden und zu verwenden. Dabei wird ein Scan ggf. mehrfach der OCR unterzogen und die Ergebnisse zu einem optimierten Gesamtergebnis verdichtet.
NUTZUNG VON KATALOGEN IN DER OCR
Kontextinformationen (Formatangaben, Lexika, etc.) werden direkt in der OCR Erkennung berücksichtigt, um optimale Erkennungsergebnisse zu erzielen. Paradatec geht davon aus, dass dies nur mit einer eigenen OCR effektiv zu leisten ist. Paradatec setzt auf ein permanentes Zusammenspiel zwischen Analyseschritten und der OCR, um Freiform‑, zonale oder revolvierende OCR mit vorher ermittelten Zwischenergebnissen durchführen zu können.
HIERARCHISCHE KLASSIFIKATION
Paradatec ermöglicht nicht nur die Klassifikation von ganzen Dokumenten, sondern auch parallel die Klassifikation einer ganzen Sendung, der enthaltenen Dokumente und sogar einzelner Seiten. So können auch Fehler bei der Dokumenttrennung im Rahmen des Scannens behoben werden.
KONFIGURIERBARE UND WEITERENTWICKELBARE LÖSUNG
Trotz einer schlüsselfertigen Komplettlösung je Fachgerichtsbarkeit ist für die Justiz fortlaufende Erweiterbarkeit der Lösung durch SINC als Integrator wie auch durch die Justiz selbst sichergestellt – bei vollem Erhalt der Wartungsleistung. Möglich wird dies durch Trennung der Erkennungslogik in Basisregelwerk (wird geliefert und gewartet) und Individualregelwerk (in der Verantwortung der Justiz).
GRAFISCHE OBERFLÄCHE ZUR KONFIGURATION
Bedienung und Administration der Lösung sind vollständig anhand einer grafischen Oberfläche möglich. Weder Programmierung noch Scripting sind erforderlich. Daher können die Fachbereiche die IT inhaltlich unterstützen bzw. geeignete Teile in eigener Verantwortung pflegen und erweitern. Diese Architektur eröffnete der Justiz organisatorische Möglichkeiten / Definition von Verantwortlichkeiten, wie es keine andere Erkennungslösung am Markt derzeit vermag.
KONFIGURIERBARE ERKENNUNGSSTUFEN
Der Anwender kann bei einer Paradatec-Lösung sogar die Aufteilung in unterschiedliche Erkennungsstufen grafisch konfigurieren. So können Erkennungsergebnisse aus einer Stufe zunächst manuell qualitätsgesichert und auf dieser gesicherten Ebene weitere Erkennungen durchgeführt werden.
OPTIMIERTER CLIENT FÜR DIE MANUELLE NACHKORREKTUR
Paradatec Technologie ist auch optimiert hinsichtlich manueller Erfassungsleistung. Beispielsweise kann das System vollständig per Tastatur bedient werden, eine Maus ist nicht notwendig. Diverse Projekte über viele Jahre sind Grundlage für ermüdungsfreie, genaue und schnelle Datenerfassung. Die eingesparte Erfassungszeit schafft Raum für inhaltliche Prüfung der Daten.
ERKENNUNG VON GESCHACHTELTEN TABELLEN UND TABELLEN ÜBER SEITENGRENZEN HINWEG
Paradatec unterstützt nicht nur einfache Tabellen, sondern auch geschachtelte Tabellenstrukturen und die Erkennung mehrseitiger Tabellen. Auch eine automatisierte Erkennung von small claims-Formularen oder Architektenrechnungen in Bauprozessen ist so möglich.
DYNAMISCHE SCHWÄRZUNG VON DOKUMENTTEILEN FÜR AKTENEINSICHT ETC.
Für die Weitergabe von Dokumenten bedarf es teilweise der zuverlässigen Schwärzung von Dokumentteilen. Paradatec unterstützt mit dem Zusatzmodul PDRedact eine inhaltsabhängige Schwärzung, die auch mittels Analyse der Bild-Datei nicht rückgängig zu machen ist.
AUTOMATISCHE FILTERUNG VON BLIND- BZW. HINTERGRUNDFARBEN
Viele Formulare in Justizakten, etwa Postzustellungsurkunden oder Mahnbescheide, haben eine charakteristische Hintergrundfarbe, welche die Erkennung erschwert. Paradatec ermöglicht die dynamische Filterung solcher Hintergrundfarben abhängig von der erkannten Dokumentklasse, so dass keine manuelle Vorfilterung solcher Formulare im Rahmen des Scanprozesses notwendig ist.
BESTES ZEITVERHALTEN AM MARKT
Paradatec Technologie bietet am Markt die höchste Verarbeitungs-Performance. Das hält die Anforderungen an die Hardware im Betrieb niedrig, ältere Hardware muss nicht ständig aktualisiert werden. Außerdem minimieren sich dadurch die Betriebskosten, weil weniger Server für den Betrieb der Lösung erforderlich sind. Auch unter dem Aspekt „Green-IT“, d.h. geringer Ressourcen- und Energiebedarf, ist Paradatec Technologie zu bevorzugen. Die extrem hohe Performance basiert auf Jahrzehnte langer Erfahrung mit Produktionssystemen und ständiger technischer Optimierung – und geht NICHT auf Kosten der Genauigkeit!
FLEXIBLE LIZENSIERUNG
Die Lizenz für die Paradatec Technologie ist im Gegensatz zum marktüblichen Vorgehen NICHT an den Durchsatz, NICHT an eine erlaubte Anzahl Prozessoren und NICHT an eine Maximalzahl von Dokumentenklassen o.ä. Limits gebunden. Stattdessen wird die Lösung nutzengerecht angeboten in den Pilotländern nach der Anzahl extrahierter Felder und modular nach Fachgerichtsbarkeiten.
FERTIGES REGELWERK FÜR JEDE FACHGERICHTSBARKEIT
SINC liefert eine schlüsselfertige Lösung (Produkt, Regeln, Wartung und Implementierungsleistung) je Fachgerichtsbarkeit aus einer Hand.
3
OCR EINGEHENDER PDFS
Neben der zielgerichteten Extraktion von Metataden ermöglicht Paradatec PROSAR-AIDA auch die „klassiche“ OCR gescannter Dokumente, d.h. die Erzeugung von „searchable PDF/A“-Dokumenten.
4
VERIFIKATION BEGLEITENDER XJUSTIZ-DATENSÄTZE
Mit XJustiz übermittelte Metadaten treten in ihrer Rechtswirkung hinter die gleichzeitig übermittelten Dokumente zurück. Dies kann das Ziel der Justiz konterkarieren, durch die Übermittlung strukturierter Daten zu einer (Teil-)Automation der E‑Justice-Prozesse zu kommen. Die Posteingangslösung Justiz von SINC und Paradatec ermöglicht den Vergleich übermittelter Metadaten mit solchen, die durch Extraktion aus den übermittelten Dokumenten gewonnen wurden, und somit zumindest eine teilweise Verifikation der übermittelten Datensätze. Dieses Vorgehen ermöglicht eine Vollautomatisation oder „Dunkelverarbeitung“ bei bestätigten Datensätzen.
5
AUTOMATISIERTE GESCHÄFTSVERTEILUNG AUF BASIS NATÜRLICHSPRACHLICHER REGELWERKE
Oracle Policy Automation ist das einzige natürlichsprachliche Regelwerksprodukt in deutscher Sprache. Es ermöglicht die Definition komplexer Regeln wie etwa gerichtlicher Geschäftsverteilungspläne in einer Form, die ein Lesen ohne Programmierkenntnisse möglich macht. Die Posteingangslösung Justiz von SINC und Paradatec macht sich diese Fähigkeit zunutze, um auf Basis der extrahierten Metadaten eine möglichst weitgehende Automation der Geschäftsverteilung zu ermöglichen.
Ansprechpartner
Till Elborg
Geschäftsführer
Till.Elborg@sinc.de