Ovidius extrahiert Daten aus alten PDF-Files

Damit Unternehmen, die viel Dokumentenmanagement machen müssen, Zeit sparen, hat sich der Berliner Lösungsanbieter Ovidius etwas ausgedacht – die Software ‘PDF-Extraktor’.

Damit Unternehmen, die viel Dokumentenmanagement machen müssen, Zeit sparen, hat sich der Berliner Lösungsanbieter Ovidius etwas ausgedacht. Die Software ‘PDF-Extraktor’ soll dafür geeignet sein, die Ablage und Verwaltung speziell auch von alten PDF-Formaten zu erleichtern, ohne dass die Extraktion mit dem manuellen Verfahren per Copy & Paste erfolgen muss.

Wie das Unternehmen mitteilt, werde dabei reines XML-Format erzeugt, das sich zukunftssicher weiter verarbeiten und lagern lasse. Das Programm erkennt Texte, Tabellen und andere Textformate und konvertiert diese wahlweise in Word oder eben in XML. In einem ersten Schritt werden die XML-Rohdaten aus dem PDF-Dokument gezogen und analysiert. Am Ende des Konvertierungsprozesses stehen die Daten im XML-basierten ‘PX-ML’-Format (PDF Extraktor Markup Language) zur Verfügung. Diese können problemlos von gängigen XML-Programmen und -Editoren verarbeitet werden. Ebenso sei es möglich, die Daten beispielsweise für Microsoft Word, Excel oder FrameMaker bereitzustellen.

So verbreitet und beliebt PDF gerade in kleineren und mittelständischen Unternehmen aus Kostengründen auch ist – die Weiterverarbeitung gestaltet sich gerade bei älteren Softwareversionen oftmals schwierig, gibt der Anbieter zu bedenken. Häufig seien die Quellen nicht mehr verfügbar oder nicht mehr nutzbar, und selbst der Export einfacher Texte aus dem PDF-Reader bereitet Probleme. Der automatisierte Prozess, den die Berliner bieten, soll die Daten aus der PDF-Sackgasse befreien und wieder bei Bedarf veränderbar machen. Ovidius bietet die Lösung als Dienstleistung an. Kunden, die solche Extraktionen aus PDF häufiger machen müssen, können die Lösung jedoch auch kaufen, heißt es.