Websites

Able2Extract Konvertiert PDFs in besser nutzbare Formate

OCRKit converts images into searchable PDF files

OCRKit converts images into searchable PDF files
Anonim

Wenn Sie Ich musste schon mal den Text aus einem Adobe PDF-Dokument ziehen, Sie wissen, wie frustrierend es sein kann. Das praktisch universelle Dateiformat macht es nicht gerade einfach, Text aus einem Dokument wiederzuverwenden und in ein anderes Dokument einzufügen. Formatierung, Zeilenabstand und Bilder machen alle PDF-Dokumente zu einer Herausforderung. Aber Able2Extract ($ 100, 7 Tage kostenlose Testversion) macht diese langweilige Aufgabe kinderleicht.

Able2Extract konvertiert die Informations-PDFs in editierbare Formate, wie sie von Microsoft Office-Anwendungen verwendet werden.

Able2Extract liest einfach das PDF-Dokument, spuckt dann Text, Grafiken, Tabellen und andere Inhalte in ein Microsoft Office-Dokument Ihrer Wahl aus - Word, Excel oder Powerpoint. Zeilenabstand und Formatierung werden nach bestem Wissen des Programms beibehalten: Tabellen verursachen keine Absätze an ungeraden Stellen. Ebensowenig Inline-Grafiken, die in Office-Dokumenten genau an dem Ort erhalten und verschoben werden, an dem sie im PDF-Dokument erscheinen.

Die für die Professional-Version des Produkts gezahlte Prämie von 30 US-Dollar enthält eine wichtige Funktion: optische Zeichenerkennung, oder OCR. A2E Pro kann die PDF-Dokumente einlesen, die als Bilddatei gescannt wurden, und leistet eine bemerkenswert gute Arbeit, da die Bilder nicht nur in Text umgewandelt, sondern auch die Seitennummerierung, das Layout und sogar die im Originaldokument verwendete Schriftart reproduziert werden.

Das Extrahieren von Text aus einer PDF, die mit dem Adobe Acrobat-Dienstprogramm (oder "Drucken in PDF") erstellt wurde, war ein Kinderspiel. Ein 20-seitiges Dokument mit eingebetteten Bildern, einer Tabelle, um die Text herumfloss, und anderen Details wurde fehlerfrei in einer Microsoft Word-DOC-Datei reproduziert. Die Verwendung der Pro-Version zum OCR eines schlecht reproduzierten Dokuments, das ursprünglich mit einer Schreibmaschine getippt und dann krumm gescannt wurde, stellte eine größere Herausforderung dar.

Das Programm brauchte 3 Minuten und 15 Sekunden, um ein ansonsten katastrophal gescanntes Bild zu konvertieren 62-Seiten-Test PDF. Kleinere Tippfehler erschienen, wo handschriftliche Notizen auf einigen Seiten am Rand erschienen - aber es wurde auch versucht, diese zu reproduzieren. Das Original war per Fax verschickt worden, und die Fax-Fußzeile, die mit dem Scan schlechter Qualität verblasst war, reproduzierte nicht identisch - aber es war auch völlig überflüssig. Wenn Sie die PDF-Datei in das Programm laden, können Sie Teile der Seite, die Sie konvertieren möchten, durch Ziehen auswählen. Hätte ich die Konvertierung besser geplant, hätte ich vermieden, diese unnötigen Fußzeilen und die Notizen am Rand auszuwählen.

Ein Vertreter des Herausgebers sagt mir, dass Zeichnungen oder Skizzen in PDF-Dokumenten gescannt und in ein Dateiformat ausgegeben werden können lässt sie von AutoCAD geladen werden. Obwohl ich dieses Feature nicht getestet habe, kann ich sehen, dass dies für einen Architekten, Archivar oder Historiker unglaublich nützlich sein könnte, besonders wenn die in eine PDF gescannten Blaupausen ursprünglich nicht in einem Computer entworfen wurden. Alles in allem war ich beeindruckt von Able2Extract.