OCR Software

  • Liebe Leute,


    heute wurde ich in der Arbeit von einem Kollegen gefragt, ob ich mich nicht ein wenig mit OCR-Software auskennen würde. Nachdem ich dies verneinen musste, dachte ich mir, ich leite die Frage an euch weiter!


    Der Use-Case ist denkbar banal: Es geht um Text aus Büchern, die eingescannt werden und Studenten zur Verfügung gestellt werden sollen. Als Bilder ist das natürlich etwas fade, da die Bereitstellung als PDF z.B. eine Volltextsuche und Lesezeichen mit sich brächte. Da es nur um Auszüge (ein, zwei, drei Seiten) geht, und viele dieser Bücher nicht digital verfügbar sind, wäre die Anfertigung einer digitalen Kopie die beste Möglichkeit für den Kollegen. Die Bücher beinhalten nicht nur reinen Text, sondern auch Bilder.


    Drei konkrete Fragen:
    Sind diese OCR-Geschichten nur von der Software abhängig? (Mal abgesehen von der Auflösung des Scanners und dem eingestellten Kontrast)
    Wenn ja, was würde sich für Software anbieten? Ich nehme einmal an, dass dies nicht unbedingt vom Scanner abhängt. FOSS bevorzugt, sind aber auch bereit, Geld auszugeben. OS Mac, Windows oder Linux, relativ egal, Mac bevorzugt, Hauptsache, die Ergebnisse passen! ;)
    Habt ihr vielleicht Erfahrungen, über die ihr berichten könnt?


    LG,
    Flo

  • also ich hatte mit dem abbyy fine reader gute resultate, vor allem auch was die einbindung von grafiken und die erstellung von pdf angeht. gibt's auch als testversion.
    http://finereader.abbyy.de/


    unter linux kann ich tesseract oder ocrad empfehlen. leider sieht hier die untersützung von grafiken etwas schlecht aus.

    "All through my life I've had this strange unaccountable feeling that something was going on in the world, something big, even sinister, and no one would tell me what it was."
    "No," said the old man, "that's just perfectly normal paranoia. Everyone in the Universe has that."

    😁😂😃😄😅😆😇😈😉😊😋😌😍😎😏😐😒😓😔😖😘😚😜😞😠😡😢😣😥😨😩😪😫😭😰😱😲😳😵😶😷

  • Das wird jetzt sehr vage, aber: Ich glaub, bei einem von den zwei Buchscannern in der TU-Bibliothek (dem, der am PC mit der unglaublich umständlichen Software hängt) ist auch OCR-Software installiert. Wenn dem so ist, was man vermutlich auf der Bibliothekshomepage rausfindet, könnte man dort zumindest mal kurz experimentieren. Hätte, wenn es so ist, den möglichen Vorteil, daß dort wohl eher ausgereifte Bezahlsoftware rennt.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!