1. Liebe Forumsgemeinde,

    aufgrund der Bestimmungen, die sich aus der DSGVO ergeben, müssten umfangreiche Anpassungen am Forum vorgenommen werden, die sich für uns nicht wirtschaftlich abbilden lassen. Daher haben wir uns entschlossen, das Forum in seiner aktuellen Form zu archivieren und online bereit zu stellen, jedoch keine Neuanmeldungen oder neuen Kommentare mehr zuzulassen. So ist sichergestellt, dass das gesammelte Wissen nicht verloren geht, und wir die Seite dennoch DSGVO-konform zur Verfügung stellen können.
    Dies wird in den nächsten Tagen umgesetzt.

    Wir danken allen, die sich in den letzten Jahren für Hilfesuchende und auch für das Forum selbst engagiert haben.

OCR im batch?

Dieses Thema im Forum "Software" wurde erstellt von pietschker, 3. Dezember 2005.

  1. pietschker

    pietschker New Member

    Ich habe das Problem, ca. 80.000 gescannte Texte (mit jeweils sehr wenig Text, englisch oder numerisch) durch eine Texterkennung zu jagen. Meine Fragen:
    - Kennt jemand für MacOS 10.4 eine OCR-Software, die man aus Darwin oder per Applescript aufrufen kann, so dass ich mir eine batch-loop schreiben könnte? Ich brauche nichts weiter als "Erkenne Bilddatei... schreibe in Textdatei...", alles andere ist leicht hinzukriegen.
    - ABBYY FineReader 5 SprintXE kann angeblich per AppleScript aufgerufen werden (die scripting suite wird vom Skripteditor jedenfalls erkannt), aber ich kriege kein Skript zum Laufen. Hat jemand das schon mal geschafft? ABBYY leugnet alles :)

    Vielen Dank vorab!
    Lutz Pietschker
     
  2. mac123franz

    mac123franz New Member

    …

    OCR am Mac ist ein leidiges Thema.
    Schau Dir mal die Programme OMNIPAGE Pro und ReadIris an.
    Wenn die sauber unter 10.4 laufen, könnte man z.B. auch mit Automator
    einen gewissen Ablauf hinkriegen.
    In welchem Format sollen denn die Dateien anschließend
    vorliegen? Das zu wissen wäre das wichtigste Kriterium für
    eine konkretere Empfehlung.


    …
     
  3. mac123franz

    mac123franz New Member

  4. pietschker

    pietschker New Member

    Reiner Text ASCII-7bit genügt. Die von Dir angesprochenen Programme sind die, die ich bereits probiert bzw. im Text erwähnt habe. ReadIris 11 hat gar keine batch-Unterstützung, bei Omnipage ist auf den Produktinfoseiten auch nicht die Rede davon. ReadIris 11 ist auch interaktiv großer Mist, so wird z.B. ohne TextRahmen gar nichts erkannt. Der Automator bringt natürlich nichts, wenn die Erkennungsbefehle nicht skriptfähig sind.
     
  5. kringo

    kringo New Member


    ...Das ist ja nur für windoof...
     

Diese Seite empfehlen