Autor Thema: OCR für Linux  (Gelesen 886 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline spoke1

  • Alle angenehmen Dinge des Lebens sind entweder illegal, unmoralisch, teuer oder machen dick!
  • Premium-Cubie
  • ****
  • Beiträge: 2718
  • kaffeine Fan
    • skynetR32 Mod HP
OCR für Linux
« am: 19 April, 2010, 20:11 »
Mag ja sein das das mal jemand brauchen kann:

Zitat
Warum OCR unter Linux?

    *
      Ein hoher Anteil geschäftskritischer Anwendungen wird unter Linux aufgeführt, z. B. Web-, E-Mail-, Datei- und Datenbankserver. Die meisten dieser Systeme zählen zur grundlegenden IT-Infrastruktur von Unternehmen.

    *
      Heutzutage gibt es kaum jemanden, der nicht privat und beruflich in irgendeiner Form mit digitalen Dokumenten in Berührung kommt. Aber auch gedruckte Dokumente sind noch nicht von der Bildfläche verschwunden und enthalten große Mengen wichtiger Daten und Informationen, die zur digitalen Weiterverarbeitung extrahiert werden müssen.

    *
      Der Schlüssel, um papierbasierte Informationen zugänglich zu machen und in digitale Arbeitsabläufe zu integrieren, ist optische Zeichenerkennung oder kurz „OCR“ (Optical Character Recognition). OCR ermöglicht es, Scans schnell in durchsuchbare und bearbeitbare Dokumente oder plattformunabhängige PDF-Dateien umzuwandeln.

    *
      Da die optische Zeichenerkennung nur einmal im Lebenszyklus eines Dokuments durchgeführt wird, ist die Qualität der Erkennung und Konvertierung von entscheidender Bedeutung. Die OCR-Technologie von ABBYY zeichnet sich durch erwiesene Leistungsfähigkeit, zuverlässige Ergebnisse und ein hohes Produktivitätssteigerungspotential aus.

Was ist ABBYY FineReader Engine 8.0 CLI für Linux?

    *
      ABBYY FineReader Engine 8.0 CLI für Linux ist eine Command Line basierende Anwendung (ohne Benutzeroberfläche), die auf ABBYYs hochentwickelter OCR-Technologie (Optical Character Recognition) basiert.

    *
      Die Anwendung automatisiert OCR- und Konvertierungsvorgänge von Dokumenten auf Linux-Systemen.

    *
      Die Verarbeitung wird vollständig über die Befehlszeile gesteuert.

    *
      ABBYY OCR für Linux bietet dieselbe hohe OCR-Qualität, die auch unter Windows erreicht wird.

    *
      Es werden zahlreiche Ausgabeformate unterstützt, z. B.: Text, RTF, HTML und PDF.

    *
      Wenn anspruchsvollere Verarbeitungsabläufe und eine höhere Integration realisiert werden sollen, können sich Entwickler die ABBYY OCR SDKs (Software Development Kits) nutzen. FineReader Engine 8.0 CLI für Linux basiert auf ABBYY FineReader Engine 8.0 SDK mit erweiterter Plattform-Unterstützung.

Warum OCR-Technologie von ABBYY einsetzen?

    *
      ABBYY verfügt über modernste Dokumenterkennungs- und PDF-Konvertierungsverfahren.

    *
      Profitieren Sie von der herausragenden Genauigkeit, die von zahlreichen Kunden und Brancheninsidern auf der ganzen Welt anerkannt wird.

    *
      Die OCR-Technologie von ABBYY ist für Linux und viele andere Plattformen verfügbar, z. B. Android, BSD, Linux, MacOS X, iPhone, Symbian, Windows, Windows Mobile…

    *
      ABBYY FineReader Engine 8.0 CLI für Linux unterstützt die Erkennung von Dokumenten, die mehrere Sprachen enthalten. Insgesamt können 190 Sprachen verarbeitet werden.


Zitat
Systemanforderungen

    *
      Betriebssysteme:
          o
            Red Hat Enterprise Linux 4 ES/AS, 5
          o
            Fedora Core 5, 6
          o
            Fedora 7, 7 x86-64
          o
            SUSE Linux 10.0
          o
            openSUSE 10.2
          o
            White Box Enterprise Linux 4 Respin 1, Respin 2
          o
            Debian GNU/Linux 3.1, 4.0

    *
      PC mit Intel® Pentium® 300 MHz (oder höher) .

    *
      Arbeitsspeicher: min. 128 MB RAM

    *
      Speicherplatz: 700 MB für die Programminstallation und 70 MB für den Einsatz des Programms.


Leider vergeht einem hier schon wieder der Spass, kostet die kleinste Lizens für 12.000 Seiten pro Jahr schon 149€  :o


Ansonsten geht es hier zum Download weiter
Produktiv:
ASRock K8S8X, Athlon64 3000+, 1GB Infineon Ram, WinFast A340 8X AGP, Samsung HD160 GB SATA2,
Technisat SkyStar 2, Stab HH100 Rotor und 5° & 19,2° Ost fest
BS: Mandriva-Linux (mdv) 2010.2 PP, kde 3.5.12, kaffeine 0.8.8, skynetR32

Bastelsrechner:
ASRock N570 SLI, Athlon64 X2 6000+ 4GB Geil Ram, EVGA GeForce G 210 Passiv (1GB DDR3, VGA, DVI, HDMI), Samsung HD 500GB SATA2, TT-budget S2-3200 PCI
BS: immer nur Pinguin freundliche

Offline dvb_ss2

  • Premium-Cubie
  • ****
  • Beiträge: 674
Re: OCR für Linux
« Antwort #1 am: 19 April, 2010, 20:34 »
Hier findet sich eine Liste mit diversen OCR-Anwendungen für Linux:
http://wiki.ubuntuusers.de/Texterkennung_%28OCR%29?highlight=ocr

dvb_ss2
Hardware: Gigabyte GA-MA78G-DS2H, AMD Athlon 64 X2 5400+ 2x2,8GHz, 4x2GB DDR2-800MHz, Palit/XpertVision GeForce GT 220 Super+ 1024MB DDR3, 1x60GB SSD, 1x500GB, 1x1,5TB HDD, 1x2TB HDD, Technotrend TT-budget S2-3200, OS: Ubuntu Lucid Lynx 10.04, TV-Software: VDR 1.7.15 + Xineliboutput

Offline SiLæncer

  • Cheff-Cubie
  • *****
  • Beiträge: 191383
  • Ohne Input kein Output
    • DVB-Cube
Re: OCR für Linux
« Antwort #2 am: 19 April, 2010, 21:40 »
Kann da jemand was empfehlen ?

Arbeits.- Testrechner :

Intel® Core™ i7-6700 (4 x 3.40 GHz / 4.00 GHz)
16 GB (2 x 8 GB) DDR4 SDRAM 2133 MHz
250 GB SSD Samsung 750 EVO / 1 TB HDD
ZOTAC Geforce GTX 1080TI AMPExtreme Core Edition 11GB GDDR5
MSI Z170A PC Mate Mainboard
DVD-Brenner Laufwerk
Microsoft Windows 10 Home 64Bit

TT S2 3200 ( BDA Treiber 5.0.1.8 ) + Terratec Cinergy 1200 C ( BDA Treiber 4.8.3.1.8 )

Offline dvb_ss2

  • Premium-Cubie
  • ****
  • Beiträge: 674
Re: OCR für Linux
« Antwort #3 am: 20 April, 2010, 07:38 »
...am ehesten wohl Cuneiform, allerdings nicht aus eigener Erfahrung!

dvb_ss2
Hardware: Gigabyte GA-MA78G-DS2H, AMD Athlon 64 X2 5400+ 2x2,8GHz, 4x2GB DDR2-800MHz, Palit/XpertVision GeForce GT 220 Super+ 1024MB DDR3, 1x60GB SSD, 1x500GB, 1x1,5TB HDD, 1x2TB HDD, Technotrend TT-budget S2-3200, OS: Ubuntu Lucid Lynx 10.04, TV-Software: VDR 1.7.15 + Xineliboutput