OCRopus

OCRopus

OCRopus(tm)は、プラグイン可能なレイアウト分析、プラグイン可能な文字認識、統計的自然言語モデリングを特徴とする最新のドキュメント分析およびOCRシステムです...
OCRopus(tm)は、プラグ可能なレイアウト分析、プラグ可能な文字認識、統計的自然言語モデリング、多言語機能を備えた最新の文書分析およびOCRシステムです。このシステムは、Googleや他の組織からの寛大なサポートを受けて開発されています。主な開発者は、DFKI Research CenterのIUPR Research Groupにいます。
ocropus

ウェブサイト:

特徴

カテゴリー

LinuxのOCRopusの代替

Tesseract

Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。
CopyFish

CopyFish

任意のWebサイトの画像/ビデオ/ PDFからテキストを抽出して翻訳します。
GOCR

GOCR

GOCRは、GNU Public Licenseの下で開発されたOCR(光学文字認識)プログラムです。スキャンしたテキストの画像をテキストファイルに戻します。