Tesseract

Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。
Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。
tesseract

カテゴリー

LinuxのTesseractの代替

GImageReader

GImageReader

gImageReaderは、Tesseract OCR EngineのシンプルなGtk / Qtフロントエンドです。機能:-ディスク、スキャンデバイス、クリップボード、スクリーンショットからPDFドキュメントと画像をインポートします。
CuneiForm

CuneiForm

CuneiForm(OpenOCR)は、印刷テンプレート用のテキスト認識ソフトウェアです。原稿またはPDFファイル、プログラムは、しかし、テーブル構造を認識できません。
CopyFish

CopyFish

任意のWebサイトの画像/ビデオ/ PDFからテキストを抽出して翻訳します。
OCRFeeder

OCRFeeder

OCRFeederは、ドキュメントレイアウト分析および光学式文字認識システムです。
GOCR

GOCR

GOCRは、GNU Public Licenseの下で開発されたOCR(光学文字認識)プログラムです。スキャンしたテキストの画像をテキストファイルに戻します。
OCRopus

OCRopus

OCRopus(tm)は、プラグイン可能なレイアウト分析、プラグイン可能な文字認識、統計的自然言語モデリングを特徴とする最新のドキュメント分析およびOCRシステムです...
VietOCR

VietOCR

Tesseract OCRエンジン用のJava / .NET GUIフロントエンド。ベトナム語の光学式文字認識をサポートします。
OCRmyPDF

OCRmyPDF

OCRmyPDFは、スキャンされたPDFファイルにOCRテキストレイヤーを追加し、それらを検索またはコピー&ペーストできるようにします。
WatchOCR

WatchOCR

WatchOCRは、監視フォルダー内の画像から検索可能なPDFを作成するオープンソースOCRサーバーです。
YAGF

YAGF

YAGF、CuneiFormのもう1つのグラフィカルフロントエンドは、...