Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。
カテゴリー
ライセンスのあるすべてのプラットフォームでのTesseractの代替
116
ABBYY FineReader
ABBYY FineReaderは、比類のないテキスト認識精度と変換機能を提供するOCRソフトウェアであり、ドキュメントの再入力と再フォーマットを実質的に排除します。テキスト認識では、最大190の言語がサポートされています。
35
GImageReader
gImageReaderは、Tesseract OCR EngineのシンプルなGtk / Qtフロントエンドです。機能:-ディスク、スキャンデバイス、クリップボード、スクリーンショットからPDFドキュメントと画像をインポートします。
19
(a9t9) Free OCR Software
画像ファイルとPDFからテキストを抽出するためのオープンソースOCRソフトウェアとWebサービス。このアプリケーションは、オンラインOCR Webアプリ、OCR API、または簡単にインストールできるWindowsストアアプリケーション(使用するには、オープンソースおよび100%スパイウェア)として利用できます。
- 無料アプリ
- Web
15
12
TextGrabber
ABBYY TextGrabberは、選択したテキストまたはQRコードを事実上あらゆる印刷物から簡単かつ迅速にスキャン、翻訳、保存します。
12
11
9
8
5