Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。

無料アプリ
Windows
Mac
Linux

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。

ウェブサイト:

https://github.com/tesseract-ocr/tesseract

特徴

ライセンスのあるすべてのプラットフォームでのTesseractの代替

116

ABBYY FineReader

ABBYY FineReaderは、比類のないテキスト認識精度と変換機能を提供するOCRソフトウェアであり、ドキュメントの再入力と再フォーマットを実質的に排除します。テキスト認識では、最大190の言語がサポートされています。

有料アプリ
Windows
Mac
Web

GImageReader

gImageReaderは、Tesseract OCR EngineのシンプルなGtk / Qtフロントエンドです。機能：-ディスク、スキャンデバイス、クリップボード、スクリーンショットからPDFドキュメントと画像をインポートします。

無料アプリ
Windows
Linux

FreeOCR

FreeOCRは、Tesseract GUIとも呼ばれるTesseract無料ocrエンジンを含むスキャンおよびOCRプログラムです。

無料アプリ
Windows

(a9t9) Free OCR Software

画像ファイルとPDFからテキストを抽出するためのオープンソースOCRソフトウェアとWebサービス。このアプリケーションは、オンラインOCR Webアプリ、OCR API、または簡単にインストールできるWindowsストアアプリケーション（使用するには、オープンソースおよび100％スパイウェア）として利用できます。