Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。

無料アプリ
Windows
Mac
Linux

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。

ウェブサイト:

https://github.com/tesseract-ocr/tesseract

特徴

Windows MobileのTesseractの代替

OCR Text Detection Tool

デバイスからダウンロードされた、またはスナップショットで撮影された画像ファイルからテキストを正確かつ高速に検出します。また、PDFのテキスト検出と、114の異なる言語でのテキストベースの手書き検出およびテキスト翻訳もサポートしています。

Tesseract

ウェブサイト:

特徴

カテゴリー

Windows MobileのTesseractの代替

OCR Text Detection Tool