Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。
カテゴリー
Windows MobileのTesseractの代替
0
OCR Text Detection Tool
デバイスからダウンロードされた、またはスナップショットで撮影された画像ファイルからテキストを正確かつ高速に検出します。また、PDFのテキスト検出と、114の異なる言語でのテキストベースの手書き検出およびテキスト翻訳もサポートしています。