Tesseract

Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。
Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。
tesseract

カテゴリー

WindowsのTesseractの代替

PDF OCR

PDF OCR

編集可能-スキャンしたPDFドキュメントをテキストファイルの編集のように編集します!簡単-2クリックだけでOCR PDFをテキストに変換します。
Text-R

Text-R

ASCOMP Text-Rを使用して、画像およびPDFファイル内のテキストを認識して保存します。
OCR Text Detection Tool

OCR Text Detection Tool

デバイスからダウンロードされた、またはスナップショットで撮影された画像ファイルからテキストを正確かつ高速に検出します。また、PDFのテキスト検出と、114の異なる言語でのテキストベースの手書き検出およびテキスト翻訳もサポートしています。
Transym OCR

Transym OCR

Transym OCR(TOCR)は、開発者向けの高度に洗練された、正確で信頼性の高い光学式文字認識ソフトウェアの大手プロバイダーです。
Photo Scan

Photo Scan

フォトスキャンを使用すると、画像または写真からテキストを非常に簡単かつ効率的に抽出できます。