Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。
カテゴリー
WebのTesseractの代替
116
ABBYY FineReader
ABBYY FineReaderは、比類のないテキスト認識精度と変換機能を提供するOCRソフトウェアであり、ドキュメントの再入力と再フォーマットを実質的に排除します。テキスト認識では、最大190の言語がサポートされています。
19
(a9t9) Free OCR Software
画像ファイルとPDFからテキストを抽出するためのオープンソースOCRソフトウェアとWebサービス。このアプリケーションは、オンラインOCR Webアプリ、OCR API、または簡単にインストールできるWindowsストアアプリケーション(使用するには、オープンソースおよび100%スパイウェア)として利用できます。
- 無料アプリ
- Web
15
12
5
4
4
2
OmniPage Cloud Service
OmniPageクラウドサービスは、OmniPage Capture SDK上に構築されたクラウドコンピューティングプラットフォームです。
- 有料アプリ
- Web
1
0
Novadys OCR Web Service
OCR(Optical Character Recognition)のイタリア企業リーダーであるNOVADYSは、無料のオンラインOCRサービスサイトを作成し、すべての画像をアップロードして編集可能なテキストに変換しました。
- フリーミアムアプリ
- Web
0