Tesseract

71

Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。

無料アプリ
Windows
Mac
Linux

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。Tesseract OCRエンジンは、1995年のUNLV精度テストの上位3つのエンジンの1つでした。1995年から2006年の間に、ほとんど作業が行われていませんでしたが、おそらく最も正確なオープンソースOCRエンジンの1つです。ソースコードは、バイナリ、グレー、またはカラー画像を読み取り、テキストを出力します。非圧縮TIFFイメージを読み取るTIFFリーダーが組み込まれているか、libtiffを追加して圧縮イメージを読み取ることができます。Frakturおよびblackletter書体で設定されたテキストでも、多くの言語の言語ファイルがあります。

ウェブサイト:

https://github.com/tesseract-ocr/tesseract

特徴

カテゴリー

オフィスと生産性

LinuxのTesseractの代替

GImageReader

35

GImageReader

gImageReaderは、Tesseract OCR EngineのシンプルなGtk / Qtフロントエンドです。機能：-ディスク、スキャンデバイス、クリップボード、スクリーンショットからPDFドキュメントと画像をインポートします。

無料アプリ
Windows
Linux

CuneiForm

9

CuneiForm

CuneiForm（OpenOCR）は、印刷テンプレート用のテキスト認識ソフトウェアです。原稿またはPDFファイル、プログラムは、しかし、テーブル構造を認識できません。

無料アプリ
Windows
Mac
Linux

CopyFish

8

CopyFish

任意のWebサイトの画像/ビデオ/ PDFからテキストを抽出して翻訳します。

無料アプリ
Chrome
Windows
Mac
Linux
Firefox

OCRFeeder

6

OCRFeeder

OCRFeederは、ドキュメントレイアウト分析および光学式文字認識システムです。

無料アプリ
Linux

GOCR

5

GOCR

GOCRは、GNU Public Licenseの下で開発されたOCR（光学文字認識）プログラムです。スキャンしたテキストの画像をテキストファイルに戻します。

無料アプリ
Windows
Linux

OCRopus

5

OCRopus

OCRopus（tm）は、プラグイン可能なレイアウト分析、プラグイン可能な文字認識、統計的自然言語モデリングを特徴とする最新のドキュメント分析およびOCRシステムです...

無料アプリ
Linux

VietOCR

4

VietOCR

Tesseract OCRエンジン用のJava / .NET GUIフロントエンド。ベトナム語の光学式文字認識をサポートします。

無料アプリ
Windows
Mac
Linux

OCRmyPDF

4

OCRmyPDF

OCRmyPDFは、スキャンされたPDFファイルにOCRテキストレイヤーを追加し、それらを検索またはコピー＆ペーストできるようにします。

無料アプリ
Mac
Linux

WatchOCR

3

WatchOCR

WatchOCRは、監視フォルダー内の画像から検索可能なPDFを作成するオープンソースOCRサーバーです。

無料アプリ
Linux

YAGF

2

YAGF

YAGF、CuneiFormのもう1つのグラフィカルフロントエンドは、...

無料アプリ
Linux