CopyFish

CopyFish

任意のWebサイトの画像/ビデオ/ PDFからテキストを抽出して翻訳します。
任意のWebサイトの画像/ビデオ/ PDFからテキストを抽出して翻訳します。画像からテキストを抽出する一般的な理由は、テキストをグーグル検索、保存、電子メール送信、または翻訳する場合です。これまで、唯一の選択肢はテキストを再入力することでした。Copyfishは非常に高速です。(小さな)テキストの読み取りに問題がある私たちにとって、Copyfishは画像内のテキストにスクリーンリーダーを使用する機能を提供します。「画像」には、写真、チャート、図、スクリーンショット、PDFドキュメント、コミック、ダイアログボックス、ミーム、スキャン、Flash、YouTubeムービーなど、あらゆる種類があります。
copyfish

ウェブサイト:

LinuxのCopyFishの代替

Tesseract

Tesseract

Tesseract.jsは、画像からほとんどすべての言語の単語を取得するjavascriptライブラリです。
gscan2pdf

gscan2pdf

gscan2pdfは、スキャンまたはインポートされたイメージ(既存のPDF、DjVusまたはその他のファイルタイプを含む)でスキャン、スキャンのクリーンアップ、OCRを実行し、OCRテキストが埋め込まれたPDFおよびDjVuファイルを作成できます。
CuneiForm

CuneiForm

CuneiForm(OpenOCR)は、印刷テンプレート用のテキスト認識ソフトウェアです。原稿またはPDFファイル、プログラムは、しかし、テーブル構造を認識できません。
OCRFeeder

OCRFeeder

OCRFeederは、ドキュメントレイアウト分析および光学式文字認識システムです。
OCRopus

OCRopus

OCRopus(tm)は、プラグイン可能なレイアウト分析、プラグイン可能な文字認識、統計的自然言語モデリングを特徴とする最新のドキュメント分析およびOCRシステムです...
GOCR

GOCR

GOCRは、GNU Public Licenseの下で開発されたOCR(光学文字認識)プログラムです。スキャンしたテキストの画像をテキストファイルに戻します。
VietOCR

VietOCR

Tesseract OCRエンジン用のJava / .NET GUIフロントエンド。ベトナム語の光学式文字認識をサポートします。
WatchOCR

WatchOCR

WatchOCRは、監視フォルダー内の画像から検索可能なPDFを作成するオープンソースOCRサーバーです。
YAGF

YAGF

YAGF、CuneiFormのもう1つのグラフィカルフロントエンドは、...
Adlib PDF

Adlib PDF

Adlib PDFは、エンタープライズクラスのドキュメントからPDFへの変換ソフトウェアを提供します。正確なOCR機能とインテリジェントドキュメントアセンブリを備えた、市場で最も忠実なPDFレンダリングエンジンを提供します。