html2textは、C ++で記述されたコマンドラインユーティリティで、HTMLドキュメントをプレーンテキストに変換します。各HTMLドキュメントは、URIで指定された場所からロードされるか、標準入力から読み取られ、標準出力または出力ファイルに書き込まれるプレーンテキスト文字のストリームにフォーマットされます。input-URIは、ハイパーサイト転送プロトコル(HTTP)を介してドキュメントがロードされるリモートサイトを指定できます。プログラムは、テーブルフィールドの元の位置を保持し、画面の幅を(指定された出力文字数に)設定し、構文的に誤った入力も受け入れます(「合理的に」解釈しようとします)。太字と下線付きのテキストは、デフォルトでバックスペースシーケンスでレンダリングされます(これは、プログラムの出力を「より少ない」または他のページャーにパイプするときに特に便利です)。すべてのレンダリングプロパティは、主にRCファイルを介してカスタマイズできます。
html2text
ウェブサイト:
http://www.mbayer.de/html2text/カテゴリー
Windowsのhtml2textの代替
1