4
Autosubは、自動音声認識と字幕生成のためのユーティリティです。ビデオまたはオーディオファイルを入力として受け取り、音声アクティビティ検出を実行して音声領域を見つけ、Google Web Speech APIに並列リクエストを行ってそれらの領域のトランスクリプションを生成し、(オプションで)別の言語に翻訳し、最終的に結果を保存しますディスクへの字幕。さまざまな入力言語と出力言語をサポートし(どの言語を確認するには、引数--list-languagesを指定してユーティリティを実行します)、現在SRT形式または単純なJSONで字幕を生成できます。