12
ArchiveBox
openオープンソースの自己ホスト型Webアーカイブ。ブラウザの履歴/ブックマーク/ポケット/ピンボードなどを受け取り、HTML、JS、PDF、メディアなどを保存します。
- 無料アプリ
最新のWebサイトは複雑で、多くの場合動的コンテンツに依存しているため、ArchiveBoxはArchive.orgやArchive.isなどのパブリックアーカイブサービスが保存できるものを超えて、いくつかの異なる形式でサイトをアーカイブします。ArchiveBoxは、stdin、リモートURL、またはファイルからURLのリストをインポートし、wgetを使用してページをローカルアーカイブフォルダーに追加して、閲覧可能なhtmlクローンを作成し、youtube-dlでメディアを抽出し、Chromeの完全なインスタンスをPDFに抽出し、スクリーンショット、およびDOMダンプなど...複数のメソッドと市場を支配するブラウザーを使用してJSを実行することにより、少なくともいくつかの高品質で長期的なデータ形式で、最も複雑で巧妙なWebサイトでも保存できるようになります。###次からリンクをインポートできます:-ポケット、ピンボード、Instapaper-RSS、XML、JSON、またはプレーンテキストリスト-ブラウザーの履歴またはブックマーク(Chrome、Firefox、Safari、IE、Operaなど)-Shaarli、Delicious、Reddit保存された投稿、Wallabag、Unmark.it、およびリンクが含まれるその他のテキスト!###各サイトのこれらのものを保存することができます:-サイトの `favicon.ico`ファビコン-サイトの` example.com / page-name.html` wgetクローン。存在しない場合は.htmlが追加されます-`output。pdf`ヘッドレスクロムを使用したサイトのPDFの印刷-`screenshot.png`ヘッドレスクロムを使用したサイトの1440x900スクリーンショット-` output.html`ヘッドレスクロムを使用したレンダリング後のHTMLのDOMダンプ-`archive.org.txt`へのリンクarchive.orgに保存されたサイト-html + gzipされたwarcファイル用の `warc /`.gz-youtube-dlを使用して見つかったmp4、mp3、字幕、メタデータの「media /」-github、bitbucket、またはgitlabリンクのリポジトリの「git /」クローン-「index.html」および「index.json」メタデータと詳細を含むHTMLおよびJSONインデックスファイルアーカイブは付加的なものなので、 `。/ archive`を定期的に実行し、新しいリンクをインデックスにプルするようにスケジュールできます。保存されたコンテンツはすべて静的であり、JSONファイルでインデックス付けされているため、永久に存続し、簡単に解析でき、常に実行されるバックエンドは必要ありません。
archivebox
カテゴリー
商用ライセンスを使用するMacのArchiveBoxの代替
19
17
SiteSucker
インターネットからWebサイトを自動的にダウンロードするmacOSアプリケーション。これは、サイトのWebページ、画像、PDF、スタイルシート、およびその他のファイルをローカルのハードドライブに非同期的にコピーし、サイトのディレクトリ構造を複製することによって行われます。
3
1