Gigablast

Gigablast

Gigablastは、リアルタイムのインデックス作成を行う強力なオープンソースの新しい検索エンジンです!
Gigablastは、リアルタイムのインデックス作成を行う強力なオープンソースの新しい検索エンジンです。数千のサーバーに拡張可能な機能。200以上のサーバーで120億以上のWebページに拡大しました。8 GBのインスタンスを実行する32 GBのRAMと2つの160 GBのIntel SSDを備えたデュアルクアッドコアは、1000万ページのインデックスで約8 qps(クエリ/秒)を実行できます。ドライブは最大ストレージ容量に近くなります。インデックスサイズを2倍にすると、QPSレートがほぼ半分になります。(パフォーマンスメトリックは約10倍高速化できますが、まだ使い回していません。ドライブ領域の使用量は、既にかなり効率的であるため、おそらくほぼ同じままです。)100万のWebページには28.6GBのドライブ領域が必要です。これには、すべてのWebページのインデックス、メタ情報、および圧縮されたHTMLが含まれます。スパイダーレートは、コアあたり毎秒約1ページです。したがって、デュアルクアッドコアは、1日あたり691,200ページである1秒あたり8ページをスパイダーおよびインデックスできます。Gigablastインスタンスごとに4GBのRAMが必要です。(インスタンス=プロセス)最適なパフォーマンスを得るためにC / C ++で書かれたライブデモ。500,000行を超えるC / C ++。100%カスタム。単一のバイナリ。Webサーバー、データベース、およびその他すべては、非常に効率的な方法でこのソースコードに含まれています。管理とトラブルシューティングを簡単にします。信頼性のある。2002年以来、120億を超える一意のWebページのインデックスで数十億のクエリを実行し、240億をミラーリングして、実稼働環境でテストされています。超高速かつ効率的。このような大きな数字をヒットしている少数の一握りの検索エンジンの1つ。持っている唯一のオープンソース検索エンジン。すべての言語をサポートします。クエリ時に、指定された言語の結果を他の言語よりも後押しできます。内部でUTF-8表現を使用します。実績。多くのクライアントで使用されています。分散エンタープライズソフトウェアで正常に使用されています。クエリ用語の強調表示付きのキャッシュされたWebページ...
gigablast

ウェブサイト:

カテゴリー

Self-HostedのGigablastの代替

searx

searx

Searxはメタ検索エンジンであり、他の検索エンジンの結果を集約しますが、ユーザーに関する情報は保存しません。Searxを使用する理由
Seeks

Seeks

Seeksは、ソーシャルWeb検索を可能にするための無料でオープンなP2Pデザインおよびアプリケーションです。
Sphider

Sphider

Sphiderは、PHPで書かれた軽量のWebスパイダーおよび検索エンジンであり、バックエンドデータベースとしてMySQLを使用します。
Inout Search Engine

Inout Search Engine

GoogleやYahooが結果を取得するように、クローンスクリプトを使用してプライベート検索エンジンを構築することもできます。
SSEP - Site Search Engine PHP-Ajax

SSEP - Site Search Engine PHP-Ajax

これは、MySQLを使用してWebサイトのインデックスページを保存し、Webサイトに検索機能を追加するSite Searchエンジンスクリプトです。