havenask - Havenaskはアリババグループの自己研究検索エンジンであり、アリババ内で広く使用されている大規模な分散検索システムです

()

Created at: 2022-10-17 11:46:01
Language: C++
License: Apache-2.0

プロジェクトの紹介

Havenaskは、アリババグループの自己研究検索エンジンであり、また、アリババ内で広く使用されている大規模な分散検索システムであり、タオバオ、天猫、新人、ガウデ、空腹、グローバル化を含むアリババグループ全体の検索ビジネスをサポートし、高性能、低コスト、使いやすい検索サービスをユーザーに提供し、柔軟なカスタマイズと開発能力を持ち、アルゴリズムの迅速な反復をサポートし、顧客や開発者がビジネスに適したインテリジェントな検索サービスをカスタマイズし、ビジネスの成長を支援します。

さらに、Havenask に基づく業界 AI 検索製品である Alibaba Cloud OpenSearch は、Alibaba Cloud でエンタープライズ 開発者に完全に管理された、運用不要のワンストップ スマート検索サービスを提供し続け、エンタープライズ開発者による試用を歓迎します。

コアコンピテンシー

Havenask のコア機能と利点には、次の点があります。

  • 究極のエンジニアリングパフォーマンス:数千億レベルのデータリアルタイム検索、ミリオンズQPSクエリ、ミリ秒レベルのクエリ遅延、秒レベルのデータ更新をサポートします。
  • C++ の基になるビルド: パフォーマンス、メモリ、および安定性に対する保護が向上します。
  • SQL クエリのサポート: SQL 構文をサポートする便利なクエリは、クエリ エクスペリエンスが優しいです。
  • 豊富なプラグインメカニズム:ビジネスプラグインのすべての種類をサポートし、強力な拡張。
  • グラフィカルな開発のサポート: アルゴリズムの分単位の迅速な反復、豊富なカスタマイズ能力、次世代のインテリジェント検索シナリオで優れたサポートを実現します。
  • サポートベクター検索: プラグインと連携してマルチモーダル検索を実装することで、より多くのシナリオの検索サービス構築のニーズを満たすことができます(リリース待ち)。

関連ドキュメント

開始します

  • ミラーの紹介
    • ha3_runtime: コードをコンパイルすることなく直接実行できるイメージには、Qor-Tian エンジン用の実行可能ファイルが含まれています。
    • ha3_dev: テストの開発に必要なさまざまな依存ライブラリとヘッダー ファイルを含む開発テスト用のイメージ。
  • 環境要件
    • マシンのメモリが 10G より大きく、CPU が 2 コアより大きく、ディスク サイズが 50G を超えていることを確認します。
    • 使用する前に、デバイスが Docker サービスをインストールして起動していることを確認します。

コンテナーを起動します

リポジトリを複製します

git clone git@github.com:alibaba/havenask.git
cd havenask/docker

指定したコンテナー名をCONTAINER_NAMEコンテナーを作成します

docker pull havenask/ha3_runtime:0.2.2
./create_container.sh <CONTAINER_NAME> havenask/ha3_runtime:0.2.2

Docker Hub アクセスが不安定であるために上記のミラーをダウンロードできない場合は、Alibaba クラウド ミラー リング ソースを試すことができます

docker pull registry.cn-hangzhou.aliyuncs.com/havenask/ha3_runtime:0.2.2
./create_container.sh <CONTAINER_NAME> registry.cn-hangzhou.aliyuncs.com/havenask/ha3_runtime:0.2.2

着陸コンテナ

./<CONTAINER_NAME>/sshme

インデックスの構築をテストします

フルボリューム インデックスを作成します

cd ~/havenask/example/
python build_demo_data.py /ha3_install

テスト エンジン クエリ

havenaskエンジンを起動します

python start_demo_searcher.py /ha3_install

エンジンの既定のクエリ ポートは 45800 で、スクリプトを使用してクエリ テストを実行します。 ここではいくつかのテストqueryです。 その他のテストケースはexampleを参照してください

python curl_http.py 45800 "query=select count(*) from in0"

python curl_http.py 45800 "query=select id,hits from in0 where MATCHINDEX('title', '搜索词典')"

python curl_http.py 45800 "query=select title, subject from in0_summary_ where id=1 or id=2"

お問い合わせ下さい

公式技術交換ペググループ:

3293821693450208