havenask - Havenaskは、アリババグループの自己研究検索エンジンであり、また、アリババ内で広く使用されている大規模な分散検索システムであり、タオバオ、天猫、新人、ガウデ、空腹、グローバル化を含むアリババグループ全体の検索ビジネスをサポートし、高性能、低コスト、使いやすい検索サービスをユーザーに提供し、柔軟なカスタマイズと開発能力を持ち、アルゴリズムの迅速な反復をサポートし、顧客や開発者がビジネスに適したインテリジェントな検索サービスをカスタマイズし、ビジネスの成長を支援します。

()

Created at: 2022-10-17 11:46:01
Language: C++
License: Apache-2.0

プロジェクトの紹介

Havenaskは、アリババグループの自己研究検索エンジンであり、また、アリババ内で広く使用されている大規模な分散検索システムであり、タオバオ、天猫、新人、ガウデ、空腹、グローバル化を含むアリババグループ全体の検索ビジネスをサポートし、高性能、低コスト、使いやすい検索サービスをユーザーに提供し、柔軟なカスタマイズと開発能力を持ち、アルゴリズムの迅速な反復をサポートし、顧客や開発者がビジネスに適したインテリジェントな検索サービスをカスタマイズし、ビジネスの成長を支援します。

さらに、Havenask に基づく業界 AI 検索製品である Alibaba Cloud OpenSearch は、Alibaba Cloud でエンタープライズ 開発者に完全に管理された、運用不要のワンストップ スマート検索サービスを提供し続け、エンタープライズ開発者による試用を歓迎します。

コアコンピテンシー

Havenask のコア機能と利点には、次の点があります。

  • 究極のエンジニアリングパフォーマンス:数千億レベルのデータリアルタイム検索、ミリオンズQPSクエリ、ミリ秒レベルのクエリ遅延、秒レベルのデータ更新をサポートします。
  • C++ の基になるビルド: パフォーマンス、メモリ、および安定性に対する保護が向上します。
  • SQL クエリのサポート: SQL 構文をサポートする便利なクエリは、クエリ エクスペリエンスが優しいです。
  • 豊富なプラグインメカニズム:ビジネスプラグインのすべての種類をサポートし、強力な拡張。
  • グラフィカルな開発のサポート: アルゴリズムの分単位の迅速な反復、豊富なカスタマイズ能力、次世代のインテリジェント検索シナリオで優れたサポートを実現します。
  • サポートベクター検索: プラグインと連携してマルチモーダル検索を実装することで、より多くのシナリオの検索サービス構築のニーズを満たすことができます(リリース待ち)。

関連ドキュメント

開始します

使用する前に、Docker サービスがインストールされ、開始されていることを確認してください

コンテナーを起動します

リポジトリを複製します

git clone git@github.com:alibaba/havenask.git
cd havenask/docker

コンテナーを作成します。 ここでCONTAINER_NAME指定されたコンテナー名です

docker pull havenask/ha3_runtime:0.1 
./create_container.sh <CONTAINER_NAME> havenask/ha3_runtime:0.1 

Docker Hub アクセスが不安定であるために上記のミラーをダウンロードできない場合は、Alibaba クラウド ミラー リング ソースを試すことができます

docker pull registry.cn-hangzhou.aliyuncs.com/havenask/ha3_runtime:0.1 
./create_container.sh <CONTAINER_NAME> registry.cn-hangzhou.aliyuncs.com/havenask/ha3_runtime:0.1 

着陸コンテナ

./<CONTAINER_NAME>/sshme

インデックスの構築をテストします

USER がコンテナーにログインする前のユーザー名であるフル ボリューム インデックスを作成します

cd ~/havenask/example/scripts
python build_demo_data.py /ha3_install

テスト エンジン クエリ

havenaskエンジンを起動します

python start_demo_searcher.py /ha3_install

エンジンの既定のクエリ ポートは 45800 で、スクリプトを使用してクエリ テストを実行します。 ここではいくつかのテストqueryです。

python curl_http.py 45800 "query=select count(*) from in0"

python curl_http.py 45800 "query=select id,hits from in0 where MATCHINDEX('title', '搜索词典')"

python curl_http.py 45800 "query=select title, subject from in0_summary_ where id=1 or id=2"