label-studio - Label Studio は、標準化された出力形式を備えたマルチタイプのデータ ラベル付けおよび注釈ツールです。

(Label Studio is a multi-type data labeling and annotation tool with standardized output format)

Created at: 2019-06-19 10:00:44
Language: Python
License: Apache-2.0

GitHub label-studio:ビルド GitHub リリース

ウェブサイトドキュメントTwitterSlack コミュニティに参加する

レーベルスタジオとは?

Label Studio は、オープン ソースのデータ ラベル付けツールです。シンプルでわかりやすい UI を使用して、音声、テキスト、画像、動画、時系列などのデータ型にラベルを付け、さまざまなモデル形式にエクスポートできます。生データを準備したり、既存のトレーニング データを改善してより正確な ML モデルを取得したりするために使用できます。

さまざまなタイプのデータに注釈を付ける Label Studio の GIF

カスタム データセットをお持ちですか? ニーズに合わせて Label Studio をカスタマイズできます。詳細については、ブログの紹介記事をお読みください。

ラベルスタジオを試す

Label Studio をローカルにインストールするか、クラウド インスタンスに展開します。また、 Label Studio Teamsを試すこともできます。

Docker を使用してローカルにインストールする

公式の Label Studio docker イメージはここにあり、 でダウンロードできます

docker pull
。Docker コンテナで Label Studio を実行し、 でアクセスし
http://localhost:8080
ます。

docker pull heartexlabs/label-studio:latest
docker run -it -p 8080:8080 -v `pwd`/mydata:/label-studio/data heartexlabs/label-studio:latest

You can find all the generated assets, including SQLite3 database storage

label_studio.sqlite3
and uploaded files, in the
./mydata
directory.

Override default Docker install

You can override the default launch command by appending the new arguments:

docker run -it -p 8080:8080 -v `pwd`/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG

Build a local image with Docker

If you want to build a local image, run:

docker build -t heartexlabs/label-studio:latest .

Run with Docker Compose

Docker Compose script provides production-ready stack consisting of the following components:

  • Label Studio
  • Nginx - proxy web server used to load various static data, including uploaded audio, images, etc.
  • PostgreSQL - production-ready database that replaces less performant SQLite3.

To start using the app from

http://localhost
run this command:

docker-compose up

Install locally with pip

# Requires Python >=3.7 <=3.9
pip install label-studio

# Start the server at http://localhost:8080
label-studio

Install locally with Anaconda

conda create --name label-studio
conda activate label-studio
pip install label-studio

Install for local development

pip でパッケージをインストールしなくても、Label Studio の最新バージョンをローカルで実行できます。

# Install all package dependencies
pip install -e .
# Run database migrations
python label_studio/manage.py migrate
# Start the server in development mode at http://localhost:8080
python label_studio/manage.py runserver

クラウド インスタンスにデプロイする

Heroku、Microsoft Azure、または Google Cloud Platform でワンクリックで Label Studio をデプロイできます。

フロントエンドの変更を適用する

Label Studio アプリのフロントエンド部分は

frontend/
フォルダー内にあり、React JSX で記述されています。そこでいくつかの変更を行った場合は、インスタンスを構築/開始する前に次のコマンドを実行する必要があります。

cd label_studio/frontend/
npm ci
npx webpack
cd ../..
python label_studio/manage.py collectstatic --no-input

インストールのトラブルシューティング

インストール中にエラーが表示された場合は、インストールを再実行してみてください

pip install --ignore-installed label-studio

Windows に依存関係をインストールする

Windows で Label Studio を実行するには、Gohlke ビルドから次のホイール パッケージをダウンロードしてインストールし、正しいバージョンの Python を使用していることを確認します。

# Upgrade pip 
pip install -U pip

# If you're running Win64 with Python 3.8, install the packages downloaded from Gohlke:
pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl

# Install label studio
pip install label-studio

テスト スイートを実行する

pip install -r deploy/requirements-test.txt
cd label_studio

# postgres (assumes default postgres user,db,pass)
DJANGO_DB=default DJANGO_SETTINGS_MODULE=core.settings.label_studio python -m pytest -vv -n auto

# sqlite3
DJANGO_DB=sqlite DJANGO_SETTINGS_MODULE=core.settings.label_studio python -m pytest -vv -n auto

Label Studio から得られるもの

画像付きの Label Studio データ マネージャー グリッド ビューのスクリーンショット

  • マルチユーザー ラベル付けのサインアップとログイン。注釈を作成すると、それは自分のアカウントに関連付けられます。
  • 1 つのインスタンスですべてのデータセットを処理する複数のプロジェクト。
  • 合理化されたデザインにより、ソフトウェアの使用方法ではなく、タスクに集中できます。
  • 構成可能なラベル形式により、特定のラベル付けのニーズに合わせてビジュアル インターフェイスをカスタマイズできます。
  • 画像、音声、テキスト、HTML、時系列、動画など、複数のデータ タイプのサポート。
  • ファイルから、またはAmazon AWS S3、Google Cloud Storage、または JSON、CSV、TSV、RAR、および ZIP アーカイブのクラウド ストレージからインポートします。
  • 機械学習モデルとの統合により、さまざまなモデルからの予測を視覚化して比較し、事前にラベル付けを実行できます。
  • データ パイプラインに埋め込むREST API を使用すると、簡単にパイプラインに組み込むことができます

Label Studio にデータをラベル付けするための付属テンプレート

Label Studio には、データにラベルを付けるのに役立つさまざまなテンプレートが含まれています。また、特別に設計された構成言語を使用して独自のテンプレートを作成することもできます。ラベル付けの最も一般的なテンプレートとユース ケースには、次のケースが含まれます。

Label Studio で機械学習モデルを設定する

Label Studio Machine Learning SDK を使用して、お気に入りの機械学習モデルを接続します。次の手順を実行します:

  1. 独自の機械学習バックエンド サーバーを起動します。詳細な手順を参照してください。
  2. プロジェクト設定にあるモデル ページで、Label Studio をサーバーに接続します。

これにより、次のことが可能になります。

  • モデル予測を使用してデータに事前にラベルを付けます。
  • 新しい注釈が作成されている間に、オンライン学習を行い、モデルを再トレーニングします。
  • データ内の最も複雑な例のみにラベルを付けて、アクティブ ラーニングを実行します。

Label Studio を既存のツールと統合する

Label Studio を機械学習ワークフローの独立した部分として使用したり、フロントエンドまたはバックエンドを既存のツールに統合したりできます。

生態系

計画 説明
レーベルスタジオ サーバー、pip パッケージとして配布
ラベルスタジオフロントエンド React および JavaScript フロントエンドであり、Web ブラウザーでスタンドアロンで実行することも、アプリケーションに埋め込むこともできます。
データ管理者 データを管理するための React および JavaScript フロントエンド。Label Studio フロントエンドが含まれています。label-studio サーバーまたは予想される API メソッドを備えたカスタム バックエンドに依存します。
ラベルスタジオコンバーター お気に入りの機械学習ライブラリの形式でラベルをエンコードします
レーベルスタジオトランスフォーマー Label Studio で使用するために接続および構成された Transformers ライブラリ

ロードマップ

The Coolest Feature Xを使いたいのですが、Label Studio がサポートしていませんか? 私たちの公開ロードマップをチェックしてください!

引用

@misc{Label Studio,
  title={{Label Studio}: Data labeling software},
  url={https://github.com/heartexlabs/label-studio},
  note={Open source software available from https://github.com/heartexlabs/label-studio},
  author={
    Maxim Tkachenko and
    Mikhail Malyuk and
    Andrey Holmanyuk and
    Nikolai Liubimov},
  year={2020-2022},
}

ライセンス

このソフトウェアは、Apache 2.0 LICENSE © Heartexの下でライセンスされています。2020-2021