【2026年最新】Label Studio完全ガイド|使い方・料金・インストール方法を徹底解説

「AIモデルを作りたいけど、学習データのラベリングツールをどれにすれば?」——機械学習やLLMファインチューニングに取り組む人が最初にぶつかる壁のひとつです。

Label Studioは、HumanSignal社(旧Heartex)が開発するオープンソースのデータラベリングプラットフォームです。GitHub Stars 26,900超、Slackコミュニティ20,000名超を誇り、研究機関から国内外のAIスタートアップまで幅広く採用されています。最大の特徴は「マルチモーダル対応 × 無料で使える × 高いカスタマイズ性」という三拍子。テキスト・画像・音声・動画・時系列データを1つのプラットフォームで扱えます。

このガイドでは、Label Studioのインストール方法から料金、実際の使い方、競合ツールとの比較まで、2026年4月時点の最新情報をもとに徹底解説します。

Key Takeaway: Label Studioはオープンソースのデータラベリングツール。無料で始めて画像・テキスト・音声・動画に対応。インストール方法・使い方・料金・CVAT/Labelboxとの比較まで解説。

この記事の要点

  • Label Studioの特徴と得意なこと・苦手なこと
  • pip / brew / Docker でのインストール手順(コマンドつき)
  • Community・Starter Cloud・Enterpriseの料金比較
  • 画像・テキストアノテーションの実際の操作フロー
  • CVAT・Labelbox・V7との比較と選び方

30秒で結論

  • 無料でセルフホストしたい → Community Edition(完全無料、pip/Docker対応)
  • チームで使いたい・クラウド管理したい → Starter Cloud($99/月〜、約¥14,800/月)
  • セキュリティ・SSO・大規模運用 → Enterprise(要見積もり)
  • 画像特化で動画もラベリング → CVATのほうが向いている場合あり
  • カスタムUIを組み込みたいエンジニアチーム → Label Studioが最適解

Label Studioとは?特徴と活用シーン

Label Studioは、AIモデルの学習に必要なアノテーション(ラベリング)作業を効率化するオープンソースプラットフォームです。2019年の公開から急速に普及し、2026年4月時点でGitHub Stars 26,911を記録。オープンソースのデータラベリングツールとして世界最大規模のコミュニティを持ちます。

Label Studioで対応できるデータ種別

データ種別 代表的なタスク
画像 バウンディングボックス、セグメンテーション、キーポイント
テキスト 固有表現認識(NER)、感情分析、テキスト分類
音声 文字起こし、感情ラベリング、話者分離
動画 オブジェクト追跡、行動認識、シーン分類
時系列 異常検知、信号分類
PDF・文書 OCR、レイアウト解析、文書AI
LLM評価 回答品質評価、応答比較、RLHF用データ作成

特に強みを発揮するユースケース

① LLMファインチューニング用データ作成 ChatGPTClaudeのような生成AIを自社データでファインチューニングするには、高品質な教師データが不可欠です。Label StudioはLLM応答の評価・比較・ランキングに特化したテンプレートを備えており、RLHF(人間のフィードバックによる強化学習)用のデータセット構築に適しています。

② 医療・金融・法務など機密データのアノテーション クラウドサービスにデータをアップロードしたくない場合でも、Label StudioはオンプレミスやローカルPCで動作するため、個人情報・医療情報を含むデータも安全に扱えます。

③ 複数データタイプを横断するMLプロジェクト 自動運転・監視カメラ・マルチモーダルAIなど、画像+音声+テキストを同時に扱うプロジェクトでも、1つのプラットフォームに統合できます。


料金プラン徹底比較

Label Studioは3つのエディションを提供しています(2026年4月時点)。

プラン 月額費用 ホスティング 主な特徴
Community Edition 無料 セルフホスト 全コア機能、ユーザー数無制限(全員管理者権限)
Starter Cloud $99/月〜(約¥14,800) クラウド管理 RBAC、品質レビュー、追加ユーザー$49/月(最大12名)
Enterprise 要見積もり クラウド/オンプレ SSO、LDAP/SAML、監査ログ、HIPAA対応、QAダッシュボード

各プランの選び方

Community Editionが向いている人:

  • 個人・研究者・スモールチームで試したい
  • Dockerやpipで自前運用できるエンジニア
  • 機密データをローカルで扱いたい

Starter Cloudが向いている人:

  • インフラ管理をしたくない3〜12名のチーム
  • レビュアーとアノテーターのロール分離が必要
  • クラウドストレージ(S3・GCS・Azure)と連携したい

Enterpriseが向いている人:

  • 100名以上の大規模チームや企業
  • SSOやSCIMでユーザー管理を一元化したい
  • SOC2・HIPAA・エアギャップ環境が必須要件

ポイント: 料金の大きな変更があり、Starter Cloudは以前の$149/月から$99/月に値下がりしました。追加ユーザーも$99/月→$49/月に改定されています(2026年現在)。


インストール方法(3通り)

Label StudioのCommunity Editionは、pip・brew・Dockerの3通りでインストールできます。初心者にはpipかDockerがおすすめです。

方法1:pip(Python環境がある方・最もシンプル)

Pythonがインストールされていれば、2コマンドで起動できます。

# 仮想環境を作成して有効化(推奨)
python -m venv ls-env
source ls-env/bin/activate  # Windowsは: ls-env\Scripts\activate

# Label Studioをインストール
pip install label-studio

# 起動(デフォルトはhttp://localhost:8080)
label-studio

初回起動時にブラウザが自動で開きます。サインアップ画面でメールアドレスとパスワードを設定すればすぐに使えます。

### 方法2:brew(Macユーザー向け)

```bash
# tapリポジトリを追加
brew tap humansignal/tap

# インストール
brew install humansignal/tap/label-studio

# 起動
label-studio

### 方法3:Docker(本番運用・チーム利用に推奨)

```bash
# 基本的なDockerコンテナ起動
docker run -it \
  -p 8080:8080 \
  -v $(pwd)/mydata:/label-studio/data \
  heartexlabs/label-studio:latest

# ローカルファイルアクセスを許可する場合
docker run -it \
  -p 8080:8080 \
  -v $(pwd)/mydata:/label-studio/data \
  --env LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true \
  --env LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT=/label-studio/files \
  -v $(pwd)/myfiles:/label-studio/files \
  heartexlabs/label-studio:latest

チームで利用する場合はDocker Compose版も公式GitHubで公開されており、PostgreSQLとnginxをセットで構成できます。

> <strong>注意</strong>: MacでSafariを使うとうまく動作しない場合があります。<strong>Google Chromeを推奨</strong>します。

---

## 使い方:プロジェクト作成〜アノテーション完了まで

Label Studioの基本的な操作フローは「プロジェクト作成 → データインポート → ラベリング設定 → アノテーション → エクスポート」の5ステップです。

### STEP 1:プロジェクトを作成する

1. ブラウザで `http://localhost:8080` にアクセス
2. サインアップまたはログイン
3. 「Create Project」をクリック
4. プロジェクト名を入力して「Save」

### STEP 2:データをインポートする

プロジェクト設定の「Data Import」タブから、以下の方法でデータを取り込めます。

- <strong>ローカルファイルのアップロード</strong>: 「Upload Files」で直接ドラッグ&ドロップ
- <strong>クラウドストレージ連携</strong>: S3・GCS・Azure Blob Storageをソースとして設定
- <strong>URLによるインポート</strong>: 画像URLのリストをCSVやJSON形式で読み込み

### STEP 3:ラベリング設定(テンプレートを選ぶ)

「Labeling Setup」タブで、アノテーションの種類を選びます。以下のカテゴリから100種類以上のテンプレートが用意されています。

| カテゴリ | テンプレート例 |
|---|---|
| Computer Vision | Object Detection with Bounding Boxes、Image Segmentation |
| Natural Language Processing | Named Entity Recognition、Text Classification |
| Audio/Speech | Speech Transcription、Speaker Diarization |
| Conversational AI | Chatbot Response Evaluation、Intent Classification |
| Generative AI | LLM Response Evaluation、Pairwise Comparison |

例:画像の物体検出(バウンディングボックス)の場合は「Object Detection with Bounding Boxes」を選び、ラベル名(「car」「person」「bike」など)を設定するだけです。

### STEP 4:アノテーション作業

タスク一覧から画像・テキスト・音声をクリックするとラベリング画面が開きます。

<strong>画像アノテーションの操作方法:</strong>
- ラベル名をクリック(またはキーボードの数字キー)でモード選択
- マウスでドラッグして枠を作成
- `u`キーで選択解除、`Backspace`で削除
- 「Submit」で確定、「Skip」でスキップ

<strong>ショートカットキー一覧(画像アノテーション時):</strong>

| キー | 動作 |
|---|---|
| 1〜9 | 対応するラベルを選択 |
| u | 選択解除 |
| Backspace | 選択中の枠を削除 |
| Ctrl+Z | 一つ戻る |
| ← → | 前後のタスクへ移動 |

### STEP 5:アノテーション結果をエクスポート

完了したアノテーションは複数形式でエクスポートできます。

JSON / JSON-MIN / CSV / TSV / COCO / YOLO / Pascal VOC XML

機械学習フレームワークに直接投入できる形式(COCO形式やYOLO形式)もワンクリックでエクスポート可能です。

---

## MLバックエンド連携:AI補助ラベリングを活用する

![MLバックエンド連携による事前ラベリングの流れ](/article-images/label-studio-guide-2026-1.png)

Label StudioとMLモデルを連携させると、AIが事前ラベリングを行い、人間がチェック・修正するだけで効率が大幅に上がります。この機能を「MLバックエンド」と呼びます。

```python
# mlbackend/model.py(最小構成例)
from label_studio_ml.model 
class MyModel(LabelStudioMLBase):
    def predict(self, tasks, **kwargs):
        # 既存のMLモデルを使って予測
        predictions = []
        for task in tasks:
            predictions.append({
                "result": [
                    {
                        "type": "rectanglelabels",
                        "from_name": "label",
                        "to_name": "image",
                        "value": {
                            "x": 10, "y": 10, "width": 50, "height": 50,
                            "rectanglelabels": ["car"]
                        }
                    }
                ]
            })
        return predictions

```bash
# MLバックエンドサーバーを起動
label-studio-ml start ./mlbackend

Label StudioのプロジェクトSettings > MLで `http://localhost:9090` を登録すると、アノテーション画面でAIが自動的に候補を表示します。

---

## 競合ツールとの比較:どれを選ぶべきか

Label Studioの位置づけを競合ツールと比較します。

| 項目 | Label Studio | CVAT | Labelbox | V7 |
|---|---|---|---|---|
| <strong>提供形態</strong> | OSS / クラウド | OSS / SaaS | SaaS | SaaS |
| <strong>無料プラン</strong> | ✅ 完全無料(CE) | ✅ OSS版 | ❌ トライアルのみ | ❌ トライアルのみ |
| <strong>対応データ</strong> | マルチモーダル全般 | 主に画像・動画 | 画像・テキスト中心 | 画像・動画特化 |
| <strong>動画強度</strong> | △ 基本対応 | ◎ トラッキングが強力 | ○ 標準対応 | ◎ 高精度 |
| <strong>LLM評価</strong> | ◎ 専用テンプレートあり | ✗ | ○ | △ |
| <strong>セルフホスト</strong> | ◎ ローカル対応 | ◎ | ✗ | ✗ |
| <strong>有料最安</strong> | $99/月 | CVAT Cloudは要問合せ | 要問合せ | 要問合せ |
| <strong>カスタムUI</strong> | ◎ XML設定で柔軟 | ○ | ○ | △ |

### 用途別おすすめ

<strong>Label Studioを選ぶべき人:</strong>
- 複数種類のデータ(テキスト・画像・音声混在)をまとめて扱いたい
- LLMやRAGの評価データを作りたい
- 機密データをローカル環境で扱いたい
- エンジニアチームで柔軟にカスタマイズしたい

<strong>CVATが向いているケース:</strong>
- 動画の細かいフレーム単位アノテーションやオブジェクト追跡が主な用途
- コンピュータビジョン特化のチーム

<strong>Labelboxが向いているケース:</strong>
- クラウドネイティブ環境で大規模チームを管理したい
- エンタープライズサポートが必須

---

## 編集部の検証メモ

### 検証の観点

データラベリングツールは「対応データ形式の広さ」「導入コスト(無料枠とセルフホスト可否)」「チーム運用の現実性(権限管理・API・拡張性)」の3軸で比較するのが妥当です。AIモデル開発の現場では、画像だけ・テキストだけで完結するケースは少なく、マルチモーダル対応と運用フェーズでのスケール耐性が選定の分かれ目になります。

### 公開情報からの比較整理

公式ドキュメントと料金ページを突き合わせて整理すると、各ツールの立ち位置は次のように分かれます。

| ツール | 料金体系 | 対応データ | セルフホスト | 日本語UI |
|--------|---------|-----------|-------------|---------|
| Label Studio | Community無料 / Cloud $99〜 / Enterprise要問合せ | 画像・テキスト・音声・動画・時系列 | 可(OSS) | 部分対応 |
| CVAT | OSS無料 / Cloud有料プランあり | 画像・動画中心 | 可(OSS) | 部分対応 |
| Labelbox | 無料枠あり / 従量課金 | マルチモーダル | 不可(SaaS) | 英語中心 |
| V7 | 要問合せ(商用中心) | 画像・動画・医療画像 | 不可(SaaS) | 英語中心 |

商用利用条件・最新の価格は各公式サイトで必ず確認してください。

### 編集部の総合判断

- <strong>個人研究者・コスト最優先のスタートアップ</strong> → Label Studio Community Edition。pip/Docker で立ち上げられ、マルチモーダルを1ツールで完結できる。
- <strong>動画アノテーション中心・トラッキング重視</strong> → CVAT のほうが UI が動画特化で扱いやすい場面が多い。
- <strong>チーム運用・SSO・監査ログが必要な企業</strong> → Label Studio Enterprise か Labelbox を比較検討するのが現実的。

## よくある質問

### Q. Label Studioは日本語で使えますか?

UIは英語ですが、アノテーション対象のデータ(テキスト・音声)は完全に日本語対応しています。日本語テキストのNERや感情分析にも問題なく使えます。なおコミュニティはSlack・GitHub中心で、公式ドキュメントは英語です。

### Q. 商用利用はできますか?

Community Edition(OSS)はApache License 2.0で提供されており、<strong>商用利用が可能</strong>です。ただし、Starter Cloud / Enterprise プランの利用規約は別途確認が必要です。

### Q. 既存のMLフレームワークと連携できますか?

はい。REST APIとPython SDKが充実しており、TensorFlow・PyTorch・Hugging Faceなどとの連携が可能です。また、MLbackend機能を使えばAI事前ラベリングを組み込めます。クラウドストレージはAWS S3、Google Cloud Storage、Azure Blob Storageに対応しています。

### Q. アノテーター向けのロール管理はできますか?

Community Editionでは全ユーザーが管理者権限のため、ロール分離はできません。<strong>Starter Cloud以上</strong>でロールベースアクセス制御(RBAC)が使え、Owner・Admin・Manager・Reviewer・Annotatorの5つのロールを割り当てられます。

### Q. どれくらいのデータ量を扱えますか?

Community Editionではデータ量の制限はありません。Starter Cloudでは12ユーザーまでのチームで利用でき、エンタープライズ規模のデータ量には Enterprise を選ぶのが現実的です。

### Q. v1.23.0で追加された機能は何ですか?

2026年3月13日にリリースされたLabel Studio 1.23.0では、<strong>ベクターアノテーション機能</strong>、インタラクティブなタスクソースビューワー、Data Managerのワークフロー改善が追加されました。また、Advanced PDF + OCRインターフェースにより、文書AI向けのアノテーション精度が向上しています。

---

## LLMファインチューニングへの応用:Label Studioをデータパイプラインに組み込む

2026年現在、Label Studioの需要が急増している理由のひとつが<strong>LLMファインチューニング用データの作成</strong>です。[ChatGPT](/tool/chatgpt)や[Claude](/tool/claude)のような大規模言語モデルを自社データで特化させるには、大量の高品質な教師データが必要です。

### RLHF(人間のフィードバックによる強化学習)データの作成

RLHFは、OpenAIがGPT-4の品質向上に使った手法で「人間の評価者がAIの回答を比較・ランキングし、その結果でモデルを訓練する」仕組みです。Label Studioにはこのワークフローに特化した「Pairwise Comparison」テンプレートが用意されています。

<strong>典型的なRLHFデータ作成フロー:</strong>

1. LLMに同じプロンプトへの回答を複数生成させる
2. Label Studioで回答をペアで表示し、アノテーターが「どちらが良い回答か」を評価
3. 評価結果をJSON形式でエクスポート
4. Reward Model(報酬モデル)のトレーニングに利用
5. PPO(Proximal Policy Optimization)でLLMを微調整

```json
// エクスポートされるRLHFデータの例
{
  "prompt": "日本の首都について教えてください",
  "chosen": "東京は日本の首都で、世界最大級の都市のひとつです。",
  "rejected": "首都は東京です。",
  "annotator_preference": "chosen",
  "confidence": 0.92
}

### RAG(検索拡張生成)評価データの作成

RAGシステムの品質評価にもLabel Studioが活用されています。ユーザーの質問・検索結果・LLMの回答の三つ組みに対して、「正確性」「関連性」「根拠の明確さ」などの軸でアノテーターが評価します。

```json
// RAG評価データ形式例
{
  "question": "2026年のAIツール市場規模は?",
  "retrieved_context": "...",
  "answer": "...",
  "faithfulness": 4,
  "relevance": 5,
  "correctness": 3
}

---

## アノテーター品質管理:大規模プロジェクトでの活用

![複数ラベル結果を照合して品質を管理する仕組み](/article-images/label-studio-guide-2026-2.png)

Label Studioでは複数アノテーターが同じタスクにラベリングを行い、<strong>アノテーター間一致率(Inter-Annotator Agreement, IAA)</strong>を計算して品質を管理できます。

### アノテーター品質を高める3つのプラクティス

<strong>① ガイドライン設計を徹底する</strong>
ラベル定義が曖昧だと、アノテーター間でブレが生じます。「どこからどこまでがpositive感情か」を具体的な例文とともに明示することが重要です。Label Studioのプロジェクト設定に「Instructions」を記入できます。

<strong>② 校正タスク(Calibration Tasks)を挟む</strong>
アノテーター全員に同じ10〜20タスクを割り当て、一致率を測定します。一致率が低い場合はガイドライン修正や追加トレーニングのサインです。

<strong>③ レビュアーワークフローを設定する(Starter Cloud以上)</strong>
アノテーターが提出した結果をレビュアーが承認・却下できるワークフローを設定します。

### Inter-Annotator Agreement(IAA)の計算

```python
# Python SDKを使ったIAA計算例
from label_studio_sdk 
ls = Client(url='http://localhost:8080', api_key='YOUR_API_KEY')
project = ls.get_project(project_id=1)

# タスクとアノテーションを取得
tasks = project.get_labeled_tasks()

# Cohen's Kappa係数などで一致率を計算
from sklearn.metrics 
annotator_1_labels = [...]
annotator_2_labels = [...]

kappa = cohen_kappa_score(annotator_1_labels, annotator_2_labels)
print(f"Cohen's Kappa: {kappa:.3f}")  # 0.8以上が目安

---

## Label Studio導入ロードマップ:個人〜企業規模別

### 個人・研究者(Community Edition)

| フェーズ | やること | 期間目安 |
|---|---|---|
| 1. 環境構築 | pip install → ローカル起動 | 30分 |
| 2. 最初のプロジェクト | テンプレートで100件アノテーション | 1〜2時間 |
| 3. MLバックエンド連携 | 既存モデルをAPI経由で事前ラベリング | 1〜2日 |
| 4. エクスポート・学習 | COCO/YOLO形式でエクスポートしてモデル訓練 | プロジェクトによる |

### スモールチーム(Starter Cloud)

1. <strong>14日間無料トライアルで評価</strong>:実プロジェクトのデータ100〜500件でワークフローを検証
2. <strong>ロール設定</strong>:Owner(管理者)・Annotator(アノテーター)・Reviewer(レビュアー)を割り当て
3. <strong>クラウドストレージ連携</strong>:S3バケットを直接ソースとして設定し、大量データを効率的に処理
4. <strong>品質モニタリング</strong>:IAAダッシュボードで週次レポートを確認

### 企業・大規模チーム(Enterprise)

- <strong>SSO/SCIM統合</strong>:Active DirectoryやOktaと連携してユーザー管理を自動化
- <strong>RBAC設計</strong>:部署・プロジェクト・データ感度別に権限グループを設計
- <strong>監査ログ</strong>:誰がいつ何をラベリングしたか全記録を保持(HIPAA・GDPR対応)
- <strong>Kubernetes展開</strong>:高可用性構成でダウンタイムゼロを実現

---

## Label Studioの注意点と限界

Label Studioは優れたツールですが、すべての用途に最適というわけではありません。導入前に把握しておくべき点を整理します。

### 向いていないケース

- <strong>3Dポイントクラウドのアノテーション</strong>:自動運転向けの3Dリダール点群には対応が限定的。専用ツール(Scale AI、BasicAI等)が適しています。
- <strong>高フレームレート動画の細かいトラッキング</strong>:CVATのほうが動画特化機能が充実しています。
- <strong>ノンエンジニアがすぐに使いたいケース</strong>:Community Editionはセットアップに技術知識が必要です。SaaSツール(Labelbox等)のほうが手軽です。

### セキュリティ上の注意点

Community Editionでは全ユーザーが管理者権限になるため、外部に公開するサーバーではアクセス制御が不十分です。本番運用では:

```bash
# 環境変数でDBクレデンシャルを管理(ハードコードしない)
export LABEL_STUDIO_DB_USER="ls_admin"
export LABEL_STUDIO_DB_PASS="YOUR_SECURE_PASSWORD"

# リバースプロキシ(nginx)でHTTPS化必須
# 外部公開する場合は認証レイヤーを追加すること

ロール分離・SSO・監査ログが必要なら、Starter Cloud以上への移行を強く推奨します。

## 関連記事

- [【2026年最新】Letta AI(旧MemGPT)完全ガイド|使い方・料金・始め方を徹底解説](/mag/letta-ai-guide-2026)
- [【2026年最新】Luma AI完全ガイド|使い方・料金・Ray3の実力を徹底解説](/mag/luma-ai-guide-2026)
- [【2026年最新】6sense完全ガイド|AIインテントデータの使い方・料金・始め方を徹底解説](/mag/6sense-guide-2026)