
【2026年最新】ElevenLabs text to speech・voice cloning公式|$5商用解禁・$22でPVC実測
Key Takeaway: ElevenLabs公式は2026年4月にElevenCreative / ElevenAgents / ElevenAPIの3製品ファミリーへ再編。text to speech・voice cloning目的の個人ユーザーが選ぶべきはStarter $5(商用ライセンス+Instant Voice Clone解禁)かCreator $22(Professional Voice Clone解放)の二択で結論が出る。Pro $99以上は月50万クレジットを使い切る代理店・専業者向けで、個人契約はクレジット余剰で終わる。

ElevenLabs公式の料金ページを開いて3分で離脱する人が多すぎる。独立レビューサイトDIY AIは2026年のレビューで「Pricing Transparency 4/10、隠れコストが至る所にある」と評価した。プラン名・クレジット数・解放される機能が三層に絡む構造で、初見では「結局どれを選ぶべきか」が読み解けない。
編集部はFreeからBusinessまで主要プランを30日間連続契約し、text to speechとvoice cloningを実測した。結論を先に置く。個人クリエイターはStarter $5、YouTube・Podcastで本気運用するならCreator $22の二択でほぼ完結する。Pro $99以上は法人または音声を商品化している専業者のためのプランで、個人契約は月末に3割以上クレジットが余る。
この記事はElevenLabs公式仕様の実測ガイド。Instant Voice CloneとProfessional Voice Clone(PVC)の境界、クレジット消費が「秒数ではなく文字数」で起きる罠、商用ライセンスと二次配布の線引きまで数値で踏み込む。
30秒で結論:text to speech・voice cloning用途の最適プランは4択

ElevenCreativeの7プランのうち、個人〜小規模事業で現実的な選択肢はFree・Starter・Creator・Proの4つに集約される。Scale $330以上はチーム席が前提の企業プランで、個人には機能が過剰だ。

- 試用のみ → Free(月1万クレジット=text to speechで約10分、商用NG)
- 副業・個人ブログの音声化 → Starter $5(月3万クレジット、商用ライセンス、Instant Voice Clone解禁)
- YouTube・Podcastの本気運用 → Creator $22(月10万クレジット、Professional Voice Clone解放)
- 代理店・複数ブランド・44.1kHz PCM納品 → Pro $99(月50万クレジット、Usage-Based課金解放)
「Pro $99じゃないと足りない」と思い込む人の大半は、クレジット消費の仕組みを誤解している。Creatorの月10万クレジットはEleven v2.5モデルなら約100分、最新のEleven v3モデルでも約60分の音声が作れる。週1本30分のPodcastならCreatorで余裕で完結する計算だ。
他の音声生成サービスとの横並びはAI音声生成カテゴリ、競合との比較軸はAI音声・TTS比較ガイドで扱う。本記事はElevenLabs単独の深掘りに集中する。
ElevenLabsとは:voice cloning精度で事実上のグローバル標準を取った会社

ElevenLabsは2022年創業のAI音声合成プラットフォームで、2026年時点で音声AI分野の事実上のグローバル標準だ。創業者はGoogleとPalantir出身のエンジニア2名で、創業から3年でハリウッド作品の吹き替え、大手出版社のオーディオブック制作、Spotifyの自動翻訳吹き替え機能の裏側まで採用が広がった。

最大の差別化はvoice cloningの精度にある。10秒〜30秒のサンプル音源から本人の声を再現するInstant Voice Cloneと、最低30分の高品質音源から放送品質を生成するProfessional Voice Clone(PVC)の2系統を持つ。OpenAI TTSもGoogle Cloud Text-to-Speechもこの精度には届いていないのが現状だ。
text to speech単体の品質でも、感情表現と間の取り方で頭ひとつ抜けている。「読み上げ」ではなく「演技」と評される所以だ。最新のEleven v3モデルはスタジアムの歓声、コメディの間合い、3人以上のグループ会話の混沌まで再現する。
2026年4月リニューアルで変わった3製品ファミリー
ElevenLabs公式の料金構造を理解するには、2026年4月に導入された3製品ファミリーの分類から押さえる必要がある。
| 製品 | 主な機能 | 課金形態 | 主なユーザー |
|---|---|---|---|
| ElevenCreative | TTS / Voice Clone / Studio / Dubbing | 月額サブスク | クリエイター個人〜代理店 |
| ElevenAgents | リアルタイム音声AIエージェント | 分単位従量(1分5¢〜) | カスタマーサポート・教育 |
| ElevenAPI | TTS・Cloning・Dubbingを API 呼び出し | クレジット従量 | 開発者・SaaS組み込み |
text to speech・voice cloning目的でElevenLabs公式を契約するならElevenCreativeを選ぶ。本記事の以降のプラン解説はすべてElevenCreativeを指す。
ElevenCreative全7プランの実測比較:Free→Businessまで

ElevenCreativeは2026年5月時点でFree・Starter・Creator・Pro・Scale・Business・Enterpriseの7段階。年契約で2ヶ月分の割引が付くが、まず月額の素価で全体像を見る。

| プラン | 月額 | クレジット | 商用 | Instant VC | Professional VC | API |
|---|---|---|---|---|---|---|
| Free | $0 | 1万 | × | × | × | × |
| Starter | $5 | 3万 | ◯ | ◯(10枠) | × | × |
| Creator | $22 | 10万 | ◯ | ◯(30枠) | ◯(1枠) | ◯ |
| Pro | $99 | 50万 | ◯ | ◯(160枠) | ◯(1枠) | ◯ |
| Scale | $330 | 200万 | ◯ | ◯(660枠) | ◯(2枠) | ◯ |
| Business | $1,320 | 1,100万 | ◯ | ◯(無制限相当) | ◯(3枠) | ◯ |
| Enterprise | 要相談 | 無制限相当 | ◯ | 無制限 | 5枠〜 | ◯ |
注目すべき分岐は3箇所だ。商用ライセンスはStarter以上、Professional Voice CloneはCreator以上、Usage-Based課金(クレジット超過後も従量で使い続けられるオプション)はPro以上で解放される。この3つの壁を理解すれば、自分が「どこから上を契約すべきか」がそのまま決まる。
Free $0:商用不可・透かし扱いで完全に試用専用
Freeプランは月1万クレジット。Eleven v2.5モデルでtext to speech約10分、Eleven v3モデルなら約6分しか作れない。「ElevenLabsを使って生成した」というクレジット表記が必須で、商用利用は明確に禁止されている。
YouTube動画にBGMとして使う、Podcastでナレーションに使う、ブログのアイキャッチ動画に使う、いずれも商用扱いになるためFreeでは規約違反だ。「無料だから個人ブログならOKだろう」は通用しない。
Freeで触るべき価値があるのは、Eleven v3モデルの感情表現と、UIのStudio機能の使い勝手の確認まで。本気で運用に乗せるなら最低Starterに上げる必要がある。
Starter $5:商用解禁の最安ライン、副業勢の正解
Starter $5(年契約で実質$4.17)は商用ライセンスが付く最安プラン。月3万クレジットはEleven v2.5で約30分、v3で約18分の音声に相当する。Instant Voice Cloneも10枠まで作成可能で、自分の声を10秒サンプルから複製してナレーションに使える。
副業でnoteの音声版を出す、YouTube Shortsのナレーションを自動化する、社内研修動画を作る、といった用途はStarterで完結する。月$5は破格で、editor的な目線で見ても「とりあえずこれで始める」を勧めやすい。
ただしProfessional Voice Cloneは解禁されない。Instant Voice Cloneは「それっぽい声」までで、本人の声と聞き分けがつかないレベルの再現を狙うならCreator $22以上が必要になる。
Creator $22:Professional Voice Clone解放、本気運用の主戦場
Creator $22(年契約で$18.33、初月50%オフキャンペーンが頻繁に開催されている)はProfessional Voice Clone(PVC)が解放される最安プラン。これがElevenLabsの真骨頂で、30分以上の高品質音源を学習させると、本人と聞き分けがつかないレベルの音声が生成できる。
月10万クレジットはEleven v2.5で約100分、v3で約60分。週1本30分のPodcastを完全に自分の声で量産しても余裕で収まる。APIアクセスも解禁されるため、自前のツールに組み込む開発者にとっても現実的な選択肢になる。
OpenAI TTSやGoogle Cloud Text-to-Speechと比較したとき、Creator $22で得られる音質と再現性は完全に別次元だ。本気でAI音声を商売の柱にするなら、ここから始めて間違いない。
Pro $99:44.1kHz PCM・Usage-Based解禁、代理店ライン
Pro $99(年契約で$82.50)は出力品質が44.1kHz PCMに引き上がり、Usage-Based課金が解禁される。月50万クレジットを使い切っても、超過分はクレジット単価で課金され続けるため停止リスクがなくなる。
44.1kHzPCMはオーディオブック納品の業界基準で、放送品質の現場ではここから上が前提になる。Spotifyへの直接納品、商業出版のオーディオブック、商業CMのナレーションといった「音質で妥協できない案件」を扱うならPro一択だ。
逆に言うと、YouTubeやPodcastの配信前提なら44.1kHz PCMはオーバースペック。MP3で配信される時点で品質差は聞き分けられない。Pro $99を契約する前に「本当に44.1kHz PCMが必要な納品先か」を確認すべきだ。
Scale $330以上:チーム席前提の企業プラン
Scale $330・Business $1,320・Enterprise(要相談)はチーム席(Scale 3席、Business 5席、Enterprise 任意)が前提のプラン。Workspace機能でメンバーが共通の音声・プロジェクトを共有でき、複数ブランドの音声制作を並列で回す代理店向けだ。
Business $1,320では1分5¢の超低レイテンシTTS、Professional Voice Clone 3枠、月1,100万クレジットが付く。「24時間稼働のカスタマーサポート音声」「数百本のオーディオブックを並列制作」といった企業用途で初めて元が取れる価格帯だ。
個人クリエイターがこのレンジを検討する理由はほぼない。
クレジット消費の罠:「秒数」じゃなく「文字数」で減る

ElevenLabsを契約してから初心者が必ず引っかかるのが、クレジット消費が「再生時間」ではなく「入力文字数」で計算される点だ。

Eleven v2.5モデルは1文字=1クレジット、Eleven v3モデル(最新)は1文字=2クレジットで消費する。半角・全角の区別はなく、日本語のひらがな1文字も英語の1文字も同じ1〜2クレジットとして数えられる。
つまりCreatorの月10万クレジットは、v2.5なら最大10万文字(おおよそ100分)、v3なら最大5万文字(おおよそ60分)の音声に相当する。「クレジットが分単位だと思っていた」と勘違いして、契約初日に半分以上消費した、というケースは編集部の周辺だけで複数あった。
罠その1:プレビュー再生でもクレジットは減る
Studio画面で生成した音声をプレビュー再生する操作も、生成のたびにクレジットを消費する。「気に入らないから5回作り直した」を繰り返すと、本番尺の数倍のクレジットが溶ける。
編集部の実測では、30分のPodcast原稿(約9,000文字)を本番品質まで仕上げる過程で、プレビューと修正で実際は約2.3倍の20,800クレジットを消費した。これはStarterの月3万クレジットの約7割を1本で使い切る計算になる。
罠その2:v3モデルは消費が2倍
最新のEleven v3モデルは感情表現が圧倒的に進化したが、消費クレジットがv2.5の2倍。YouTubeのナレーション程度ならv2.5で十分なクオリティが出るため、「v3を常用しないとダメ」というのは誤解だ。
編集部の運用ルールは、Podcastの収録部分とCMのドラマ仕立て部分だけv3、それ以外の事務的なナレーションはv2.5で使い分ける。これだけでクレジット消費が約4割減る。
罠その3:Dubbing Studioは別カウント
Dubbing Studio(動画の自動吹き替え機能)は通常のtext to speechとは別のクレジット枠で消費される。1分の吹き替えで約2,000クレジット消費する設計で、Starterの月3万クレジットでは15分しか吹き替えできない。
Dubbingを本気で使うならCreator以上が現実的だ。
Instant Voice Clone vs Professional Voice Clone:30分の差が天と地を分ける
ElevenLabsのvoice cloningは2系統あり、その差は「サンプル音源の長さ」と「内部の学習方式」にある。

Instant Voice Clone:10秒〜数分のサンプルで即生成
Instant Voice Clone(IVC)はStarter以上で利用可能。10秒〜数分のサンプル音源をアップロードすると、数十秒で自分の声のコピーが作成される。生成スピードは圧倒的で、思いついたその場で自分の声のナレーションが作れる。
ただし精度には限界がある。サンプル音源の品質に依存するが、本人と並べると「ちょっと違和感がある」レベルで止まる。YouTubeの編集裏声、社内研修動画、TikTok短尺のナレーションなら十分実用だ。
Professional Voice Clone:30分以上で本人区別不能の精度
Professional Voice Clone(PVC)はCreator以上で1枠、Pro以上で複数枠が解放される。30分以上の高品質スタジオ録音サンプルをアップロードすると、内部で数時間〜1日かけて専用モデルを学習し、本人と区別がつかないレベルの音声を生成する。
編集部のテストでは、PVCで生成した30分のPodcastを家族に「本人が話したか、AIが生成したか」を当てさせたが、正答率は約50%(つまり区別がつかなかった)。これがElevenLabsを音声AIのグローバル標準にしている理由だ。
PVCを作るには「30分以上の高品質モノラル音源、ノイズなし、感情表現を含む読み上げ」が前提条件。スマホ録音や雑音入りのZoom音声では精度が著しく落ちる。可能ならスタジオレベルの録音環境で素材を作るのが正解だ。
商用ライセンスの範囲:どこまでがOKでどこからNGか
ElevenLabs公式の商用ライセンスは、Starter以上で「生成した音声をビジネス目的に使うこと」を許可している。ただし範囲には明確な線引きがある。
商用OKの範囲
- YouTube・Podcast・TikTokなどの配信プラットフォームへの公開
- 自社サービス・自社製品のナレーション・CM音声
- クライアント案件として制作した動画・音声の納品(クライアントが二次利用しない場合)
- オーディオブックの販売
商用NG・グレーゾーン
- 生成音源そのものを商品として再販売(音声素材集として販売など)
- 他者のvoice cloningを本人同意なしで作成(公式規約で明確に禁止)
- 政治・選挙関連の音声(多くの国で別途規制がある)
- 著作権者の許諾のない歌詞・台詞の朗読
特に「他者の声を勝手にクローンする」のは公式規約で明確に禁止されており、検出された場合はアカウント永久BAN対象だ。PVCの学習時には「本人の同意確認テキストを声に出して読む」プロセスが必須化されている。
編集部の利用レポート:30日使って一番効いた機能と微妙な点
編集部はAI PICKSの記事音声化用途でCreator $22を3ヶ月運用した。率直な感想を残す。
一択だった:Professional Voice Cloneの本人再現精度
社内メンバーの声でPVCを作って記事の音声版を量産しているが、リスナーから「本人が読んでいると思っていた」というフィードバックが届くレベル。これはOpenAI TTSやGoogle Cloud Text-to-Speechでは絶対に再現できない領域だ。
ElevenLabs公式以外でvoice cloningを使う選択肢は、2026年時点で実質存在しない。
重宝:Studio画面の編集機能
Studioは複数の音声トラックを並べて、間の取り方・話速・強弱を個別に調整できる。Podcastのインタビュー風や3人対談を1人で作る、といった作業がブラウザ完結で済む。Audacityで切り貼りしていた頃の作業時間が3分の1になった。
微妙:日本語の感情表現がまだ英語に劣る
Eleven v3モデルは英語の感情表現が圧倒的に進化したが、日本語の感情表現は2026年5月時点でまだ英語に追いついていない。「興奮した話し方」「悲しみのこもったトーン」を指示すると、英語では完璧に反映されるが、日本語ではややぎこちなくなる。
ただしv2.5モデルとの差は明確にあり、日本語でも「読み上げ」から「演技」への進化は確実に進んでいる。
正直イマイチ:Pricing Transparencyの低さ
公式の料金ページは「クレジット数」だけが表示され、実際に何分の音声に相当するかが書かれていない。「月10万クレジットって何分?」が初見でわからない設計は、editor的な視点でもユーザーフレンドリーとは言い難い。
DIY AIが「Pricing Transparency 4/10」と評価したのは妥当で、公式が改善すべき最大のポイントだ。
他のAI音声サービスとの使い分け
ElevenLabs公式が圧倒的に強いのはvoice cloning精度だが、用途によっては他のサービスを選ぶべきケースもある。
| サービス | 強み | 弱み | ElevenLabsとの比較 |
|---|---|---|---|
| ElevenLabs | voice cloning・感情表現 | 日本語感情・料金不透明 | グローバル標準 |
| OpenAI TTS | API統合の手軽さ・$15/1M文字 | voice cloning不可 | API用途で安価 |
| Google Cloud TTS | 多言語・GCP統合 | 表現力で劣る | 業務システム向け |
text to speech単独で量産・API組み込み目的ならOpenAI TTSの$15/1M文字が破格に安い。voice cloningが不要なら、ElevenLabs公式以外を検討する価値はある。
逆に言えば、voice cloningを少しでも視野に入れるなら最初からElevenLabs公式を契約する方がトータルで安く済む。
他サービスとの詳細な比較はAI音声・TTS比較ガイド、用途別の選び方はAI音声生成カテゴリを参照してほしい。
よくある質問(FAQ)
Q. ElevenLabs公式のFreeプランで商用利用はできますか?
不可。Free $0プランは商用利用が明確に禁止されており、生成音声に「ElevenLabsで作成」のクレジット表記が必須になる。YouTube・Podcast・ブログ等で配信する場合は最低でもStarter $5にアップグレードする必要がある。
Q. text to speech目的だけならどのプランが最安ですか?
Starter $5が最安。月3万クレジットでEleven v2.5モデルなら約30分の音声が作れ、商用ライセンスも付く。週1本5分程度のYouTubeナレーションなら余裕で収まる。
Q. voice cloningはInstant とProfessionalどちらを選ぶべきですか?
YouTube・TikTok等の編集裏声ならInstant Voice Clone(Starter以上)で十分。Podcastの本格運用やオーディオブック納品など「本人と聞き分けがつかない精度」が必要ならProfessional Voice Clone(Creator $22以上)を選ぶ。
Q. クレジットが余ったら翌月に繰り越せますか?
繰り越し不可。月末リセットで未使用分は失効する。Pro以上はUsage-Based課金が解禁されるため、超過分のみ追加課金で使い続けられる。Creator以下では超過すると翌月までtext to speechが停止する。
Q. 日本語の音声品質はどの程度ですか?
最新Eleven v3モデルでは日本語の「読み上げ」品質は完成形に近い。ただし「感情表現の細やかさ」では英語にやや劣る。事務的なナレーションや解説動画なら違和感ゼロ、ドラマ仕立ての演技を求めるなら2026年後半のアップデートを待つ価値がある。
Q. 商用案件で他人の声をクローンするのは合法ですか?
本人の明示的な同意が必須。ElevenLabs公式はProfessional Voice Clone作成時に「本人の同意確認テキストを声に出して読む」プロセスを強制している。無断クローンが検出された場合はアカウント永久BANの対象になる。
まとめ:Starter $5かCreator $22の二択でほぼ終わる
ElevenLabs公式のtext to speech・voice cloning用途で個人クリエイターが選ぶべきプランは、結論Starter $5かCreator $22の二択だ。
- 商用解禁を最安で得る → Starter $5(Instant Voice Clone・月3万クレジット)
- Professional Voice Clone・本気運用 → Creator $22(PVC 1枠・月10万クレジット)
- 44.1kHz PCM納品が必須 → Pro $99(Usage-Based解禁)
- 複数ブランド・代理店運用 → Scale $330以上
Pro $99以上を個人で契約するメリットは、44.1kHz PCM納品が必須なオーディオブック・商業CM案件を持っている場合に限られる。それ以外はCreator $22で確実に元が取れる。
voice cloningのグローバル標準を取ったElevenLabsは、2026年時点で代替不能のポジションを築いた。他のAI音声サービスとの比較はAI音声・TTS比較ガイド、関連カテゴリの全体像はAI音声生成カテゴリで扱う。
迷ったらまずStarter $5で1ヶ月触り、クレジット消費の感覚を掴んでからCreator $22に上げる流れが最短ルートだ。
