ソフトバンクが2026年5月25日、自社開発のソフトウェアスタック「Infrinia AI Cloud OS」を搭載した「AIデータセンター GPUクラウド」を、2026年10月から提供開始すると発表しました(出典: ソフトバンク公式プレスリリース)。ベータ版は同日から展開されており、新成長戦略「Activate AI for Society」の主軸事業として、ネオクラウド領域に本格参入するかたちです。
本記事では、Infrinia AI Cloud OSを搭載したソフトバンクのGPUクラウドを、クラウド運用者の視点から評価します。AI特化型クラウドの選択肢が国内で増えてきた中で、「使う側」が何を評価軸にすべきか、また既存のAWS/Azure/GCPやさくらインターネットとの違いをどう理解すればよいかを整理します。

ソフトバンクGPUクラウドの全体像
まず、発表されたサービスの構造を整理します。ソフトバンクの今回の発表は、ハードウェア(GPU)とソフトウェア(Cloud OS)の両方を組み合わせた「AI特化型のフルスタッククラウド」という打ち出しです。
| 項目 | 内容 | 出典 |
|---|---|---|
| サービス名 | AIデータセンター GPUクラウド | 2026-05-25プレスリリース |
| ソフトウェア | Infrinia AI Cloud OS | 同上(先行発表は2026-01-21) |
| 提供開始 | 2026年10月(ベータ版は5月25日から) | 同上 |
| GPU構成 | NVIDIA GB200 NVL72をはじめとするアクセラレーテッドコンピューティング基盤 | 同上 |
| 設置場所 | 国内のデータセンター(具体地名は未公表) | 同上 |
| 主な機能 | Kubernetes as a Service(KaaS)/Inference as a Service(Inf-aaS) | 2026-01-21プレスリリース |
| 事業位置づけ | ネオクラウド事業/「Activate AI for Society」配下 | 2026-05-25プレスリリース |
| 料金 | 未公表 | ― |
ハードウェアのコア部分にNVIDIA GB200 NVL72が据えられている点が技術的な目玉です。GB200 NVL72は72個のBlackwell GPUと36個のGrace CPUを1ラックに収容し、液冷技術でNVLink相互接続する構成で、NVIDIAが現時点で提供している最上位のAI向けシステムです。これを国内データセンターでマルチテナント提供するという意味で、技術的なインパクトは大きい発表です。
Infrinia AI Cloud OSが解く課題
Infrinia AI Cloud OSは、ソフトバンクが2026年1月21日に先行発表していたソフトウェアスタックです。AIデータセンター事業者やクラウド事業者が、GPU・Kubernetes・AIワークロードを大規模に管理するための土台として開発されました。
このOS層がなぜ重要かを理解するには、AIクラウドを運用するうえで現場が直面する課題を押さえる必要があります。
第1の課題は、GPUの動的割当とマルチテナント分離です。AIワークロードは推論と学習で要求するリソースが大きく違い、テナント間で公平にGPUを分配するスケジューラが必要になります。Infrinia AI Cloud OSのKubernetes as a Service層は、この部分を抽象化して提供します。
第2の課題は、LLM推論APIの提供基盤です。自社でLLMをホスティングしたい企業や研究機関は、モデルのロード、リクエストのバッチング、レスポンスのストリーミングといった推論固有の仕組みを実装する必要があります。Inference as a ServiceはこのレイヤーをAPI化して提供する設計です。
第3の課題は、GPUノードの可観測性と運用自動化です。GPUの温度、メモリ帯域、SM稼働率、NVLinkの帯域などをモニタリングし、故障や性能劣化に対する自動復旧を組み込む必要があります。Infrinia AI Cloud OSはこの部分も統合する方向で設計されています。
PR
Kubernetes完全ガイド 第2版(青山真也 著・インプレス)
Infrinia AI Cloud OSのKaaS層を評価したり、社内のAIワークロードをKubernetes化するうえで、Kubernetesそのものの仕様まで戻って判断したい場面が必ず出てきます。日本語で深く解説された定番書として手元に置く価値があります。
ネオクラウドという文脈で位置づける
ソフトバンクの発表は「ネオクラウド事業」という枠組みで打ち出されています。ネオクラウドは、AI特化型ワークロードに最適化された大規模クラウドの総称で、ハイパースケーラーとは異なる位置取りを目指す事業区分です。
世界的にはCoreWeaveやLambda Labs、Crusoe等の事業者がネオクラウド領域で先行しています。国内でも、GMOインターネットグループ、さくらインターネット、KDDI等がGPUクラウドサービスを展開しており、ソフトバンクは今回の発表でこの市場に本格参入するかたちになります。
ネオクラウドの特徴を、従来のハイパースケーラー(AWS/Azure/GCP)と対比して整理します。
| 観点 | ハイパースケーラー | ネオクラウド |
|---|---|---|
| 提供範囲 | 汎用コンピューティング全般 | AIワークロード特化 |
| GPU調達優位性 | 規模で確保 | NVIDIAとの直接的なパートナーシップ |
| 料金体系 | 従量・コミット・スポット等多様 | シンプルな従量+長期契約モデルが多い |
| マルチクラウド可搬性 | 各社のロックインが強い | Kubernetes+オープンソース志向で可搬性高め |
| データ主権 | リージョン選択で確保 | 国内事業者は「ソブリンAI」を強調しやすい |
| 運用ナレッジ | 世界中の事例蓄積 | 新興のため事例蓄積が途上 |
ネオクラウドの強みは「AI特化の純度」と「データ主権」、弱みは「運用ナレッジの蓄積不足」と「汎用ワークロードの周辺サービス不足」です。これを理解したうえで、自社のAIワークロードがネオクラウドに乗るかを判断する必要があります。
運用者として評価すべき5つの軸
ソフトバンクGPUクラウドを採用検討する場合、運用者が評価すべき軸を5つに整理します。これは料金や性能の単純比較ではなく、自社の運用体制と組み合わせて意味のある評価項目です。
第1の軸は、GB200 NVL72の「使い切れる規模」です。72 Blackwell GPUを1ラックで提供するGB200 NVL72は、LLMの大規模学習や推論には強力ですが、中小規模のワークロードでは過剰になります。自社のジョブが「GPU並列度をどこまで上げられるか」を見極めないと、コストパフォーマンスが出ません。
第2の軸は、Kubernetes as a Serviceの成熟度です。EKS/AKS/GKEが10年近い運用実績を持つのに対し、Infrinia AI Cloud OSのKaaSは新しいプロダクトです。GPU共有や優先度制御、ノード障害時の自動退避といった機能の成熟度を、評価検証で実際に確認する必要があります。
第3の軸は、Inference as a Serviceの対応モデルとAPI仕様です。LLM推論APIのOpenAI互換性、ストリーミング対応、バッチサイズ最適化、コールドスタート時間など、推論基盤としての品質を測る指標が多数あります。ベータ期間中にこれらを実測しておくべきです。
第4の軸は、データ主権と国内データセンターの位置です。ソフトバンクは「国内のデータセンター」と発表していますが、具体的な所在地は公表されていません。個人情報保護法やガバメントクラウド要件、業界規制に対応するためには、設置場所の透明性が重要です。
第5の軸は、料金の予測可能性です。料金体系は2026年5月時点で未公表ですが、GPUクラウドの料金は時間単価×並列度で大きく変動するため、月額予算を読みやすい契約形態(コミットメント割引、リザーブ枠)が用意されるかを確認する必要があります。
国内競合との比較で見える立ち位置
ソフトバンクGPUクラウドの立ち位置を、国内のGPUクラウド事業者と比較して整理します。これは「どこが優れているか」ではなく、「どこに使い分けポイントがあるか」を読み解く比較表です。
| 事業者 | 主な提供形態 | GPU構成の特徴 | 運用者視点の評価ポイント |
|---|---|---|---|
| ソフトバンク(Infrinia AI Cloud OS) | GPUクラウド(KaaS/Inf-aaS) | NVIDIA GB200 NVL72中心 | 最新GPU調達優位性、ソフトウェアスタック自社開発、2026-10提供開始 |
| さくらインターネット(高火力シリーズ) | GPUクラウド/ベアメタル/DOK | NVIDIA H100等 | ガバメントクラウド採択、ソブリンAI政策連携、国産唯一 |
| GMOインターネット(GMO GPUクラウド) | GPUクラウド | NVIDIA H100/H200等 | 低価格帯、スタートアップ向け |
| KDDI(au Cloud Service等) | マネージドクラウド | GPU提供は限定的 | 通信事業者としての企業顧客基盤 |
| IDCフロンティア | クラウド/コロケーション | GPU提供は限定的 | ハウジング由来の安定感 |
| AWS/Azure/GCP(参考) | ハイパースケーラー | H100/B200等 | 周辺サービス豊富、世界中のリージョン展開 |
ソフトバンクの強みは「最新GPU(GB200 NVL72)の早期国内提供」と「ソフトウェアスタックを自社開発している点」です。さくらインターネットの強みは「政府連携と国産ソブリン軸」、GMOの強みは「価格優位性」、ハイパースケーラーの強みは「周辺サービスとリージョン展開」です。それぞれ役割が違うため、ワークロードの性格に応じて使い分ける構図になります。
本記事と関連して、「さくらインターネット設備投資7倍視野”ソブリンAI”|国内AIクラウド第3極の技術視点」では、国産クラウドの政策連携の角度から国内AIクラウド動向を整理しています。あわせて参照してください。
採用検討の進め方
ソフトバンクGPUクラウドの採用を検討する場合、運用者として進めるべき手順を整理します。これは2026年5月時点のベータ版アクセスから2026年10月の正式提供開始までの期間で実行する具体的なTo-Doです。
まず、自社のAIワークロードのプロファイルを定量化します。学習ジョブの並列度(必要GPU数)、ジョブの実行時間分布、推論APIのスループット要件、データセットの転送量を可視化します。これがないと、どのGPUクラウドが適しているかの議論ができません。
次に、ベータ版でのPoC(実証実験)を企画します。Infrinia AI Cloud OSのKubernetes as a Serviceに自社のジョブを乗せ、スループット・コスト・運用工数を実測します。同時期にさくらインターネットやハイパースケーラーでも同じジョブを走らせると、比較データが得られます。
さらに、データ主権要件と契約条件を整理します。データの保管場所、SLA、障害時の補償、解約時のデータ持ち出し手順を契約交渉のチェックリストに入れます。これは正式提供開始時の契約締結に向けた準備として2026年Q3中に進めるべきタスクです。
最後に、社内のAI戦略との整合を取ります。GPUクラウドを変えると、データパイプライン、モデル管理(MLOps)、認証統合の構成も影響を受けます。技術部門だけで決めず、AI戦略全体のなかで位置づけることが必要です。
FAQ
Q1: ソフトバンクGPUクラウドはいつから使えますか?
A: 2026年5月25日からベータ版が展開されており、正式提供は2026年10月開始予定です。本番ワークロードを乗せる場合は、ベータ期間中の評価検証を経たうえで、10月以降の正式契約というスケジュール感が現実的です。
Q2: NVIDIA GB200 NVL72はどんな構成ですか?
A: 1ラックに72個のBlackwell GPUと36個のGrace CPUを搭載し、NVLinkで相互接続、液冷技術で冷却するシステムです。NVIDIAが提供している最上位のAI向け統合システムで、大規模LLMの学習や推論に適した構成になっています。
Q3: Infrinia AI Cloud OSはオープンソースですか?
A: 2026年5月時点でソフトバンク自社開発のソフトウェアスタックとして発表されています。プロダクトとしてはKubernetes as a Service/Inference as a Serviceを提供しますが、OS自体のオープンソース化の方針は公表されていません。
Q4: さくらインターネットのGPUクラウドとどう違いますか?
A: 大きな違いはハードウェア優位性とソフトウェアスタックの方向性です。ソフトバンクは最新のNVIDIA GB200 NVL72を中心に据え、自社開発のCloud OSを統合提供します。さくらインターネットはNVIDIA H100ベースのGPUサーバーを「高火力シリーズ」として提供しつつ、ガバメントクラウド採択というソブリンAI連携の強みを持ちます。
Q5: 既存のAWS/Azure/GCPと並行運用できますか?
A: Kubernetes as a Serviceを採用しているため、コンテナ化されたワークロードであれば並行運用は技術的に可能です。ただし、データ転送料金、認証統合、運用ナレッジの分散コストを考慮する必要があります。マルチクラウド戦略の一環として補完利用するのが現実的な落とし所になります。
Q6: GPUクラウドの料金はどのくらいになりそうですか?
A: 2026年5月時点で料金は未公表です。一般的なネオクラウドの料金水準は、ハイパースケーラーよりやや低価格帯に置かれることが多いですが、最新GPU(GB200 NVL72)は調達価格が高いため、必ずしも安価とは限りません。正式提供開始時のアナウンスを待つ必要があります。
Q7: ベータ期間中に試すべきポイントは?
A: Kubernetes as a Serviceの成熟度(GPU割当、優先度制御、ノード障害時の挙動)、Inference as a ServiceのAPI仕様(OpenAI互換性、ストリーミング対応)、料金予測の妥当性、データ主権の透明性の4点です。これらをベータ期間中に実測し、正式提供開始時の意思決定材料として準備するのが効果的です。

2026年下半期に向けた整理
ソフトバンクGPUクラウドの登場は、国内AIクラウド市場が「ネオクラウド」という分類で本格化していく動きの象徴です。NVIDIA GB200 NVL72という最新GPUを国内マルチテナント提供する点、Infrinia AI Cloud OSという自社ソフトウェアスタックで差別化する点で、技術的には十分にインパクトのある発表です。
運用者として2026年下半期に向けて整理しておくべきことは3点です。1点目は自社AIワークロードの定量プロファイル化、2点目はベータ版でのPoC企画、3点目はマルチクラウド戦略のなかでの位置づけ整理です。
AIクラウドは1社のサービスで完結する時代ではなくなっています。ハイパースケーラー、国内ネオクラウド、ベアメタルGPUサーバーを組み合わせて「ワークロードごとに最適な場所」を選ぶ運用設計が求められます。ソフトバンクGPUクラウドはその選択肢の有力な候補として、評価検証の俎上に乗せる価値があります。
PR
Docker/Kubernetes実践コンテナ開発入門 改訂新版(山田明憲 著・技術評論社)
Infrinia AI Cloud OSやハイパースケーラーのKubernetes基盤を横断的に評価検証するなら、コンテナ運用の標準的な型を押さえている本書が現場の判断基盤になります。AKS/EKSなどとの比較検討にもそのまま使える一冊です。
国内AIクラウド/ネオクラウド/マルチクラウド運用の最新動向を毎週お届けします。GPUクラウド評価検証の実践知をお求めの方はぜひご登録ください。
