世界的なGPU不足の解決に向け、AI処理におけるGPUの演算効率を高めるミドルウェア技術「AI computing broker」の提供を開始
富士通 株式会社AIサービス事業者やクラウドサービス事業者にて技術の有効性を実証
当社は、このほど、世界的なGPU不足に対応するため、高い実行効率が見込める処理に対してリアルタイムにGPUを割り振る当社独自のアダプティブGPUアロケーター技術と、各種AI処理の最適化技術を統合したミドルウェア技術「AI computing broker(以下、ACB技術)」を開発しました。本技術は、オンプレミスだけでなくクラウドで提供されているGPU環境においても利用可能であり、単一のGPUを用いるAIアプリから複数のGPUを用いる大規模言語モデルまで幅広く活用できます。単一のGPUによる先行トライアルの技術検証結果を踏まえた上で、2024年10月よりトレーダム株式会社(注1)がACB技術を採用し、またさくらインターネット株式会社(注2)は、当社と共同で複数のGPU上でACB技術の実証実験を開始します。
当社はトレーダム株式会社とさくらインターネット株式会社に加えて、AWL株式会社(注3)、エクストリーム-D株式会社(注4)、モルゲンロット株式会社(注5)と、単一GPUによるACB技術の先行トライアルを2024年5月より順次行い、各社それぞれのクラウド環境やサーバー上での動作と、各AI処理に対する演算処理効率の最大で2.25倍の向上、同時に取り扱えるAI処理数の大幅な増加などの有効性を確認しました。
当社は今後も、AI処理におけるGPUの演算効率を高めてGPUコストを削減したいAIサービス事業者や、一つのGPUにできるだけ多くのAI処理を割り当てたいクラウドサービス事業者などのGPU資源提供者に本技術を提供し、世界的なAI需要の高まりに伴うGPU不足や電力問題などの課題を解決し、AIによるお客様のビジネスの生産性と創造性の拡張に貢献します。
【背景】
生成AIをはじめとする世界的なAI需要の爆発的な高まりを受け、AI処理に最適とされるGPUの需要も急激に増加しています。生成AI市場の世界需要額は2023年から2030年にかけて約20倍の成長(注6)が見込まれており、それに比例しGPUの需要も同様の規模で急激に増大することが予想されます。一方で、GPUの需要に応じたデータセンターにおける消費電力の増加が課題となっており、2030年には全世界の発電量の10%がデータセンターによって消費されると推定(注7)されています。これを受けて当社は、GPUに関わる世界的な社会課題に対応するため、GPUでプログラムを実行中でも、高い実行効率が見込める処理に対してリアルタイムかつ優先的にGPUを割り振り、CPUとGPUの計算リソースを最大活用できるアダプティブGPUアロケーター技術を2023年11月に開発し、様々なプラットフォーム上での効果検証を進めてきました。
【「AI computing broker」について】
今回当社は、さらなるGPU不足への対応を見据え、GPUサーバー上で動作するAI処理に対して計算処理を自動で最適化するミドルウェア技術「AI computing broker」を開発しました。本技術は、アダプティブGPUアロケーター技術と各種AI処理の最適化技術を統合したミドルウェア技術であり、複数のプログラム中のGPUを必要とするAI処理部を見極め、計算資源の割当や最適化を自動的に適用します。従来技術のジョブ単位での割当とは異なり、当社が培ってきた演算最適化技術により動的にGPU資源をGPU計算単位で割り当てて稼働率を向上させるほか、本技術のGPUメモリの管理機能により、ユーザーはプログラムが使用するGPUメモリ量や、GPUの物理的なメモリ容量を気にする事無く、多数のAI処理を割り付ける事が可能になります。
単一GPUを用いたACB技術の先行トライアルでは、ACB技術非適用の場合と比較して、顧客環境におけるGPUの単位時間当たりの処理性能について最大で2.25倍の向上を確認しました。また本技術にはアプリ動作を見ながらGPUのメモリを共有するメモリ管理機能が備わっており、ユーザーは各ジョブの総メモリ使用量が物理メモリの最大容量に収まるかどうかを気にせずに処理を実行できます。これにより最大でGPUの物理メモリ容量の約5倍に当たる、150GBものメモリを必要とするAI処理を同時に取り扱えることを確認しました。
【トレーダム株式会社 執行役員 チーフデータサイエンスオフィサー 栢本 淳一 コメント】
当社は、高度なAIを活用した為替リスクをコントロールするソリューションを提供しています。今回のAI computing brokerのトライアルを通じ、AIモデルを生成するうえで必要なGPU計算資源を手軽に効率化でき、AI学習処理を多重化することでより精度の高いモデルを短期間で開発できる可能性を確認いたしました。今後、富士通との連携を通じて、本技術を活用した自社ソリューション開発の強化を図り、企業の成長やフィンテック業界の発展に貢献してまいります。
【さくらインターネット株式会社 / さくらインターネット研究所 所長 鷲北 賢 コメント】
今回AI computing brokerのトライアル利用を通じ、当社のクラウド事業においてGPUの計算資源をより効率的にお客様に提供でき、活用が広がっているGPUをより多くのお客様にお使い頂ける可能性を確信しました。今回の実証実験を通じて、昨今の急速な GPU の需要拡大への対応に役立てていきたいと考えています。
【AWL株式会社 R&D ディビジョン長 藤村 浩司 コメント】
当社は、リテール店舗を中核に、あらゆるリアル空間の課題解決と価値向上を目指し、AIカメラソリューションの開発・提供を行っています。多くのお客様からのリクエストに応じて、複数のAIモデルのトレーニングを並列実行する際には、GPU運用コストの最適化が不可欠です。今回のトライアルを通じて、AI computing brokerがGPU利用率を向上させ、AI処理の効率化を実現できる技術であることを確認しました。本技術のさらなる発展を期待しております。
【エクストリーム-D株式会社 代表取締役 CEO 柴田 直樹 コメント】
この度は、AI computing brokerの発表おめでとうございます。 当社は、AIおよびHPC顧客にクラウド的サービス「Raplase」を提供しております。当社の顧客の大きな課題としてオンプレミスとベアメタルクラウドでの高価なGPUの利用効率化によるコストパフォーマンス最大化があります。富士通のAI computing brokerは課題解決の一助になると考えており、今後も富士通様と検証を継続し、当社のお客様への適用を検討して参ります。
【モルゲンロット株式会社 取締役COO 中村 昌道、執行役員CTO 伊藤 寿 コメント】
当社は、コンテナデータセンターを活用した分散型のクラウドコンピューティングパワー(計算力)を提供し、様々なGPUを含む高度な計算資源の需要拡大に対応した計算力のシェアリングエコノミーモデルの確立に取り組んでいます。
今回は当社のプロダクトであるHPC管理ソリューション(M:Arthur)やクラウドサービス(Cloud Bouquet)において、AI computing brokerによるGPUの更なる効率的な利用の実現に向けて技術トライアルを実施し、複数のジョブを2台のGPUを用いて連続で実行した場合と比較して、ACB技術の使用によりジョブ間でGPUを共有したことで全体の実行時間を10%近く短縮することに成功しました。複数ジョブを並行して実行できるため、例えば限られたリソースの中で、モデル構築のための長時間学習と、実行テストのための短時間の学習や推論を同時に実行できる点も大きなメリットです。
今後は、当社のプロダクトとACB技術との連携について協議していきたいと考えています。
【今後について】
今後は、さらに大規模な計算機環境での利用を想定し、複数台のサーバーに搭載された複数のGPUに対しACB技術を適用させるなど、技術の適用範囲を拡張させていきます。当社は今後も、先進的なコンピューティング技術の開発を通してGPU不足や電力不足などの課題を解決し、人々のバディとして生産性と創造性を拡張するAIの実現に貢献していきます。
【商標について】
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
【注釈】
注1
トレーダム株式会社:
本社 東京都千代田区大手町、代表取締役 浦島伸一郎、代表取締役 阪根信一
https://www.tradom.jp/company
注2
さくらインターネット株式会社:
本社 大阪府大阪市北区、代表取締役社長 田中邦裕
https://www.sakura.ad.jp/corporate/
注3
AWL株式会社:
本社 東京都千代田区、代表取締役社長兼CEO 北出宗治
https://awl.co.jp/
注4
エクストリーム-D株式会社:
本社 東京都品川区、代表取締役CEO/ Founder, CEO 柴田直樹
https://xtreme-d.net/
注5
モルゲンロット株式会社:
本社 東京都千代田区、代表取締役 森本竜英
https://jp.morgenrot.net/
注6
生成AI市場の世界需要額は2023年から2030年にかけて約20倍の成長:
出典 2023年12月21日 一般社団法人電子情報技術産業協会「JEITA、生成 AI 市場の世界需要額見通しを発表」https://www.jeita.or.jp/japanese/topics/2023/1221-2.pdf
注7
2030年には全世界の発電量の10%がデータセンターによって消費:
出展 2020年2月 国立研究開発法人科学技術振興機構「情報化社会の進展がエネルギー消費に与える 影響(Vol.2)」https://www.jst.go.jp/lcs/pdf/fy2020-pp-03.pdf
【関連リンク】
・世界的なGPU不足に対応する、CPUとGPUの計算処理をリアルタイムに切り替える世界初の技術を開発(2023年11月9日プレスリリース)
(https://pr.fujitsu.com/jp/news/2023/11/9.html)
・世界初!量子とHPCのハイブリッド計算を実現する技術を開発(2022年11月8日プレスリリース)
(https://pr.fujitsu.com/jp/news/2022/11/8.html)
・「Fujitsu Computing as a Service(CaaS)」紹介サイト
(https://www.fujitsu.com/jp/services/caas/)
【当社のSDGsへの貢献について】
2015年に国連で採択された持続可能な開発目標(Sustainable Development Goals:SDGs)は、世界全体が2030年までに達成すべき共通の目標です。当社のパーパス(存在意義)である「イノベーションによって社会に信頼をもたらし、世界をより持続可能にしていくこと」は、SDGsへの貢献を約束するものです。
【本件に関するお問い合わせ】
富士通コンタクトライン(総合窓口)
0120-933-200(通話無料)
受付時間: 9時~12時および13時~17時30分(土曜日・日曜日・祝日・富士通指定の休業日を除く)
お問い合わせフォーム(https://contactline.jp.fujitsu.com/customform/csque04802/873532/)
当社はセキュリティ保護の観点からSSL技術を使用しております。
プレスリリースに記載された製品の価格、仕様、サービス内容などは発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。
提供元:PRTIMES