NEDO が公募した「ポスト 5 G 情報通信システム基盤強化研究開発事業 /ポスト 5 G 情報通信システムの開発」に、 LLM 開発事業案が採択決定

2024/02/02  株式会社 ABEJA 

2024 年2月2日
株 式 会 社 A B E J A

ABEJA、NEDO が公募した「ポスト5G 情報通信システム基盤強化研究開発事業
/ポスト5G 情報通信システムの開発」に、LLM 開発事業案が採択決定


当社は、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が公募した「ポスト5G 情報通信システム基盤強化研究開発事業/ポスト5G 情報通信システムの開発」に当社提案の「LLM の社会実装に向けた特化型モデルの元となる汎化的 LLM」が採択されましたことをお知らせいたします。

本件において、当社は日本語 LLM および周辺技術の研究開発を行うとともに、主に LLM の構築に必要な当社が支出する計算コストについて、NEDO から7億円規模の助成金の交付を受ける予定です。

なお、計算コストおよび助成金は、2023 年 10 月 12 日に開示した今期の業績予想には含まれておりません。

また、本件が今期の業績へ与える影響は現時点で未定ですが、開示の必要が認められる場合には、速やかに開示を行います。

詳細につきましては、添付資料をご参照ください。

以 上


2024 年2月2日
株式会社 ABEJA

ABEJA、NEDO が公募した「ポスト 5G 情報通信システム基盤強化研究開発事業
/ポスト 5G 情報通信システムの開発」に、LLM 開発事業案が採択

人と AI の協調により「ゆたかな世界を、実装する」株式会社 ABEJA(本社:東京都港区、代表取締役CEO:岡田 陽介、以下「ABEJA」)は、国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)が公募した「ポスト 5G 情報通信システム基盤強化研究開発事業※1/ポスト 5G 情報通信システムの開発」に当社提案の「LLM※2の社会実装に向けた特化型モデルの元となる汎化的 LLM」が採択されましたことをお知らせいたします。

ABEJA は、主に LLM の構築に必要となる計算リソースについて、7 億円規模の助成金の交付を受ける予定です。

ABEJA は、LLM の社会実装に必要不可欠となる精度および計算コストパフォーマンスの飛躍的な向上を目的に、日本語 LLM および周辺技術(RAG※3、Agent※4)の研究開発を行います。

また、LLM の利活用の推進や社会全体における AI 技術革新の加速、次世代の研究者や技術者の育成に貢献できるよう、開発した LLM およびソースコードや開発ノウハウなどを適宜公開してまいります。

なお、当社の事業化においては、デジタル版 EMS「ABEJA Platform」に 2023 年より搭載している「ABEJA LLM Series」と合わせ、広く提供を行う予定です。ビジネスモデルは、オープンソースソフトウェア(OSS)※5におけるディストリビューションモデル※6を想定しており、公開する LLM の利活用に伴い必要となるサポートを有償で提供する予定です。

ABEJA は、2018 年より生成 AI の一つである LLM における研究開発を進め、2023 年 3 月以降は、「ABEJA LLM Series」を ABEJA Platform に搭載し、顧客企業に提供してまいりました。現在は、顧客企業の LLM の実装を実現すべく、サポート領域をより広範囲に拡大し、戦略策定やビジネスプロセスの構築、ビジネスプロセス上での運用まで、一気通貫で顧客支援を担うとともに、更なるサービスの拡充を図り、LLM の研究開発を継続して進めております。

ABEJA はこのたびの採択を受け、当該事業は、当社の経営理念である「ゆたかな世界を、実装する」を実現する上でも意義のある取り組みであり、社会全体における LLM の実装を加速させる一助を担うと考えております。

現在、世界中の企業が LLM を中心とする生成 AI から生み出される巨大な価値の享受を目指し、様々な取り組みを開始しています。実際、LLM の市場規模は急速な拡大が見込まれており、日本での対話 AIビジネスの市場規模は楽観的なシナリオで 2023 年度の 140 億円から 2027 年度には 6,905 億円(年間平均成長率 165.0%、CAGR:2023 年度-2027 年度)に成長すると予想されており(出所:株式会社シード・プランニング 「2023 年版 対話 AI ビジネスの現状と将来展望」)、ABEJA においてもベースシナリオとして 2,000 億円規模の市場を見込んでおります。

LLM の利活用により産業構造に大きな変革が生じることが期待されている一方、現状では、LLM の利用時に大規模な計算リソースの消費が不可避となるため、投資対効果を勘案すると適用範囲に制約が生じ、LLM の社会実装の妨げの一因となっています。また、LLM が抱える課題の代表的なものとして、最新の情報や更新された情報に対応しない「知識のカットオフ」や、事実に基づかない不正確な情報を生成する「ハルシネーション」があります。これは、LLM の知識が膨大な量の「既存の」データに基づいており、「学習データに存在する不備や誤情報も学習する」という LLM 特有の性質に基づくものです。LLMの精度向上には、誤った情報や偏った情報を含むデータを排除し、正確で信頼性の高いデータを学習させることが必要不可欠です。対処手法として、学習済の LLM に新たなデータセットを用いて追加学習させる「fine-tuning」がありますが、都度大規模な計算リソースを消費し、コストや時間がかかります。このため、一部のエンタープライズ企業の適用に限られているのが実情です。2023 年に OpenAI が、「GPT-3.5 Turbo」の fine-tuning 機能を発表しましたが、対応可能なデータ量は 4,096 トークン、50MB 以下のファイルに限定されており、実用性に課題があります。

こうした現状の課題解決に有望視されている手法に、「RAG(Retrieval-Augmented Generation)」があります。RAG は、LLM と外部のデータベースや情報源(以下「外部データ」)を結びつけ、LLM が外部データの知見を組み込んだ回答を生成できる技術です。fine-tuning を都度行うことなく、外部データを入れ替えるだけで、外部データに関連する高精度な回答を行うことが可能となります。また、「Agent」の最適化を行うことで、入力された内容を基に LLM が自律的に API やツール活用など必要なアクションを計画・実行できるようになります。

ABEJA は、RAG による精度の向上および Agent の最適化が、計算コストパフォーマンスを向上させ、経済的合理性や適用範囲の拡張性をもたらし、LLM の社会実装を強力に推進すると考えております。現在用いられる RAG には、技術進歩の余地があると捉えており、LLM および周辺技術(RAG、Agent)の研究開発に統合的に取り組むことで、実用性の高い先駆的な手法を実現してまいります。なお、LLM 単体の研究開発においては、オープンソースの既存 LLM をベンチマークとし、公開時に JGLUE※7 の全項目で、トップスコアを達成することを目標としています。

ABEJA は、今後、日本が国際的な AI 分野において重要な役割を担い、国際社会における情報処理技術の新たなスタンダードの確立をすることを視野にいれております。

ABEJA は、生成 AI を利活用する企業や組織の増加、社会における AI 技術革新の大幅な加速、そして次世代の研究者や技術者の育成を目的に、研究開発で得られた LLM およびソースコードや開発ノウハウなどを社会に提供することで LLM の社会実装を推進し、ABEJA の企業理念である「ゆたかな世界を、実装する」の実現に努めてまいります。

事業概要

公募事業名
ポスト 5G 情報通信システム基盤強化研究開発事業/ポスト 5G 情報通信システムの開発
当社応募事業名
LLM の社会実装に向けた特化型モデルの元となる汎化的 LLM に関する研究開発

実施期間
2024 年 2 月~2024 年 8 月

目 的
・ LLM の社会実装に向け、汎用的な活用を見据えた日本語 LLM と周辺技術(RAG、Agent)の研究開発
・ 研究開発で得られた成果物(LLM、ソースコード、開発ノウハウなど)を公開し、生成 AI の利活用、社会における AI 技術革新の加速、次世代の研究者や技術者の育成を推進する
・ 国際的な AI 分野において、日本が重要な役割を担い、国際社会における情報処理技術の新たなスタンダードを確立する
概 要
・特化型の元となる汎化的な LLM の研究開発
- オープンソースの LLM をベンチマークとし、評価でトップスコアを達成
- 周辺技術(RAG、Agent)の精度を向上し、データ活用を推進
・社会実装に向け、自社ビジネスに関連させた展開を図り、一部モデル・ノウハウ等の成果物も公開・提供
- 研究開発した LLM と周辺技術(RAG、Agent)を、現在提供しているサービと合わせて広く提供
- 研究開発で得られた成果物(ソースコード・モデル・開発ノウハウ)を公開
NEDO 公表内容 採択結果公表ページ URL:https://www.nedo.go.jp/koubo/IT3_100304.html

■ 全体概要図(イメージ)

■ 実施スケジュール

用語について

※ 用 語 内 容

1 ポスト 5G 情報通信システム基盤強化研究開発事業
日本国内におけるポスト 5G 情報通信システムの開発・製造基盤強化を目指し、中核となる技術を開発する事業。ポスト 5G 情報通信システムとは、第 5 世代移動通信システム(5G)より更に超低遅延や多数同時接続といった機能が強化されたポスト 5G に対応した通信システムを指す。
https://www.meti.go.jp/policy/mono_info_service/joho/post5g/index.html

2 LLM
Large Language Model の略称で、生成 AI の領域の一つである大規模言語モデル。

3 RAG
Retrieval-Augmented Generation の略称。外部のデータベースや情報源を結びつける技術。この技術の活用により、LLM が外部のデータベースや情報源の知見を組み込んだ精度の高い回答を生成できるようになる。

4 Agent
Agent は、自律的なアクションを計画・実行できるようにする技術。この技術を用いることで、LLM が自律的に意思決定をして、入力された内容を基に API やツールの活用などのアクションを計画し実行できるようになる。これにより、自律的に学習データに含まれていない外部データを用いた回答を作成することが可能になる。

5 オープンソースソフトウェア(OSS)
利用者の目的を問わず、無償でソースコードを使用、調査、再利用、修正、拡張、再配布が可能なソフトウェアの総称。

6 ディストリビューションモデル
OSS の提供会社または他のコミュニティで開発した、OSS を組み込んだモデルに必要になる保守やバグ、セキュリティなどアップデートに関するサポートを行うビジネスモデル。ABEJA は、このたびの事業化において「Red Hat Enterprise Linux(RHEL)]の手法を想定。

7 JGLUE
日本語の一般的な言語理解能力を測るためのデータセット群。LLM モデルを様々な観点から評価する。

■ 株式会社 ABEJA について

ABEJA は、「ゆたかな世界を、実装する」を経営理念とし、「ABEJA Platform」を基盤に顧客企業の基幹業務のプロセスを変革し、ビジネスの継続的な収益成長の実現に伴走する「デジタルプラットフォーム事業」を展開しています。2012 年の創業時より ABEJA Platform の研究開発を進めており、これまで多種多様な業界・業態の 300 社以上のデジタル変革を ABEJA Platform 上で実現してきました。また、「Human In the Loop」をはじめとする高度なノウハウやアプローチを用いて、デジタル変革に必要不可欠な「人と AI の協調」を実現し、戦略的かつ効率的に顧客の基幹業務を変革し、さらにはビジネスモデルの革新に取り組んでいます。

本社:東京都港区三田一丁目 1 番 14 号 Bizflex 麻布十番 2 階
設立:2012 年 9 月 10 日
代表者:代表取締役 CEO 岡田 陽介
事業:デジタルプラットフォーム事業
URL:https://abejainc.com

関連業界