NEDO公募課題「AIの安全性確保に関する研究開発・検証等の推進事業」開発成果の発表に関するお知らせ

2026/05/28  株式会社 ヘリオス 


2026 年5月 28 日
株式会社ヘリオス

NEDO 公募課題「AIの安全性確保に関する研究開発・検証等の推進事業」開発成果の発表に関するお知らせ
医療現場の業務を支える高性能な日本語LLM を開発

当社は、2025 年 4 月 23 日発表の、NEDO 公募課題 「日本語版医療特化型 LLM の社会実装に向けた安全性 検証・実証」採択のお知らせ」にて公表の通り、NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)が公募した「日本語版医療特化型LLM の社会実装に向けた安全性検証・実証」(以下、「本事業」と言います。)において、共同実施先として採択されておりましたが、この度、本事業での開発成果が、「医療現場の事務作業を支援する高性能な日本語LLM を開発しました」として、発表されましたのでお知らせいたします。

詳細につきましては、別紙をご確認ください。

注:「日本語版医療特化型LLM の社会実装に向けた安全性検証・実証」は、「AIの安全性確保に関する研究開発・検証等の推進事業」内の研究課題です。

今後の見通し

本事業終了(事業期間:2025 年度/1年間)による、当社 2026 年 12 月期連結業績への影響はありません。

以上

[別紙]

2026.5.28

NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)
さくらインターネット株式会社
国立大学法人東京大学
株式会社ABEJA
国立研究開発法人理化学研究所
学校法人国際医療福祉大学
学校法人藤田学園 藤田医科大学
国立大学法人東京科学大学
国立大学法人九州大学
株式会社ヘリオス

医療現場の事務作業を支援する高性能な日本語 LLM を開発しました
―日本の医療特性を踏まえた安全性検証により医療 LLM の社会実装を後押し―


NEDOが推進した「AIの安全性確保に関する研究開発・検証等の推進事業/日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」(以下、本事業)において、連名機関10者は、医療機関のオンプレミス環境または医療機関が管理する国内クラウド環境などの患者情報を安全に管理できる環境で運用可能で、世界最先端の商用LLMに迫る性能を有する医療業務支援向け日本語LLMを開発しました。

独自に構築したベンチマークによる検証の結果、専門医試験を模した学術試験において最大90.8%の正答率を達成し、比較対象とした主要な商用LLM(91.4%)に迫る水準に到達しました。あわせて、日本の医療特性を踏まえた安全性検証を実施し、医療現場での利用に求められる性能と安全性の両立を確認しました。

本研究開発の成果については、医療現場の業務効率化および医療の質向上に資することを目指し、今後、段階的に社会実装を進めていく予定です。

1.背景

医療機関がAIを活用するにあたっては、以下の三つの構造的課題が存在します。

1)患者情報の管理に関する課題:一般的なAIサービスの多くは、患者情報が国外のサーバや外部事業者の管理下で処理される構造になっており、医療機関側で患者情報の所在や取り扱いを十分に把握・管理することが困難です。

2)データ標準化の課題:医療機関ごとに用語やコード体系が異なり、データの相互運用性が十分に確保されていません。

3)安全性基準の課題:医療現場におけるLLM

※1活用にあたっての安全性基準が未整備であり、導入判断のよりどころが乏しい状況にあります。

本事業

※2では、患者情報を安全に管理できる環境で運用可能であり、かつ主要なAIに匹敵する性能を
有するAIの開発を目標として、
(1)LLM開発、
(2)安全性検証、
(3)ユースケース検証の3点に取り組みました。

2.今回の成果

(1)患者情報を安全に管理できる環境で運用可能な高性能日本語LLMの開発

公開されているオープンなLLMをベースモデルとして、日本の診療ガイドライン・専門医試験問題・臨床事例などの医療分野の教材から生成したデータを学習させた追加学習※3モデルを開発しました。その結果、患者情報を安全に管理できる環境で運用可能でありながら、主要な商用LLMに迫る性能を実現しました。

主な成果として、専門医試験を模した学術試験において、外部文書を参照しながら回答する方式(RAG)を用いることで最大90.8%の正答率に到達し、比較対象とした主要な商用LLM(91.4%)に迫る水準に到達しました。また、日本の診療ガイドラインに沿った応答ができるかを評価する指標では、ベースモデルと比較して最大10.8ポイントの性能向上を確認しました(表1)。

加えて、独自アーキテクチャによる国産のフルスクラッチ開発

※4モデルも構築しました。同規模のオープン

モデルと比較して競争力のある性能を示し、将来の国産基盤モデル開発に向けた技術的知見を蓄積しました。

表1 代表的な追加学習モデルおよびフルスクラッチモデルの性能比較

公式ページ(続き・詳細)はこちら
https://ssl4.eir-parts.net/doc/4593/tdnet/2824509/00.pdf

関連業界