進化力学系ゲーム理論の構築

2025/04/15  国立研究開発法人 理化学研究所 

2025年4月15日

理化学研究所

進化力学系ゲーム理論の構築

-社会制度の進化を説明するための新しいゲーム理論-

理化学研究所(理研)脳神経科学研究センター 理研CBS-トヨタ連携センター 計算論的集団力学連携ユニットの板尾 健司 基礎科学特別研究員らの国際共同研究チームは、「進化力学系ゲーム理論」という新しいゲーム理論[1]の枠組みを構築することで、共有資源の持続可能な利用を実現する社会制度が生まれるメカニズムを理論的に解明しました。本研究成果は、共有資源の管理において、「何が協力で何が裏切りか」という基準自体の進化を説明するための理論的基盤を提供するとともに、従来のゲーム理論を拡張した枠組みを提案するもので、新しい研究の潮流を生むことが期待されます。

今回、国際共同研究チームは、森林や水産物などの自然資源を共有する人々の相互作用を表現する新しいゲーム理論の枠組みを構築しました。自然成長と収穫による資源量の変動をモデル化しました。そして、プレーヤーの「戦略」として、資源量と自他の状態を参照して各時点で収穫するかどうかを判断する意思決定関数を定義し、その進化をシミュレーションしました。その結果、プレーヤーたちは互いの資源利用を監視し、不適切な資源利用に対しては、自分も過剰利用を行うようになりました。この過剰利用は自分の利益を犠牲にして相手の利益を下げる「懲罰」として働きます。これによって、「懲罰されなければ協力、懲罰されれば裏切り」という形で他者の行動の協力性を判定する規範と違反者への罰を定める制度が生まれました。これらの結果から、相互監視に基づいて、持続可能な資源利用を実現する制度が生まれるメカニズムを説明しました。

本研究は、科学雑誌『Proceedings of National Academy of Sciences(PNAS)』オンライン版(4月11日付)に掲載されました。

背景

人々は社会の中で制度(社会生活を形作る規則や規範)[2]に従って生活しており、大人数での協調を実現するためには制度が不可欠だといわれています。特に、森林や水産物などの自然資源は、分割して私有することが難しいため、共同利用されることが多くなります。そこには、資源が豊かなときにのみ利用し、それ以外のときには回復を待てば全員が利益を享受できる一方で、他人が回復を待つ間に1人で利用すれば利益を独占できてしまうというジレンマが存在します。そのため、全員が個人的な利益を優先させた結果、資源が枯渇して全員が不利益を被る「共有地(コモンズ)の悲劇」が起きてしまう恐れがあります。

この「共有地の悲劇」を避けるべく、人類史上さまざまな制度が作られて、持続可能な資源利用を支えてきました。しかし、近年では先進国が新興国に「先進的な」資源管理を教えた結果、むしろ持続可能性が損なわれた事例が頻発しています(エリノア・オストロム『コモンズのガバナンス』晃洋書房、2022年)。というのも、地域の文脈を無視して導入された「先進的な」資源管理の仕方は、皆が規則に従って行動した場合には効率的であるものの、人々を規則に従わせる動機付けに欠けるものが多かったからです。持続可能性を実現するためには、制度が人々に進んで規則を守らせるものでなくてはなりません。ここで、人々が進んで規則を守るかを分析するためには、ゲーム理論が有用です。

これまで経済学では、歴史上の制度をゲームとしてモデル化して、ゲーム理論によって分析してきました。ゲームとしてモデル化するとは、現実の状況を模して、プレーヤーが取り得る「戦略」(例えば集団に善をなす「協力」、利己的な「裏切り」、または裏切り者に損をさせる「懲罰」)と、プレーヤーたちが取る行動によって各人が得られる利益(「利得」)を定めることです。そしてゲーム理論によって分析するとは、プレーヤーが自分の利得を最大化させる場合に、どの戦略を選ぶかを調べることです。そこで、1人が裏切り、他全員が協力や懲罰を選んだ時に、裏切り者の利得の方が小さい、すなわちズルをした人が損をするのであれば、協力の状態がゲームの解として安定[3]だといえます。そして、制度をゲームとしてモデル化したときに、協力の状態が安定であれば、その制度が持続可能な資源利用を実現することが分かります。

しかし、このような従来のゲーム理論による分析は、制度が「どのように機能しているか」を明らかにするために有益ですが、「いかにして生まれたか」を説明することはできません。これまでに、経済学での制度分析により、資源が豊かで利用者がそれを強く必要としているときには資源利用が協力的とみなされる一方で、資源が乏しく利用者が裕福であるときの利用は裏切りとみなされる、という「文脈依存的な協力性の基準」があることが明らかになっています。そこで国際共同研究チームは、いかなる行動が協力・裏切り・懲罰とみなされるのかが決まる過程を調べることで、制度が生まれる仕組みの解析に挑みました。

研究手法と成果

国際共同研究チームは、既存のゲーム理論の枠組みを拡張した進化力学系ゲーム理論を構築しました(図1)。

本研究では進化力学系ゲーム理論のミニマルモデルとして、2人のプレーヤーが一つの資源を共有する状況を考えました。ここで考える資源は森林や水産物などの自然資源であり、その量は、自然成長と収穫によって変動します。プレーヤーは各時間ステップで、資源を利用するか成長を待つかを選択します。プレーヤーが資源を利用すると、収穫量に応じて裕福になります。このステップを1,000ステップ繰り返し、プレーヤーの裕福さに応じて利得を計算しました。

このモデルと従来のゲーム理論の枠組みの違いは主に以下の2点です。

一つ目はプレーヤーの行動に依存した環境変化を導入した点です。従来の分析では、行動によって得られる利得は固定されていました。これに対し本研究では、自然資源の量の変動を力学系(関数で記述された規則により時間変化するシステム)[4]として、シンプルかつ生態学的・経済学的に自然な関数で表現し、資源量に応じて収穫量、ひいては利得が変動する過程をモデル化しました。

二つ目は各プレーヤーの戦略として、行動そのものではなく、行動を決定するための「意思決定関数」を定義した点です。プレーヤーたちは、ゲームの各ステップで、資源量とプレーヤーたちの状態を各自の意思決定関数に入力して、資源を利用するか待機するかを選択します。これにより、文脈依存的な判断をモデル化しました。

そして、プレーヤーたちの利得に応じて、この意思決定関数が進化する過程をシミュレーションしました。ここでは、1,000ステップ経過した後に、利得が多いプレーヤーほど多くの子供(次世代のプレーヤー)に意思決定関数を継承させるとしました。そして意思決定関数は継承されるときにわずかに変異(つまり意思決定の基準が少し変化)するとして、意思決定関数の進化をモデル化しました。

図1 進化力学系ゲーム理論が解き明かす制度進化の仕組み

  • (左)資源の自然成長は生態学、収穫は経済学を参照して、資源量の変動を力学系としてモデル化した。
  • (中)プレーヤーの「戦略」は協力・裏切り・懲罰などの行動そのものではなく、資源量と自他の状況に応じて行動を決定するための意思決定関数として定義される。
  • (右)進化した意思決定関数は、他者の行動が「協力」か「裏切り」か、を判定し、「裏切り」には「懲罰」を与える。(図2参照)

意思決定関数が進化した結果、制度の自己組織化[5](無秩序な系において自発的に秩序=制度が生まれること)が確認されました(図2)。進化の初期には、ほとんど全てのステップで収穫を行う「利己的な」振る舞いの結果、資源が枯渇してしまう「共有地の悲劇」が見られました。しかし、意思決定関数が進化するにつれて、資源が豊かで自分が貧しいときのみ収穫をする「協力的な」プレーヤーが現れて、持続可能な資源利用がなされるようになりました。それでもまだこの段階では、「協力的な」プレーヤー同士のゲームでは利得が大きくなるものの、「協力的な」プレーヤーは利己的なプレーヤーが頻繁に収穫することを許すので、搾取されてしまいます。

意思決定関数の進化がさらに進むと、プレーヤーたちは自分が貧しく相手が裕福なときには資源量にかかわらず収穫を行うようになりました。これは、プレーヤーたちがお互いの資源利用を監視して、不適切な資源利用に対しては、自分の収穫頻度も上げる(過剰収穫する)ことを意味しています。この過剰収穫は、あえて環境を悪化させることでお互いの利得を下げるという「懲罰」として機能します。これによって、「懲罰」されなければ「協力」、「懲罰」されれば「裏切り」という形で他者の行動の協力性を判定する規範と違反者への罰を定める制度が生まれました。さらに、この「懲罰」ができるようになると、利己的なプレーヤーは絶滅して、持続可能な資源利用が安定的に実現するようになりました。このことから、相互監視に基づいて、持続可能な資源利用を実現する制度が生まれるメカニズムが明らかになりました。

図2 進化力学系ゲーム理論による制度の自己組織化

  • (A)意思決定関数のパラメータの進化の過程。パラメータS(橙)が負になることは、自分が裕福なときに収穫しにくくなることを示し、パラメータO(紫)が正になることは相手が裕福なときに収穫しやすくなることを示す。黒点は各世代での平均利得を示し、赤星は(B)に示す世代(30、100、300、1,500)に対応している。
  • (B)各世代でのゲームの例。図の緑線は資源量、上部の赤と青の塗りつぶしはプレーヤー1と2の収穫行動(白抜きは待機)を示し、図下の数字が彼らの利得を示す。30世代目では、全ステップで収穫してしまい、資源が枯渇する「共有地の悲劇」が見られる。100世代目ではSとOが減少したことにより、収穫頻度が下がり資源は成長するが、利己的なプレーヤー(赤)が協力的なプレーヤー(青)を搾取している。300世代目ではSが減少、Oが増大したことで、懲罰が可能になり、お互いが協力的とみなす範囲でのみ収穫を行うようになる。1,500世代目ではSとOのさらなる変化により、分業が進み、最も効率的な資源利用が実現している。

さらに、進化力学系ゲーム理論のための、新しいゲーム理論概念を提案しました。上述の通り、この理論では、行動の結果としての環境変動を考える点と、プレーヤーの戦略として意思決定関数を考える点が新しく、それに応じて、従来のゲーム理論概念を更新する必要があります。

本研究では、(1)進化の結果、環境とプレーヤーの状態の変動は周期的な振動(規則的な繰り返し)に落ち着くこと、(2)その振動は意思決定関数が多少変化しても全く不変で、意思決定関数がある閾値(しきいち)を超えて変化したときに急に別の振動に変わることを示し、(3)意思決定関数(とそれがもたらす制度)の安定性を測る基準を定義しました。進化力学系ゲーム理論一般に適用可能なこれらの概念を定義することで、この理論を本研究の対象にとどまらない、新しいゲーム理論的枠組みとして提案しています。

以上のことから、人々が資源量と利用者(プレーヤー)の状態を観察できれば、試行錯誤によって、「何が協力で何が裏切りか」の基準を自発的に生み出し、裏切りへの罰を行うことで持続可能な資源利用を実現できることが理論的に示されました。

今後の期待

本研究では、共有資源管理の最も単純な系として、2人のプレーヤーが一つの資源を管理する系を考えました。今後はこの枠組みを拡張し、大多数のプレーヤーが共同管理するときに持続可能な資源利用を実現するための条件を考える予定です。また、進化力学系ゲーム理論の対象を共有資源管理以外の系にも拡張して、新しいゲーム理論的枠組みを確立することも目指しています。この一連の取り組みは、制度が生まれるメカニズムと条件を明らかにすることで、なぜある地域では機能する制度が生まれたのに、他の地域では生まれないのか、どうすれば制度を生めるようになるのかを説明し、現代社会の喫緊の課題である持続可能な資源利用を実現するための一般理論の構築につながることが期待されます。

補足説明

  • 1.ゲーム理論
    複数の利害関係者(プレーヤー)が関わる意思決定を数理的に分析するための理論。主に各プレーヤーが得られる利益がそれぞれのプレーヤー自身の行動だけでなく、他者の行動にも依存するような相互依存的な状況を対象とする。各プレーヤーの行動を「戦略」、その戦略の結果として各プレーヤーが得る利益を「利得」と呼び、各プレーヤーがどのような戦略を取るかを分析する。
  • 2.制度(社会生活を形作る規則や規範)
    社会の中で人々に共有された規則・規範・予想で、人々の行動に一定の規則性を与えるもの(アブナー・グライフ『比較歴史制度分析』筑摩書房、2021年)。
  • 3.ゲームの解として安定
    ある戦略(行動のこと)が集団全員に共有されているときに、仮にそのうちの1人が別の戦略を取ったとしても、その人が損をする結果、元の行動が集団内に保たれる戦略を進化的に安定な戦略という。そして、制度がゲームの解としての安定性を持つとは、その制度によって実現している規則的な行動が進化的に安定であることをいう。
  • 4.力学系(関数で記述された規則により時間変化するシステム)
    関数で定義された一定の規則に従って、時間の経過とともに状態が変化するシステム。今回は資源の自然成長と収穫による変動を関数として定義して、資源量の時間変化をモデル化した。
  • 5.自己組織化
    初めは無秩序だった系に、それを構成する個々の要素の振る舞いによって、全体的な秩序が生まれる過程。

国際共同研究チーム

理化学研究所 脳神経科学研究センター 理研CBS-トヨタ連携センター
計算論的集団力学連携ユニット
基礎科学特別研究員 板尾 健司(イタオ・ケンジ)

コペンハーゲン大学(デンマーク)ニールスボーア研究所
教授 金子 邦彦(カネコ・クニヒコ)

研究支援

本研究は、理化学研究所基礎科学特別研究員研究費「多階層進化理論による社会構造の構成的記述(研究代表者:板尾健司、202401061006)」、ノボ・ノルディスク財団研究助成金「Establishment of Universal Biology and Applications to Life Sciences(邦訳:普遍生物学の確立と生命科学への応用、研究代表者:金子邦彦、課題番号:NNF21OC0065542)」の助成により実施されました。

原論文情報

  • Kenji Itao, Kunihiko Kaneko, "Self-organized institutions in evolutionary dynamical-systems game", Proceedings of National Academy of Sciences(PNAS), 10.1073/pnas.2500960122

発表者

理化学研究所
脳神経科学研究センター 理研CBS-トヨタ連携センター 計算論的集団力学連携ユニット
基礎科学特別研究員 板尾 健司(イタオ・ケンジ)

発表者のコメント

今回の研究では、ゲームにおいてプレイヤーが「どのように行動するか?」ではなく、「どのように考えて行動するか?」をモデル化することで、ゲームの中でプレイヤーたちがルールを作っていく過程をシミュレーションしました。人間が集団生活の中で自らルールを定めるという社会的なプロセスを説明するために、物事の変動を数式で捉える力学系の数理を用いるところがポイントです。今後も、社会科学の知見と物理学の方法を組み合わせた学際的なアプローチによって、制度が生まれるメカニズムを説明する研究に取り組んでいきます。

板尾 健司

報道担当

理化学研究所 広報部 報道担当
お問い合わせフォーム

産業利用に関するお問い合わせ

お問い合わせフォーム

他の画像

関連業界

読込中
S