メディア
連載
» 2017年02月28日 11時30分 公開

Over the AI ―― AIの向こう側に (8):陰湿な人工知能 〜「ハズレ」の中から「マシな奴」を選ぶ (8/10)

[江端智一,EE Times Japan]

「グルメな彼氏」を奪い合う

 と、まあ、このあたりの話はゲーム理論の「考え方」としては良く分かるのですが、上記の話は「AI技術」の話としては、良く分からないと思います。そこで、ゲーム理論が、実際のAI技術としてどのように使われているのかについて、具体的に説明したいと思います。

 今回は、「『グルメな彼氏』攻略ゲーム」というものを考えて、具体的なゲーム戦略のアルゴリズムを説明したいと思います。

 このゲームは、<長女>と<次女>が、1人の男性と、毎週末、交互にデートをして、ランチの提案をすることで、その男性を奪い合うというものです。

 「グルメな彼氏」は、グルメなので、もやし、納豆から、フランス料理のコースまで、なんでも楽しめる人ですが、同じようなランチが続くと、機嫌が悪くなります。

 できるだけ、週末のデートでは、前回のデートと、質や量ともに違う食事を取ると、彼氏のご機嫌は良くなります。例えば、先週末が「フランス料理のコース」で、今週末が「納豆ごはん」であったとしても、そのギャップが大きいので、彼氏はとても喜びます。

 逆に、たとえ「フランス料理のコース」であったとしても、それが2週連続で続けば、その2週目の「フランス料理のコース」を選んだ<長女>または<次女>の評価値は最低(0)になってしまいます。

 <長女>と<次女>は、なるべく得点のギャップが大きくなるようなランチを提案し続けなければなりません。今回は、<長女>と<次女>は、相互に食べてきたランチの内容を開示し合うことで、自分の戦略を立てることができます(これを「完全情報ゲーム」といいます)

 それぞれ13回の週末、合計26週分のデートをへて、これらのギャップの合計点が高い方(<長女>or<次女>)を、「グルメな彼氏」は、結婚相手として選ぶものとします*)

*)もし、こんな奴が本当に存在していたとしたら、父親として、私は娘の結婚をぶち壊すと思いますが。

 ただし、13個のメニューは、1回しか選ぶことができず、<長女><次女>ともに徹底した戦略が必要となります。

 そこで、<次女>は、ゲーム理論の「min-max戦略」を用いることにしました(<長女>は、「場当たり」で考えることにしました)

 min-max戦略とは、ゲーム理論の神髄、「最悪の状況下で、最終ラインを確保する」を実現するものです。このゲームは、<次女>の評価値の合計が<長女>のそれを1点でも超えれば<次女>の勝ちとなるのですから、大差をつけて勝利する必要はありません。

 min-max戦略の最初のステップでは、数回先の全パターンを全て「力づく」で描き出して、その評価値を計算するところから始まります。しかし、たった3週先のメニューを読むだけであっても、13x13x12x12x11x11=294万4656パターン(約300万パターン)の計算が必要になりますので、コンピュータの助けなしに計算することは難しいと思います*)

*)このようなmin-max戦略の組合せ爆発を回避する戦略として、「αβ戦略」があります(今回は割愛します)

 294万4656ものパターンを図に描くのは難しいので、以下に概略図を示します(Step 1)。

 上の図では、<次女>の3週目の評価値合計の最大値は"18"、最小値は"10"となっています。

 このケースでは、<次女>の目指すべき値は当然"18"ですが、<長女>にとってみれば"10"にする戦略が望ましいはずです。しかし、<次女>は、ゲーム理論(min-max戦略)を使うことで、<次女>は第1週のこの段階で、最悪でも"14"を担保できることが分かっているのです。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.