メディア
連載
» 2017年02月28日 11時30分 UPDATE

Over the AI ―― AIの向こう側に (8):陰湿な人工知能 〜「ハズレ」の中から「マシな奴」を選ぶ (9/10)

[江端智一,EE Times Japan]

min-max戦略の概要

 では、次の図(Step 2)をご覧ください。

 さて、<次女>の第3週目の評価値(の合計値)に対して、当然<長女>の第3週目は、この<次女>の評価値合計を、最悪にするように振る舞うはずです。これが、<長女>のmin戦略となります。

 具体的には、<次女>が第3週において"18"と"14"を選べる選択肢があるなら、<長女>は、必ず"18"の選択肢を「つぶす」ような選択を行います。

 ただし、<長女>が、実際にmin戦略を取るかどうかは分かりません。ここでは<長女>が、クレバーに振る舞うことを想定しているだけで、<長女>が何にも考えてなれば、当然、戦略は<次女>に有利に働きます。

 では、次の図(Step 3)をご覧ください。

 この<長女>のmin戦略に対して、<次女>はその最小値の中の最大値を選択します。これが<次女>のmax戦略となります(Step 3)。ただし、ここでも<次女>が選択を間違えると、戦略は狂ってきます。

 では、次の図(Step 4)をご覧ください。

 さらに<長女>はmin戦略を取ると想定します。

 さらに、次の図(Step 5)をご覧ください。

 ここに、<次女>が、3週目において、最悪でも評価値の合計"14"が確保できる戦略が成立したことになります。もちろん<長女>が選択を誤れば、この14は、15、16、17、18にもなる可能性があります。

 <次女>は、この指し手を保持しながら、<長女>が「ポカ」をするのを待てば良いのです。

 さて、これを現実の世界で現わしたものが、以下の図になります。

 <次女>は3週先まで読みながら、今週のメニューを決めていますので、場当たり戦略の<長女>に負けることは、まず、ありません。仮に<長女>がクレバーな状態を続けていた場合は、勝負の行方は分かりませんが、<長女>が1回でもmin戦略をミスってくれれば、<次女>の勝利は確定的です。

 この「min-max戦略」は、「囚人のジレンマ」「吉田屋 vs. 大スキ屋」のケースを、時間軸方向に拡張したものと見ることもできます。

 「囚人のジレンマ」「吉田屋 vs. 大スキ屋」では、4つのケースを想定すればよかったのに対して、今回の「グルメな彼氏」のケースでは、3週先のメニューまで、時間方向に引き伸ばし、294万4656ケースを想定し、かつ、min-max戦略を加えている点において異なります。

 しかし、いずれのケースにおいても、ゲーム戦略の基本的な考え方「最悪の中の最良を選ぶ」という点では同じです。


 さて、ここから「ゲール=シャプレーアルゴリズム」、いわゆる「安定結婚問題」にも及びたかったのですが、残念ですが、(いつも通り)紙面の問題があり、ここで断念します。

※編集注)今回も安定の超ロング原稿でした。

 ただ、この「安定結婚問題」のオチは、「私が、『実際の合コンで「ゲール=シャプレーアルゴリズム」なんぞ使えるわけなかろうが!』と叫ぶ」 ―― となるはずでした。

 ここから先は、皆さんの自発的な勉強に委ねることに致します。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.