PDA

توجه ! این یک نسخه آرشیو شده می باشد و در این حالت شما عکسی را مشاهده نمی کنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : نظريه بازيها 1



donya88
08-13-2010, 06:50 AM
اساسا نظريه بازيها , رياضيات استراتژي است . مقدماتيترين تئوري در اين زمينه قضيه مينيماکس است که بيان مي دارد که اگر همه بازيکنان يک بازي به بهترين شکل بازي کنند ( بهترين استراتژي بهينه) نتيجه پيامدهاي بازي قابل پيش بيني خواهد بود .
هر نوع بازيي از بازي تيک – تاک – توي تا بازي بازار سهام مي تواند توسط نظريه بازيها پيش بيني گردد. مسلما تفاوتهايي اساسي در پيش بيني نتايج بازي تيک – تاک – توي و پيامدهاي بازار سهام وجود دارد . هنگاميکه تيک – تاک – توي توسط دو بازيکن زيرکانه بازي شود همواره به تساوي مي انجامد. در عين حال همه ما مي توانيم به روشي که حرکتهاي احتمالي خوانده مي شود و با فرض اينکه مردم با سرمايه به شکل منطقيي بازي مي کنند در بازار سرمايه فعاليت نماييم . البته گرايش به امور صرفا موقتي که باعث اقدامات غير منطقي و غير قابل پيش گويي ميگردد مي تواند باعث از دست دادن سرمايه گردد, حتي اگر اهتمام فراواني در بکارگيري فرمولهاي رياضي با هدف پيش بيني پيامدها صورت گرفته باشد. بطور مثال حمله تروريستي به مراکز مالي دنيا , تمامي مدلها را تخريب نموده و بازي سرمايه را تا حد سقوط کامل پيش مي برد .
نظريه بازيها با حرکتهاي منطقي در انواع مختلف بازيها سروکار دارد . تئوريهاي بازار سرمايه براي يک مدرس مبتدي بسيار پيچيده هستند بنابراين ما مقدمتا بحث را به روي بازيهاي ميزي (شطرنج و تخته نرد و ... ) و بازيهاي خانوادگي( دبرنا و معماهاي خانوادگي و ...) متمرکز مي کنيم که بيشتر افراد با آنها آشنا هستند . مشخصه هاي مهم بازيها عبارتند از :
1- تصادفي و غير تصادفي بودن بازيها ( Non – random vs. random ) : بازيها رندومي شامل تعدادي عناصر تصادفي هستند: تاس, صفحه هاي گردان , توزيع ورق در پاسور, توپهاي پينگ پونگ در ماشين لوتو( قرعه کشي) . بازهاي غير رندومي استراتژي خالص و ناب هستند : چکرز – شطرنج - تيک – تاک – توي , غيره.
2- آگاهي کامل- بدون آگاهي کامل ( perfect knowledge vs. Non perfect knowledge ) بازيهاي با آگاهي کامل,آنهايي هستند که تمام ترکيب بازي براي همه بازيکنان قابل رويت است : شطرنج, چکرز, مونوپولي, غيره. دربازيهايي بدون آگاهي کامل ظاهر و ترکيب بازي براي همه بازيکنان پوشيده است. همچون بازيهاي ورق , باتل شيپ و استراتژو( بازيهاي استراتژيک) .
3- يک بازيکن. دو بازيکن. N بازيکن : بازيهاي تک نفره ( مارپيچ , پازل و غيره) که شامل بازيهاي اشتراکي ( cooperative ) نيزمي باشد بازيهايي هستند که در آنهاهر کسي سعي مي کند پيامد بازي را بدون رقابت ( و مسابقه) به نفع خود به پايان ببرد. بازي A.I ( يا مسابقات تلويزيوني يا شراکت در يک بنگاه اقتصادي در تامين اهداف کلان سازمان ) که مي تواند بيش ازچند هزار بازيکن ( شرکت کننده ) داشته باشد , در حقيقت يک بازي تک بازيکن است زيرا همه اين بازيکنان در يک تيم بازي مي کنند. بازيهاي دو بازيکن آنهايي هستند که فقط دو بازيکن (همچون شطرنج, باتل شيپ. غيره ) يا دو تيم (براي مثال مسابقات ورزشي) و نه بيشتر درگير بازي مي باشند. دربازيهاي N بازيکن دو يا چند نفر درگير هستند همچون مونوپولي, پوکر, لاتاري, يا بازار سرمايه. بايستي توجه داشت که در بازيهاي N بازيکن , امکان بازي بيش از دو بازيکن نيز وجود دارد حتي اگر اين بازيها با دو نفر انجام گيرد . ( مثل بازي زو و کليه فعاليتهاي اقتصادي در بازار )
4- مجموع صفرو مجموع غير صفر( Zero sum vs. Non zero sum ) : در بازيهاي مجموع صفر تمامي ارزش بازي يا همانطور باقي مانده و يا تنزل مي کند. در يک بازي پوکر معمولي بازيکنان بازي را با همان مقدار پولي که ورقها ( يا ژتونها) را مي خرند, شروع مي کنند ,. اگر 6 بازيکن هر کدام با قيمت 50 دلارژتون شروع کنند, در هرمرحله از بازي مجموع موجودي بازيکنان و گلدان برابر 300 دلار خواهد بود. بازيهای انتخاباتی از جمله بازيهای مجموع صفر هستند.
شطرنج , بازي مجموع صفر ديگري است زيرا تعداد مهره هاي شطرنج هرگز نمي تواند افزايش يابد. بازيهاي مجموع غير صفر آنهايي هستند که ارزشهاي بازي مي تواند کاهش يابد و کاهش يافتني هم هستند. درمونوپولي هر زمان هر کسي از خانه شروع ( GO ) گذر کند 200 دلار از پول مونوپولي به بازي اضافه مي شود. اتلو از ديگر بازيهاي خانگي , بازي مجموع غيرصفر ديگري است که در مراحل مختلف بازي مهره هايي به بازي اضافه مي گردد.
بين اقتصاددانها و غير اقتصاددانها بحثهاي زياد در رابطه با ماهيت فعاليتهاي اقتصادي مطرح است از جمله اينکه گروهي اقتصاد را يک بازي مجموع صفر مي دانند. بر اين اساس کل علم اقتصاد از ديدگاه ايشان , توزيع پايدارو مداوم توده ثروت است. بنابراين هماهنگ با هم ثروتمند ثروتمند تر شده و فقير فقيرتر مي گردد. حال آنکه بيشترافراد بر اين باورند که اقتصاد يک بازي مجموع غير صفر است . پس هرگاه ثروتي ايجاد مي گردد, ثروتمند متمول تر شده و فقير هم متمول مي گردد. اين موضوع اختلاف اساسي بين تئوري هاي سوسياليستي و تئوريهاي کاپيتاليستي است.
قاعده عمومي بازي عبارت است از :
{ درهر بازي " دو بازيکن" , " مجموع صفر" , " غير تصادفي" , " باآگاهي کامل " يک استراتژي کاملي وجود دارد که حد اقل نتيجه مساوي را در يک بازي تضمين مي نمايد . }به طور مثال در هر مذاکره ای هرگاه استراتژی کاملی را از پيش در نظر گرفته باشيد هيچگاه بازنده مطلق نبوده و حداقل نتيجه تساوی را اخذ خواهيد نمود.
اما اين بازيهاي دوبازيکن ,مجموع صفر, غير تصادفي , آگاهي کامل چه بازيهايي هستند؟ چکرز, شطرنج, تيک- تاک- توي , نيم , نقطه ( خط و نقطه) و غيره. ما برخي از اين استراتژيهاي مطلوب ( ايده آل) را مي شناسيم که چه هستند.اما يکي از آنهايي که نمي دانيم شطرنج است . استراتژي آن بسيار پيچيده است بحدي که کوششهاي بسياري در کامپيوتري نمودن اين استراتژيها و خلق يک بازيکن تمام عيار صورت گرفته است همچون " Deep blue " .( شطرنج باز رايانه اي ساخت اي.بي.ام و حريف کاسپاروف در سالهاي 1996 و 1997) .
يکي از ديگربازيهايي که با آن آشنايي داريم تيک- تاک – توي ( سه به سه قطار- رج) است. ) مثلا...)










X
X
O
O
O
X
X
O
X





هنگاميکه O آغاز مي کند , 9 حرکت ممکن براي او وجود دارد و X نيزمتقابلا 8 حرکت مي تواند انجام دهد که د رمجموع 72 گشايش امکان پذ ير است . ما مي توانيم 880,362 (!9) پيامد ممکن را براي بازي محاسبه نماييم که وجود دارد . البته بااين روش بسيار گزافه گفته ايم زيرا بيشتر بازيها قبل ازاينکه بازيکنان 9 حرکت را کامل کنند به تمام مي رسد.
هنگاميکه ما درحال حذف بازيها هستيم , درواقع شروع به گزينش حرکتهاي زيرکانه مي کنيم. اگر O شروع کند, قطعا به درستي با مرکز مربع يا يکي از نقاط گوشه ها بازي را گشايش خواهد کرد. بنابراين تنها 5 حرکت قابل پيش بيني جهت شروع بازي وجود خواهد داشت و اگر X نيز زيرکانه بازي کند, با خانه ميانه ( مربع ) مقابله خواهد کرد اگر O يکی ازگوشه ها را برگزيده باشد , يا با يک گوشه جواب خواهد داد در صورتيکه O ميانه ( مربع ) را انتخاب کرده باشد. بنابراين يک بازيکن درنقطه مياني وديگري در يکي از نقاط گوشه بازي را آغاز خواهند کرد و بدين ترتيب حرکتهاي دور گشايش به 8 پيامد ممکن زيرکانه ختم مي شود.

هر بازي امکان پذير در واقع انعکاسي از اين 6 پيامد پيش بيني شده است. 6 پيامد غير گزافه وجود دارد , که يا بر حسب تمايل يا در واکنش با بازي حريف برگزيده شده است, و درمجموع 48 پيامد منطقيي که در بازي تيک – تاک – توي وجود دارد , شانسهاي امکان پذيري براي هر دو حريف مي باشند .


استراتژي بهينه:
روش تحليل رياضي بازي عبارت است از تهيه جدولي از پيامدهاي ليست شده براي هر استراتژي. جدول يک استراتژي دو بازيکن غير رندوم ممکن است همچون اين باشد:













Player A - Strategy 1


Player A - Strategy 2


Player A - Strategy 3


etc.


Player B - Strategy 1


Tie


A wins


B wins


...


Player B - Strategy 2


B wins


Tie


A wins


...


Player B - Strategy 3


A wins


B wins


Tie


...


etc.


...


...


...


...











استراتژي انتخابي بازيکنان مي تواند منجر به نتايجي از بازي , مطابق با جدول فوق گردد. دو استراتژي در جدول مي توان يافت:
مينيماکس: حداقل نتيجه مطلوب( good ) از همه پيامدهاي مثبت.
ماکسيمين: حداقل نتيجه نا مطلوب ( bad ) از همه پيامدهاي منفي.
قضيه مينيماکس: هرگاه يک مينيماکس يک بازيکن مشابه با يک استراتژي ماکسيمين بازيکن ديگرباشد, آنگاه آن استراتژي, بهترين نتيجه اي است که هر دوبازيکن مي توانند انتظار داشته باشند. ( در مذاکره هاي استخدامي غالبا بازي به يک استزاتژي بهينه براي هر دو طرف مي انجامد) پس اگر احتمال يک نتيجه مساوي وجود داشته باشد, اين نتيجه بهترين پيامد مورد انتظار خواهد بود . اين نتيجه را نقطه زيني مي نامند.
توجه کنيد به مثال دو بچه اي که استدلال مي نمايند که چه کسي آخرين برش کيک را تصاحب نمايد. تصميم گرفته مي شود که يکي از بچه ها کيک را ببرد و ديگري قطعه کيک را براي خوردن انتخاب نمايد. جدول استراتژي مطابق زير مي باشد:












Chooser chooses biggest piece


Chooser chooses smallest piece


Cutter cuts even


Chooser gets a crumb more


Cutter gets a crumb more


Cutter cuts uneven


Chooser gets a big piece


Cutter gets a smal piece










راه حل مينيماکس براي انتخاب کننده تصاحب نيمي از کيک به علاوه يک خرده بيشتر است که اين راه حل ماکسيمين براي برش دهنده نيز مي باشد. تقريبا اين نتيجه مسلمي بود که مي توانست پيش بيني گردد.
برخي از بازيها پيامد با نقطه زيني ندارند , درواقع اين مسئله براي بيشتر بازيها مصداق دارد. يک مثال ساده سنگ - کاغذ - قيچي است .











A chooses ROCK


A chooses SCISSORS


A chooses PAPER


B chooses ROCK


tie


B wins


A wins


B chooses SCISSORS


A wins


Tie


B wins


B chooses PAPER




B wins


A wins


tie







با وجود نداشتن پيامدي با نقطه زيني قابل پيش بيني , استراتژي اختلاطيي وجودارد که به بهترين شکلي نتيجه بخش است. استراتژيي که بر مبناي انتخابي کاملا تصادفي و د رعين حال امکان پذيرخلق مي گردد, گزينش يکي از سه حالت سنگ , کاغذ و قيچي بدون در نظر داشتن الگوي خاصي است. اگر شما به گزينه خاصي توجه داشته باشيد و يا اگر گزينش شما از يک الگوخاصي تبعيت مي کند,بدانيد که اين امکان براي حريف شما فراهم شده است تا بر اساس الگو مورد نظرشما برنده بازي شود. البته استراتژي هاي بدتري هم وجود دارند.( تمامي تمهيدات مديريتي در تسلط و تاثير بر برنامه هاي کلان در زندگي شخصي پرسنل سازمان با آگاهي از استراتژي ايشان , ميزان پايبندی به اصول اخلاقی و قوانين و مقررات مدنی و درون سازمانی صورت گرفته و بر اساس قدرت مانور در انتخابهاي مختلف است که سرنوشت کاري هر يک از اعضای سازمان رقم مي خورد ) .
ليزا: توجه کن! فقط يک راه براي تعيين نتيجه سنگ – کاغذ – قيچي وجود دارد .
ذهن ليزا: بيچاره "بارت" که قابل پيش بيني است. هميشه سنگ را انتخاب مي کند.
ذهن بارت: سنگ خوبه . هيچ چيزي نمي تونه به اون غلبه کنه!
(بارت سنگ را نشان ميدهد , ليزا کاغذ را ) .
بارت: اوه
سيمپسونها ( قطعه " the front " )

يک استراتژي اختلاطي: عبارت است از انتخاب احتمالي بين استراتژي هاي مختلفي که مبنتي بروزن احتمالات محاسبه شده اند. در مورد سنگ , کاغذ, قيچي , بهترين استراتژيها آنهايي هستند که بار( احتمالي) مساوي دارند. يعني تا بازيکنان و تمايلات يا اهداف ايشان مشخص نباشد تا براساس آن بتوان براي هر گزينه احتمالي را محاسبه نمود, امکان پيش بيني پيامد ها و انتخاب استراتژي مناسب وجود نخواهد داشت.
استراتژيهاي اختلاطي و بازيهاي تصادفي
بيشتر بازيها با عناصري تصادفي سرو کار دارند, پرتاب يک طاس , توزيع ورقها, غيره . درحاليکه قضيه مينيماکس نميتواند استراتژي برد را در اين بازيها تضمين نمايد , استراتژي اختلاطيي وجود دارد که مي تواند بهترين گزينه برد را در اختيار شما قرار مي دهد .
به مثال زيرشامل نمودار بين پرتابگر و توپ زن ( دربازي بيسبال) توجه نماييد. ميانگين تعداد دفعات زدن توپ مبتني است برنحوه پرتاب پرتابگر و آنچه توپ زن انتظار دارد .









Batter expects a Curveball


Batter expects a Fastball


Batter expects a Screwball


Pitcher throws a Curveball


.400


.300


.000

Pitcher throws a Fastball


.200


.400


.300

Pitcher throws a Screwball


.000


.200


.400








بر مبناي اين احتمالات , اين پرتابگراست که تصميم ميگيرد چگونه توپ را پرتاب نمايد و متقابلا توپ زن بايستي برمبناي گمان خويش از نوع پرتاب , نحوه زدن توپ را انتخاب نمايد. بهترين استراتژي اختلاطي براي پرتابگر عبارت است از پرتاب screwball ها با 60 % درهر نوبت و curveball ها با 40% در هر نوبت . درپاسخ توپ زن انتظار 80 % fastball ها و 20 % screwball ها را دارد. اگر هر دوآنها اين استراتژيها را بکار گيرند, توپ زن به طورمتوسط 240 ضربه خواهد زد. ما از چگونگي محاسبه اين استراتژي اختلاطي حين بازي و درآن شرايط سر در نمي آوريم. چيزي که مهم است اين که در هر بازي مجموع صفر , دو بازيکن وضعيتي وجود دارد که يک استراتژي اختلاطي ايده آل را در آن مي توان يافت.
بازيهاي مجموع غير صفر
دربازيهاي مجموع غير صفر , يک مجموع ارزش تثبيت شده وجود دارد . هرمرحله پيروزي براي يک بازيکن به معني باخت بازيکن ديگر است . بازيهاي مجموع غير صفر به معني اين است که هر دو بازيکن بالقوه توان بدست آوردن يا از دست را دارند که وابسته به استراتژي ايشان مي باشد . به بازي ( chicken ) توجه نماييد , دو نوجوان در اتومبيلهايشان به سرعت به طرف يکديگر مي رانند. اگر يکي بترسد و منحرف شود ديگري مي برد . اگر هردو منحرف شوند هيچکس نمي برد اما هر دو باقي مي مانند. اگر هيچ کدام منحرف نشوند هر دو ماشين هايشان و احتمالا زندگيشان را مي بازند . استراتژي برد ( ايده آل ) ؟ انحراف
بازي مشهور مجموع غير صفر ديگر معماي زنداني است: دونفر که مظنون به شرکت در يک سرقت مسلحانه هستند در جريان يک درگيري سخت دستگير مي شوند. هر دو جداگانه مورد بازجويي قرار مي گيرند و وعده يک معامله با شرايط يکسان ( به هر دو ) داده مي شود:
" اگر تو دوستت را لو بدهي مي تواني آزاد شوي ولي دوستت 5 سال حبس خواهد شد . اگرشما هر دو يکديگر را لو بدهيد , هر دو شما به سه سال حبس محکوم خواهيد شد و اگر هيچکدام لو ندهيد , شما هر دو يک سال در مرکزبازپروري خدمت خواهيد کرد ."
اگر شما يکي از زنداني ها بوديد چه مي کرديد؟
اين مورد مثالي از بازي مجموع غير صفر بدون نقطه زيني مينيماکس مي باشد. شرط خدمت براي هر دو زنداني بهترين شرط است هر گاه هر دو دهانهايشان را بسته نگه دارند . اما در شرايط فردي ( بدون احتساب منافع طرفين ) بهتر آن است که دوستتان را لو بدهيد .
دراينجا موردي را مي خواهم مطرح نمايم که جنبه مثبت تري دارد و در کلاسهاي درس بحثهاي زيادي ايجاد مي نمايد:
يک آدم خير عجيب 3000 دلار به هر عضو کلاس که آن را از او بخواهد اعطا مي کند مشروط بر اينکه همه شما در صورت خواستن هديه فوق کلمه " بلي" را نوشته باشيد. اکنون همان آدم خيرعجيب بنا به اعتقادي که به تلافي تواضع و حس مشارکت دارد درقبال اينکه هر کسي بنويسد " نه " يعني نميخواهم , به هر عضوي 10000 دلار مي دهد و اگرفقط يک نفر بنويسد " بلي" يعني مي خواهم مثل قبل فقط 3000 دلار به همه خواهد داد و هرهمه بنويسند " نه " نمي خواهم , هيچ چيزي دريافت نخواهند کرد. اگر شمابوديد چه مي کرديد؟
آيا شما 3000 دلار را تضمين ميکرديد يا شما به بقيه کلاس اعتمادمي کرديدجهت دريافت 10000 دلار؟
اغلب اين بازيها, بازيهاي آفت– اشتراک (منافع) ناميده مي شوند, و اين بازيها در ارتباط با موقعيتهاي اخلاقي بسيار قابل توجه هستند. آيا شما راي مي دهيد ؟ همکاري در يک امر خيرچطور؟ انجام اين چيزها مستلزم صرف وقت و پول شماست ولي تلاش فردي شما تاثير زيادي نخواهد داشت اما اگر افراد بيشتري همياري داشته باشند, آن وقت نتيجه متفاوت خواهد بود.

جنگ تصادفي است , با N بازيکن , مجموع غير صفر و بدون آگاهي کامل از وضعيت بازي که به هوشياري و زيرکي فوق العاده ,همچنين تفکري برمبناي استراتژي نياز دارد, جنگ نياز به ريسک هم خواهد داشت . نقطه زيني ممکن است رسيدن به اين نتيجه باشد :
" ما چنگ را پيروز خواهيم شد , اما قريب به يقين چندين چالش و نبرد را از دست خواهيم داد . "
اميدواريم هر استراتژي که در مذاکرات سياسي و يا نظامي اتخاذ مي نماييم به نتيجه مطلوبي بيانجامد( يعني تعداد شکستها و باج ها در چالش ها و مذارکرات بينابين کاهش يافته و با حداقل باختها به برد دست يازيم .