چکیده:
هدف این مقاله ارائه مدلی جدید از جستجوی استراتژیهای بهینه در بازی معمای زندانی تکراری با استفاده از الگوریتم ژنتیک است. بدین منظور با شبیهسازی رقابت بین ایران و عربستان در ائتلاف اوپک نفتی، از 12 نوع استراتژی مطرح در بازی معمای زندانی تکراری طی 20 اجرای الگوریتم ژنتیک بهمنظور حداکثرسازی امتیازات فردی بازیکن و نیز حداقلسازی امتیاز برازندگی رقیب استفاده شده است. نتایج نشان داد استراتژی "عمل متقابل" حائز بالاترین بازدهی متوسط در هر دو رقابت بوده و در رتبههای بعدی استراتژیهای "اکثریت موافق"، "ماشه" و "عمل متقابل پس از دو بار نقض همکاری رقیب" جای گرفتهاند. استراتژی "همواره عدم همکاری" نیز در رقابتها با کمترین بازدهی بهعنوان ناکاراترین استراتژی شناخته شده است.
Evolutionary game theory has been known as the most suitable tool for modeling the dynamics of strategic interactions. In this regard، evolutionary algorithms present the new approach for learning and decision modeling of bounded rationality factors. The objective of this study is providing the new model of searching for optimal strategies in iterated prisoner's dilemma (IPD) using genetic algorithm. For this purpose، by simulating competition between Iran and Saudi Arabia in OPEC oil Coalition، we used 12 strategy types over 20 runs of genetic algorithm for maximizing individual’s scores and also minimizing competitor fitness scores. Results show that “Tit for Tat” with the highest average fitness in both competitions known as the optimal strategy. The other strategis like; Soft Majority، Trigger & TF2T are next in ranking. The strategy “All D” is known as inefficient strategy in competition with the lowest productivity.
خلاصه ماشینی:
بدین منظور با شبیهسازی رقابت بین ایران و عربستان در ائتلاف اوپک نفتی، از 12 نوع استراتژی مطرح در بازی معمای زندانی تکراری طی 20 اجرای الگوریتم ژنتیک بهمنظور حداکثرسازی امتیازات فردی بازیکن و نیز حداقلسازی امتیاز برازندگی رقیب استفاده شده است.
همچنین 12 نوع استراتژی تصادفی برای هر یک از بازیکنان در نظر گرفته شده که طی 20 اجرای الگوریتم ژنتیک با هدف دستیابی به استراتژی بهینه حداکثرکننده امتیاز فردی و نیز حداقلکننده امتیاز رقیب در بازی معمای زندانی تکراری 5 (IPD) Duboz Et Al Genetic Algorithm Axelrod Marks Iterated Prisoner's Dilemma توسط اعضاء انتخاب میشوند.
در برخی مطالعات نیز مانند الحاجی و هوتنر 3 (2000) با لحاظ عدم ناهمگونی بین اعضای اوپک، عربستان سعودی را به عنوان بنگاه غالب در کارتل معرفی کردها > از سوی دیگر، برخی مطالعاتي که در چارچوب الگوي انحصاري به بررسی رفتار اوپک و طرف عرضه پرداختهاند، در قالب نظریه بازيها صورت گرفتها 4 a"/>a"/> (1999) با استفاده از رویکرد نظریه بازی به بررسی پویاییهای درونی کشورهای اوپک طی زمان پرداخته Polasky Pindyck Alhajji & Huettner Dutta گريفين و جيانگ 1 (1997) در مطالعات خود نشان دادهاند که با تشکيل کارتل و تبعيت از اصل همکاري در قالب بازی، منافع همه اعضاي اوپک در مقايسه با وضعيت رقابتي افزايش مييابد.
روبنشتاین و آزبورن 8 (1994) در مطالعه خود نتایج مسابقات آکسلرود را نقد کر Dawid Riechmann Tuyls Gintis Brown Wiegand Karandikar Rubenstein & Osborne عوامل بسیاری را مانند طول کروموزوم، طول بازی و لحاظ استراتژیهایی بهجز همکاری یا عدم همکاری محض را به عنوان استراتژی رقیب از جمله موانع بروز همه جانبه رفتار همکارانه در بازی عنوان نمودهاند.