מעבר לתוכן


תמונה
- - - - -

משחק בדילמת האסיר איטרטיבית רבת משתתפים


  • Please log in to reply
16 replies to this topic

#1 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 00:16

בשל שעמום אקוטי בזמן האחרון ועודף זמן פנוי תכנתתי משחק במטלאב שמסמלץ דילמת אסיר איטרטיבית רבת משתתפים ומוגבלת בזמן.
מי שרוצה לקרוא מהי דילמת האסיר מוזמן לעשות זאת כאן.
לכל שחקן במשחק יש ארבעה סוכנים שנעים בצורה רנדומית (דיפוזיה) עפ"נ לוח תלת מימדי בגודל nXn כלשהו, שאינו חשוב לצרכינו. תפקידו של השחקן לקבוע את האסטרטגיה עבור כל סוכן לאינטראקציה עם שאר הסוכנים בלוח (כולל שלו). בכל אינטראקציה עם סוכן אחר עליו להחליט האם הוא משתף פעולה (מ') הוא בוגד (ב'). עפ"י החלטתו והחלטת הסוכן השני נקבעת התשואה של כל אחד מהם לפי הטבלה הבאה:
מ,מ=5,5
מ,ב=4,0
ב,מ=0,4
ב,ב=2,2

קל לראות שהמצב האידיאלי הוא המצב בו היריב יוצא פראייר, כי הוא משתף פעולה ואילו אתה בוגד. לעומת זאת, שיתוף פעולה הדדי נותן את התשואה הגבוהה ביותר סה"כ.
כדי להעלות את העניין במשחק יש לכל שחקן זיכרון של כל ההחלטות שקיבלו היריבים שלו כשהם נפגשו איתו. זה מאפשר כמובן "פעולות תגמול" לסוכנים שדפקו אותך קודם. עם זאת, כניסה למצב שבו שני השחקנים דופקים אחד את השני תוביל לניקוד נמוך של 2 לכל שחקן. כדי להדגיש את הדילמה אפילו יותר (אני לא אסביר למה, מי שירצה לדעת שיחפש) המשחק מוגבל בתורות וכל השחקנים יודעים בדיוק כמה תורות נותרו לסוף המשחק.


אני אפעיל את המשחק למשך 1000 תורות כדי להקטין את החשיבות של התנועה הרנדומית. ברגע שיהיו 10 אסטרטגיות אני אבצע משחק אחד.
למען הנוחות שלי אני נותן יתרון אוטומטי למי שיכתוב לי אסטרטגיה בצורת פונקצית מטלאב מהצורה הבאה:
function [result]=strategy(player,a,c,S,t) ddddd
כאשר a הוא הסוכן שלך, c הסוכן השני,t מספר התורות עד לסיום,S היא אורך צלע של המשטח ו-player הוא structure בעל מספר חלקים שמתוכם לכם חשוב רק אחד:
mem- מערך דו מימדי שמכיל שורה עבור כל סוכן שבה כל תוצאות האינטראקציה עם אותו סוכן. התוצאות הן 1 עבור משתף פעולה ו- (1-) עבור בוגד.
לכן כדי לפנות לשורה שמכילה את התוצאות עבור האינטראקציה עם הסוכן אני צריך לפנות כך:
player(a).mem(c,: ) ddddd
אתם יכולים לבצע כל ניתוח סטטיסטי של המפגשים הקודמים כרצונכם על מנת לקבוע את ההחלטה שלכם. הפלט של הפונקציה הוא result שמכיל 1 או 1- לפי החלטת האסטרטגיה שלכם.
למרות שאשמח לסקריפט מטלאב פשוט אני אקבל גם אסטרטגיות שמנוסחות במלים כל עוד אין בהם סתירות לוגיות. אם יש, אני אחזיר לכם מייל ואבקש תיקונים.
מי ששולח סקריפט מטלאב שישלח גם את האסטרטגיה במלים כדי שאוכל לוודא שהסקריפט מבצע באמת את האסטרטגיה.
אתם מוזמנים לשלוח אסטרטגיות, הערות ונאצות לה"פ שלי או למייל:
barg23 ביאהו.

נ.ב.
"מידה כנגד מידה" תשמש כרפרנס לתוצאות של שאר האסטרטגיות אז נא להיות יותר יצירתיים.
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#2 Sparklehorse

Sparklehorse

    משומש במצב טוב

  • רשומים+
  • 1696 הודעות:

פורסם 14/08/2007 - 02:22

בשל שעמום אקוטי בזמן האחרון ועודף זמן פנוי תכנתתי משחק במטלאב שמסמלץ דילמת אסיר איטרטיבית רבת משתתפים ומוגבלת בזמן.

נשמע מעניין. רק כמה הערות:
א. יש לך טעות במטריצה - בשורה שהשלישית זה 0,5 ולא להיפך.
ב. קישורים קצת יותר רלוונטיים פה ופה
ג. אתה יכול להסביר במה התחרות הזאת שונה מזו שבלינק ששמתי?

תמונה מצורפת


#3 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 13:17

יש מספר הבדלים:
2. אם ראיתי נכון, הסוכנים שלו אינם חיים במרחב מסויים ולכן אין אלמנט רנדומי.
3. המשחק הזה הוא בסיס למשחקים אחרים שילכו יותר לכיוון של אבולוציה (פיזית וחברתית) שאני חושב עליהם בהמשך כך שהוא מעין פיילוט שאני רוצה לבדוק.
4. אתה מוגבל ל-16 אסטרטגיות. אצלי אין הגבלות כלל.
5. אין לו התייחסות לזמן, כלומר, אצלו מדובר בעצם בדילמת אסיר איטרטיבית בלתי מוגבלת בזמן (מבחינת הסוכנים).
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#4 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 13:17

יש מספר הבדלים:
2. אם ראיתי נכון, הסוכנים שלו אינם חיים במרחב מסויים ולכן אין אלמנט רנדומי.
3. המשחק הזה הוא בסיס למשחקים אחרים שילכו יותר לכיוון של אבולוציה (פיזית וחברתית) שאני חושב עליהם בהמשך כך שהוא מעין פיילוט שאני רוצה לבדוק.
4. אתה מוגבל ל-16 אסטרטגיות. אצלי אין הגבלות כלל.
5. אין לו התייחסות לזמן, כלומר, אצלו מדובר בעצם בדילמת אסיר איטרטיבית בלתי מוגבלת בזמן (מבחינת הסוכנים).
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#5 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 15:24

עדכנתי את ההודעה המקורית והוספתי לקלט של האסטרטגיה את מספר התורות עד לסיום ואת גודל הלוח (כדי שתוכלו להעריך כמה מפגשים אפשריים בתורות האחרונים עם סוכן מסויים).
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#6 זיו

זיו

    משתדל

  • רשומים+
  • 11586 הודעות:

פורסם 14/08/2007 - 17:22

מ,מ=4,4
מ,ב=5,0
ב,מ=0,5
ב,ב=2,2

זה לא נראה סביר.
על כל בגידה כפולה אתה תקבל לפחות כמות הנקודות שקיבלת על "שיתוף" מוצלח אחד, רק שהפעם יש לך פעמיים אפשרות לזכות ב5.
מקסימום 10 מינימום 4, לעומת מקסימום 8 מינימום 0.

לדעתי הניקוד לא מוצלח.
האלטרנטיבה שלי:
מ,מ=4,4
מ,ב=3,0
ב,מ=0,3
ב,ב=1,1

לדעתי בזה יש יותר איזון בין היתרונות בשיתוף לעומת היתרונות של בגידה, והסיבה המרכזית היא שהאלמנט הקירטי הוא היחסיות לשאר המשתתפים: המטרה של הניקוד בעיני היא ליצור העדפה להרוויח פחות באופן אבסולוטי, אבל להרוויח יותר באופן יחסי למשתתף שפגשת, שזה האלמנט הקובע.

לא שקראתי את הלינקים ולא שהתעמקתי ולא שהכרתי את המשחק לפני, אבל לדעתי הדילמה צריכה להיות בין סיכוי לסיכון, ולכן המבנה שאני מציע הוא מוצלח יותר בעיני:
מקס 8, מינ' 0, לעומת מקס' 6 מינ' 2. הממוצע זהה, הסיכון והרווח שונים.
תקינות פוליטית היא מפלטו של סתום המוח.

#7 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 17:51

אתה צודק כמובן, לא שמתי לב שהתשואה המקסימלית אינה סותרת בגידה. אני מתקן בהתאם.
נ.ב.
במחשבה שנייה אתה צודק רק חלקית. תזכור שיש זיכרון ולכן זה תלוי באיזה אסטרטגיות משתתפות. אם יש הרבה אסטרטגיות בוגדניות, אז כל משתפת פעולה תיענש בכל פעם שתשתף פעולה. אני הולך בגירסא הבאה להכניס אלמנט של צריכת מזון שיהיה גדול מהתשואה של ב,ב מחד, אבל אני מתכוון להחזיר את התשואות לכפי שהיו בהתחלה, כלומר ב,מ שווה יותר מ- מ,מ. אבל זה בשלב ב'. קודם שישלחו לי מספיק אסטרטגיות למשחק אחד. כך אני גם יכול לבחון את הקוד.
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#8 Sparklehorse

Sparklehorse

    משומש במצב טוב

  • רשומים+
  • 1696 הודעות:

פורסם 14/08/2007 - 18:04

אתה צודק כמובן, לא שמתי לב שהתשואה המקסימלית אינה סותרת בגידה. אני מתקן בהתאם.
נ.ב.
במחשבה שנייה אתה צודק רק חלקית. תזכור שיש זיכרון ולכן זה תלוי באיזה אסטרטגיות משתתפות. אם יש הרבה אסטרטגיות בוגדניות, אז כל משתפת פעולה תיענש בכל פעם שתשתף פעולה. אני הולך בגירסא הבאה להכניס אלמנט של צריכת מזון שיהיה גדול מהתשואה של ב,ב מחד, אבל אני מתכוון להחזיר את התשואות לכפי שהיו בהתחלה, כלומר ב,מ שווה יותר מ- מ,מ. אבל זה בשלב ב'. קודם שישלחו לי מספיק אסטרטגיות למשחק אחד. כך אני גם יכול לבחון את הקוד.

הניקוד הקודם היה נכון וזה שגוי.
הגמול לאסטרטגיה ב' מול מ' חייב להיות יותר גבוה מאשר מ' מול מ', אחרת כל השחקנים יבחרו במ' כל הזמן.
זה גם כמובן לא המצב הריאלי עבור שיתוף פעולה - כל הרעיון זה שבשיתוף פעולה הרווח הכולל גדול יותר אבל הוא מתחלק בין מספר גדול יותר של שחקנים. במודל הזה שיתוף פעולה יכול להשתלם לאורך זמן מכיוון שבגידה שלך תוביל בגידה של המשתתפים האחרים וב' מול ב' נמוך עבור שני השחקנים לעומת מ' מול מ'. המניע האגואיסטי לעבור לאסטרטגיה ב' מניח שהיריב ימשיך באסטרטגיה מ' ואז הרווח לבוגד גבוה יותר מבשיתוף פעולה.

תמונה מצורפת


#9 Sparklehorse

Sparklehorse

    משומש במצב טוב

  • רשומים+
  • 1696 הודעות:

פורסם 14/08/2007 - 18:14

יש מספר הבדלים:
2. אם ראיתי נכון, הסוכנים שלו אינם חיים במרחב מסויים ולכן אין אלמנט רנדומי.
3. המשחק הזה הוא בסיס למשחקים אחרים שילכו יותר לכיוון של אבולוציה (פיזית וחברתית) שאני חושב עליהם בהמשך כך שהוא מעין פיילוט שאני רוצה לבדוק.
4. אתה מוגבל ל-16 אסטרטגיות. אצלי אין הגבלות כלל.
5. אין לו התייחסות לזמן, כלומר, אצלו מדובר בעצם בדילמת אסיר איטרטיבית בלתי מוגבלת בזמן (מבחינת הסוכנים).

2 . נכון
3. נשמע מעניין. איך הגעת לזה? זה קשור למחקר לתואר שני/שלישי? באיזה מחלקה?
4. לא בדיוק הבנתי. האם אלה אסטרטגיות של אותו סוכן שמתחלפות במהלך המשחק, או מספר האסטרטגיות עבור סוכנים שונים?
5. לפי מה שזכור לי גם אצלו היתה הגבלת זמן. יכול להיות שזאת היתה תחרות אחרת. בכל מקרה התחרות של אקסלרוד היתה הראשונה. ראיתי פעם תכנית ממש מעניינת של הBBC שריצ'רד דוקינס הנחה ועסקה בנושא ודיברו שם די הרבה על התחרות ההיא.

תמונה מצורפת


#10 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 18:24

הניקוד הקודם היה נכון וזה שגוי.
הגמול לאסטרטגיה ב' מול מ' חייב להיות יותר גבוה מאשר מ' מול מ', אחרת כל השחקנים יבחרו במ' כל הזמן.
זה גם כמובן לא המצב הריאלי עבור שיתוף פעולה - כל הרעיון זה שבשיתוף פעולה הרווח הכולל גדול יותר אבל הוא מתחלק בין מספר גדול יותר של שחקנים. במודל הזה שיתוף פעולה יכול להשתלם לאורך זמן מכיוון שבגידה שלך תוביל בגידה של המשתתפים האחרים וב' מול ב' נמוך עבור שני השחקנים לעומת מ' מול מ'. המניע האגואיסטי לעבור לאסטרטגיה ב' מניח שהיריב ימשיך באסטרטגיה מ' ואז הרווח לבוגד גבוה יותר מבשיתוף פעולה.


תזכור שהתחרות פה היא כנגד השאר וכקבוצה. נניח שאתה משתף פעולה עם כולם כל הזמן, אזי אסטרטגיה שתבגוד בתור האחרון תהיה תמיד המנצחת. עכשיו, מכיוון שאתה יודע שכדאי לבגוד בתור האחרון אז אתה תניח שכולם יבגדו בתור האחרון, מה שאומר שכדאי לך לבגוד בתור הלפני אחרון וכך הלאה עד שתגיע לאותו מצב של הדילמה ללא תורות שבו כדאי לך לבגוד כל הזמן למרות שאתה יודע שעדיף לשניכם לשתף פעולה. הסיבה להבדל נעוצה בכך שפה לא מדובר במשחק שיתופי אלא במשחק תחרותי בעוד שהדילמה המקורית נוצרה עבור משחק שיתופי.
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן

#11 זיו

זיו

    משתדל

  • רשומים+
  • 11586 הודעות:

פורסם 14/08/2007 - 18:28

הניקוד הקודם היה נכון וזה שגוי.
הגמול לאסטרטגיה ב' מול מ' חייב להיות יותר גבוה מאשר מ' מול מ', אחרת כל השחקנים יבחרו במ' כל הזמן.
זה גם כמובן לא המצב הריאלי עבור שיתוף פעולה - כל הרעיון זה שבשיתוף פעולה הרווח הכולל גדול יותר אבל הוא מתחלק בין מספר גדול יותר של שחקנים. במודל הזה שיתוף פעולה יכול להשתלם לאורך זמן מכיוון שבגידה שלך תוביל בגידה של המשתתפים האחרים וב' מול ב' נמוך עבור שני השחקנים לעומת מ' מול מ'. המניע האגואיסטי לעבור לאסטרטגיה ב' מניח שהיריב ימשיך באסטרטגיה מ' ואז הרווח לבוגד גבוה יותר מבשיתוף פעולה.

יפה, וזה בגלל שאני לא הבנתי את מטרת המשחק.
אם מטרת המשתתף לצבור יותר נקודות, אז אתה צודק.
התגובה שלי מתייחסת למטרה אחרת: לצבור יותר נקודות מאחרים.
תקינות פוליטית היא מפלטו של סתום המוח.

#12 זיו

זיו

    משתדל

  • רשומים+
  • 11586 הודעות:

פורסם 14/08/2007 - 18:38

למודל של אבולוציה אתה יכול להכניס שתי תרומות נוספות:
אחת אלמנטרית, שתכניס לך את המוטיבציה להרוויח נקודות באופן אבסולוטי: אסור שיעברו 10 תורות מבלי שהשגת פחות מ- X נקודות, אחרת אתה יוצא מהמשחק.

השידרוג השני הוא לפצל לשני סוגי סוכנים, ככה שאינטראקציה עם סוג א' שונה מאינטאקציה מסוג ב'.
אתה יכול אפילו להכניס אינטראקציה שדומה לזו בין אריות שמתאגדים ע"מ להעיף זכר ששולט על להקה... בקיצור, אין קץ לאפשרויות כאן..
תקינות פוליטית היא מפלטו של סתום המוח.

#13 Sparklehorse

Sparklehorse

    משומש במצב טוב

  • רשומים+
  • 1696 הודעות:

פורסם 14/08/2007 - 18:52

תזכור שהתחרות פה היא כנגד השאר וכקבוצה. נניח שאתה משתף פעולה עם כולם כל הזמן, אזי אסטרטגיה שתבגוד בתור האחרון תהיה תמיד המנצחת. עכשיו, מכיוון שאתה יודע שכדאי לבגוד בתור האחרון אז אתה תניח שכולם יבגדו בתור האחרון, מה שאומר שכדאי לך לבגוד בתור הלפני אחרון וכך הלאה עד שתגיע לאותו מצב של הדילמה ללא תורות שבו כדאי לך לבגוד כל הזמן למרות שאתה יודע שעדיף לשניכם לשתף פעולה. הסיבה להבדל נעוצה בכך שפה לא מדובר במשחק שיתופי אלא במשחק תחרותי בעוד שהדילמה המקורית נוצרה עבור משחק שיתופי.

המשחק הזה אם הבנתי נכון יוצר מצב שבו לכולם כדאי לשתף פעולה בשלבים הראשונים, עד שמישהו בוגד ואז כולם יבגדו עד הסוף. מכיוון שמי שיבגוד ראשון יצבור יותר נקודות מהשאר, תיווצר תחרות כמו שתיארת על מה השלב הראשון שבו כדאי לבגוד. כמובן שזה תלוי ביחס הפרופורציונלי של שאר האסטרטוגיות באוכלוסיה, ובהסתברות לפגוש משת"פ לעומת בוגד, אבל בצורה אינטואיטיבית נראה לי שזה יוביל בסופו של דבר למצב שלכולם כדאי לבגוד תמיד, אלא אם כן הם יכולים ליצור בריתות יציבות עם סוכנים ספציפיים אחרים. בכל מקרה צריך לשבת על זה בצורה מסודרת עם מטריצות כדי להבין יותר לעומק, וזה אין לי זמן לעשות כרגע. בכל מקרה אני מציע שתבדוק שוב אם הכללים האלה נותנים את המשחק שאליו התכוונת, ושלא יהיו עוד שינויים אחרי שאנשים כבר יתחילו לשלוח אסטרטגיות.

תמונה מצורפת


#14 זיו

זיו

    משתדל

  • רשומים+
  • 11586 הודעות:

פורסם 14/08/2007 - 19:44

המשחק הזה אם הבנתי נכון יוצר מצב שבו לכולם כדאי לשתף פעולה בשלבים הראשונים, עד שמישהו בוגד ואז כולם יבגדו עד הסוף. מכיוון שמי שיבגוד ראשון יצבור יותר נקודות מהשאר, תיווצר תחרות כמו שתיארת על מה השלב הראשון שבו כדאי לבגוד.

אני מניח שהסיבה שזה נכון היא שאתה יכול לשים את סוכניך בפינה, ככה תצמצם את התנהלותם, ע"מ לקבל הרבה מפגשי מ-מ של הסוכנים שלך, שזה סוג של מפגש שאמור להשתלם.
ברגע שנתקלת בהרבה בגידות, סימן שהעירבוב כבר רציני, ואז משתלם לדפוק את האחרים...
תקינות פוליטית היא מפלטו של סתום המוח.

#15 ברק ג

ברק ג

    כסף

  • רשומים+
  • 5845 הודעות:

פורסם 14/08/2007 - 20:50

אתה לא יכול לשים את הסוכנים שלך בשום מקום, התנועה שלהם רנדומית לחלוטין. זו הגירסא הסופית אלא אם יתגלו באגים בתכנות, אבל אני מאמין שכבר עכשיו היא יותר מעניינת מהגירסא הלעוסה המקורית.

נ.ב.
אסטרטגיה מנצחת במשחק הזה היא זו שהסוכנים שלה יצליחו לזהות מי שייך לאסטרטגיה ומי לא. לכן האסטרטגיות צריכות גם לדעת לזהות את הסוכנים האחרים וגם (אם אפשר) להטעות את שאר האסטרטגיות. כך שיהיה מעניין לראות אם למישהו יש את הקלף המנצח במשחק מהסוג הזה. אני מודה שבגלל שיש רק 4 תשואות אפשריות אז די קשה לזהות מהי האסטרטגיה שלך ומה לא, אבל יש לי רעיון על איך לעקוף את זה.
Homer: Are you saying you're never going to eat any animal again? What about bacon?
Lisa: No.
Homer: Ham?
Lisa: No.
Homer: Pork chops?
Lisa: Dad, those all come from the same animal.
Homer: Heh heh heh. Ooh, yeah, right, Lisa. A wonderful, magical animal.

משחק בדילמת האסיר איטרטיבית רבת משתתפים ומוגבלת בזמן




0 משתמשים קוראים נושא זה

0 משתמשים, 0 אורחים, 0 משתמשים אנונימיים