Nashin ICM hesablaması

Nash 'ICM modelini və ondan necə istifadə olunacağını anlamaq istərdim. Bu kalkulyatorları burada və burada tapdım və onlarla oynamağa çalışdım. Amma çıxışı başa düşmürəm. Çıxışımı izah etməyimə və ya istinad üçün yaxşı bir dərslik tapa biləcəyimi söyləməyimə kim kömək edə bilər? Mən də nəzəriyyə ilə maraqlanıram, buna görə də bu rəqəmlərin arxasındakı riyaziyyatı başa düşmək istərdim.

4 Cavablar 4

Bu olduqca mürəkkəb bir sualdır və düzgün cavab kitabın bir hissəsinə dəyər (Collin Moshman'ın SNG strategiyasını sınayın, hər bir tələbə üçün oxunmalıdır).

İstifadə

Heç kim heç vaxt poker kimi mürəkkəb bir oyun üçün Nash bərabərliyini həll etməmişdi, belə bir strategiya tapılsaydı, rəqibsiz bir strategiya olardı. (Ən sərfəli deyil, çünki statik strategiyası rəqib oyunumuza uyğunlaşmağı nəzərdə tutmur.)

Pokerin daha sadə variantı üçün strategiyanı hesablaya bilirik. Bu sadə variantda, hər bir oyunçu hamıya daxil olmaq və ya preflopa qatılmaq istəməsinə qərar verməlidir. Başqa hərəkətlərə icazə verilmir. Bu sadə variant hold-em pokerdən (çoxlu küçələr üçün strategiyamızı planlaşdırmağı, ağırlıqları çıxarmağı, qazan şanslarını saymağı özündə birləşdirir) çox fərqləndiyindən, bu strategiyanı yalnız optimal oyunumuzun optimaldan heç bir fərqi olmayacağı hallarda istifadə edə bilərik. sadələşdirilmiş variantımızda oynayın. Nash, buna görə təsirli yığınlar

Bu mövzuda daha inkişaf etmiş və dərin müzakirə üçün Merseneary pulsuz e-kitabını oxumağı məsləhət görürəm.

Nəzəriyyə

Düşünürəm ki, Soner Gönül bunu yaxşı izah etdi və onu kopyalayardım.

Təcrübə üçün əla vasitələr

Kalkulyatorların çıxışını başa düşmək

Birinci masa

Sit-n-getmək, oyunçular və çalışır sayı sayı strukturu haqqında məlumat bizə (Bu alətlər yoxdur hesablamaq Nash ancaq qiymətləndirmək olduqca düzgün. Çalışır nəticə əldə etmək üçün süni oyun sayı).

İkinci masa

Oyunçu - Oyunçunun masadakı mövqeyini ifadə edir

Stack - Çip oyunçularının sayı

% təkan - bütün opponentlər düzgün oynamaq, o, top təkan lazımdır push% əlləri faiz.

EQPre - Bu, oyunçulara uzunmüddətli perspektivdə nə qədər pul qazanacağı ehtimalına əsaslanaraq əldən vermədən əvvəl oyunçulara prizepoolun ədalətli bölünməsidir.

EQPost - Bu, bir tur oynadıqdan sonra mükafat oyunçusunun oyunçuya ədalətli bölünməsidir.

Görürsünüz ki, SB üçün azalır, baloncuk üstündədir, növbəti tura qədər sağ qala biləcək və ya ona itələyə biləcək başqa bir ştackə malikdir və sağ tərəfində ümumiyyətlə hamısını çağırmaqda çətinlik çəkməyən böyük yığına malikdir. CO bu vəziyyətdən ən çox faydalanır, yalnız 2BB olmasına baxmayaraq, bu turdan sonra pula girə bilər. BB -nin o qədər çipi var ki, onun gözlənilən mükafat miqdarı kəskin dəyişməyəcək.

EQdiff = EQPre - EQPost

Üçüncü masa:

Sıra -sıra:

CO üst 4% əllərini itələməlidir.

CO basarsa, BU QQ+ ilə zəng etməlidir

CO basarsa, BU çağırar, SB yalnız AA ilə olmalıdır

CO basarsa, BU çağırar, BB yalnız AA ilə olmalıdır

CO basarsa, BU bükülürsə, SB JJ+ ilə zəng etməlidir

CO basarsa, BU bükülür, SB çağırır, BB ən yüksək% 58 ilə zəng etməlidir

CO basarsa, BU bükülür, SB qatlanır, BB ən yüksək% 58 ilə zəng etməlidir

CO qatlanırsa, BU yuxarı 13.7% itməlidir

CO qatlanırsa, BU itkisi, SB 5,6% çağırmalıdır

CO qatlanırsa, BU push, SB zəng, BB 9.8% zəng etməlidir

Mənə elə gəlir ki, üç ayrı anlayışı qarışdırırsan:

  • ICM səhmləri
  • EV hesablamaları
  • Nash tarazlığı

Bunları öz növbəsində nəzərdən keçirəcəyəm, hesablama proqramının real həyat ssenariləri üçün həllər istehsal etmək üçün necə istifadə etdiyini izah edəcəyəm.

ICM Kapitalı

ICM səhmləri, hər bir oyunçunun xətti olmayan ödəmə quruluşları olan poker oyunlarında öz payını təyin etmək üçün bir yoldur (yəni turnirlər). ICM səhmləri ümumi mükafat fondunun faizi olaraq ifadə edilir və yalnız oyunçular arasında fişlərin paylanmasına və turnirin ödəmə cədvəlinə əsasən hesablanır.

Məsələn, tipik 6-max hiperturbo SNG-də (ödəmələr sırasıyla birinci və ikinci finiş üçün 65%/35%), 3 oyunçu qalıb:

  • oyunçu 1: 1500 fiş
  • oyunçu 2: 1000 fiş
  • oyunçu 3: 500 fiş

bir ICM alqoritmi sizə ilk oyunçunun ICM kapitalının ümumi mükafat fondunun təxminən 45% olduğunu söyləyə bilər.

Burada fərqli alqoritmlərin bu səhmləri necə hesabladıqlarını izah edən bir video hazırladım: https://www.youtube.com/watch?v=JtBAxjR21o8 və (https://omni.poker) ICM sərmayə kalkulyatorumuzu pulsuz istifadə edə bilərsiniz. bunlarla oynamaq istəyirsən (burada təlimat videosu: https://www.youtube.com/watch?v=XuEBxON9fGQ).

ICM alqoritmlərini Bill Chen tərəfindən Pokerin Riyaziyyatında oxuya bilərsiniz. Ben Robertin alqoritmi burada təsvir edilmişdir: http://www.pdf-archive.com/2014/08/04/benrobertsequitymodel/benrobertsequitymodel.pdf.

ICM səhmləri praktikada istifadə olunur:

  • yekun cədvəl sövdələşmələrini müzakirə edin (MTT -də qalan bir neçə oyunçu qalan mükafat fondunu kəsmək qərarına gəldikdə, adətən çip yığınlarının nəzərdə tutduğu ICM səhmlərinə görə mükafat pulu ayıracaqlar)
  • qazan əmsalları anlayışını turnir vəziyyətinə uyğunlaşdırmaq (turnir əmsalları adlanır və Nelson/Streib/Heston tərəfindən Kill Every kitabında təsvir edilmişdir)
  • turnir ayarlarında EV hesablamaları apararkən evristik olaraq

EV hesablamaları

Bir EV hesablaması etmək, sadə bir oyun üçün ağıllı bir oyun yaratmaq üçün sadə bir poker oyunu götürmək, ağıllı bir oyun üçün bütün oyun ağacını yazmaq və sonra gözlənilən dəyəri hesablamaq deməkdir. ən yaxşı qərarı seçə bilmək üçün hər bir qərar.

Məsələn, preflop pokerinin ən sadə faydalı modeli təkan/qat oyunudur. Bu oyunda, bir oyunçu girə və ya qatlana bilər və digər oyunçu (lar) hamısını çağıra bilər.

Yuxarıdakı ssenariyə davam edərək, tutaq ki, birinci oyunçu bükülmüş, ikinci oyunçu isə indi itələmək və qatlamaq arasında qərar verməlidir. Belə bir oyun ağacı əldə edirik:

İndi hər bir seçim qovşağına dəyərlər təyin etməliyik və burada ICM səhmləri işə düşür.

Əvvəlcə daha sadə işi götürək. P2 qatlanmağa qərar verərsə, onun gözlənilən dəyəri nədir? Bu suala cavab verməyin bir yolu, ICM səhmlərinin müəyyən bir seçimdən necə təsirləndiyini araşdırmaqdır. Bunu konkret etmək üçün, deyək ki, indiki pərdələr 20/40 -dir, belə ki, oyunçu 2 dəfə qatlandığında, onun çiplərindən 20 -si 3 -cü oyunçuya keçəcək.

Bu dəyərləri bir ICM kapital kalkulyatoruna bağladım və aşağıdakı nəticələr əldə etdim (Malmuth-Weitzman alqoritmindən istifadə edərək):

  • əldən əvvəl: p2, 35.67% ICM kapitalına malikdir
  • əldən sonra: p2 35.06% ICM kapitalına malikdir

beləliklə qatlama EV -0.61% ICM kapitaldır

2-ci oyunçunun EV-si nə olur? Bu əhəmiyyətli dərəcədə daha mürəkkəbdir. Əvvəlcə 3-cü oyunçunun davranışını modelləşdirməliyik, yəni 3-cü oyunçunun bir all-in-in çağıracağı əllərin paylanmasını təxmin etməliyik. Bu məlumatı nəzərə alaraq, daha sonra 3-cü oyunçunun bir all-in-ə zəng etməsinin şərti ehtimalını (2-ci oyunçunun holdinqlərinin kart çıxarma effektləri ilə şərtlənmiş) hesablaya bilərik, eyni zamanda 2-ci oyunçunun 3-cü oyunçunun diapazonuna qarşı öz payını hesablaya bilərik.

Belə bir şeylə sona çatacağıq:

Bu, bizə 2-ci oyunçunun çoxnövçülüyü itirmə qərarının Çip EV-ni (yəni qazanılmış və ya itirilmiş gözlənilən fiş sayını) verir:

  • EV-də 500/-500 (p3_calls) sadəcə 3-cü oyunçunun yığın ölçüsüdür
  • EV -də +40 (p3_folds) böyük kordur

Yenilənmiş çip yığınlarını hər bir halda bir ICM kapital kalkulyatoruna qoşaraq ICM EV -ə çevirə bilərik.

PUSH/FOLD modulumuz və ya ICMIZER kimi kommersiya itmə/qatlama hesablayıcıları sizin üçün bu addımları yerinə yetirir, yəni:

  • bir rəqib modeli daxil edirsiniz (hər bir rəqib üçün bir zəng aralığı)
  • kalkulyator bir oyun ağacı qurur, ehtimalları təyin edir, çip EV hesablayır və bunu ICM EV -yə çevirir
  • kalkulyator bunu hər başlanğıc əli üçün edir və itmə aralığınız olaraq EV (qat) -dan daha yüksək EV (itələmə) olan əlləri göstərir

Nash Equilibria

Nəhayət, pokerdə Nash tarazlığından danışaq.

Nash tarazlığı, heç bir oyunçunun həll strategiyasından kənara çıxaraq EV-ni tək tərəfli inkişaf etdirə bilməyəcəyi bir strategiya cütünü (yəni hər bir oyunçu üçün bir strategiyanı) təsvir edən iki oyunçulu sıfır məbləğli oyunlar üçün bir həll konsepsiyasıdır.

Bu praktikada nə deməkdir? Yuxarıdakı EV hesablama nümunəsindən xatırlayın ki, hesablamalarımızı aparmaq üçün rəqiblərimizin davranışlarını modelləşdirməliyik. Xüsusi rəqiblərin və ya rəqiblərin necə davranacağını yaxşı bilsək də (və modelləşdirməmizi oynadığımız böyük bir məlumat bazasına əsaslaya bilərik) bunun əvəzinə optimal oyunun necə görünəcəyini bilmək istəyə bilərik. optimal rəqibə qarşı.

Optimal oyunu müəyyən etmək üçün, oyunçuların bir -birinə alternativ şəkildə uyğunlaşması ilə müəyyən bir oyun ağacını dəfələrlə həll edəcəyik.

Məsələn, yuxarıdakı oyun ağacımızı həll etmək üçün əvvəlcə oyunçu 3 -ə hər hansı bir təsadüfi zəng əlini qoyaraq başlamalı və 2 -ci oyunçu üçün əllərin itələməsinin optimal aralığını hesablamalıyıq. 3 -cü oyunçu baxımından yenidən ağac (yəni 2 -ci oyunçunun itmə aralığını nəzərə alaraq zəng edən əllərin optimal aralığını hesablayın). İndi 2 -ci oyunçu baxımından ağaca baxmağa qayıdırıq və 3 -cü oyunçunun yeni çağırış aralığını nəzərə alaraq optimal itmə aralığını hesablayırıq və s.

Bu proses nəticədə sabit bir vəziyyətə çatacaq, burada heç bir oyunçu diapazonunu dəyişərək gözləntisini artıra bilməz və bu oyunun Nash tarazlığıdır.

Maraqlananlar üçün, az əvvəl təsvir etdiyim alqoritm Uydurma Oyun adlanır və praktikada yuxarıda qeyd etdiyimdən daha az mürəkkəbdir (həmişə ən yaxşı cavab strategiyasına keçmək əvəzinə, ən yaxşı cavab strategiyasını indiki strategiyaya qarışdırmaqla rəqslərin qarşısını almaq üçün) Sabit bir vəziyyətə çatana qədər onu idarə etmək əvəzinə, EV dəyişikliklərinin böyüklüyünü ölçməklə cari həllin əsl həllinə olan məsafəsini ölçür və kifayət qədər yaxınlaşdıqda dayanır).

Niyə tarazlıq həlləri maraqlıdır? IMO -nun üç əsas istifadəsi var:

  • strategiyanın inkişafı üçün əsas kimi istifadə edə biləcəyiniz bir vəziyyətdə düzgün oyunun necə göründüyünü hiss etmək
  • naməlum və ya qorxulu rəqiblərə qarşı standart bir strategiya olaraq
  • bu gün ən yüksək oyun səviyyəsində (məsələn, yüksək paylı HUSNG) oyunçular bir çox hallarda optimal və ya yaxın strategiyalardan istifadə edirlər və rəqabət aparmaq üçün GTO strategiyalarını özünüz oynamaq lazımdır.

Son qeyd olaraq, nümunələrim üçün iki oyunçulu oyunlardan istifadə etdiyimi fərq etmiş ola bilərsiniz. Bunun səbəbi, yalnız iki oyunçu oyununda Nash strategiyalarının mənfi olmayan bir qazanc zəmanəti verməsi. Qeyri -rəsmi olaraq, bunun səbəbi hər hansı bir oyunun müəyyən bir dəyərə sahib olmasıdır və yalnız iki oyunçu olduğu zaman, bu dəyərdən bir qismini yuxarıdan keçən bir oyunçu digər oyunçunun onu ələ keçirməsi mənasına gəlməlidir. Çox oyunçulu oyunlarda bir -EV qərarı verən bir oyunçu, rəqiblərindən bəzilərinin və ya hamısının tarazlıq strategiyalarını oynamağı daha az cazibədar edən bir dəyəri ələ alması demək ola bilər: rəqibə qarşı optimal oynaya bilərsən, amma sənə qarşı ən optimal şəkildə oynayanda özünə deyil, başqa bir rəqibə fayda verə bilər.