เรียนรู้ทฤษฎี Modern Poker GTO คืออะไร?

GTO มาจาก “Game Theory Optimal” หรือที่เรียกกันว่า “ทฤษฎีเกม” ถูกคิดค้นขึ้นจากนักคณิตศาสตร์ ที่ชื่อว่า “John F. Nash” ซึ่งได้รับรางวัลโนเบล จากการคิดค้นทฤษฎีนี้ โดยตั้งชื่อว่า Nash Equilibrium

โดยมีแนวคิดว่า Equilibrium คือ “จุดสมดุล ที่ผู้เล่นจะไม่เปลี่ยนการตัดสินใจ เพราะผลตอบแทนที่ดีที่สุดที่ได้รับไม่ว่า คู่ต่อสู้จะเปลี่ยนการตัดสินใจก็ตาม”

เรามาศึกษา Nash Equilibrium เพื่อทำความเข้าใจก่อนที่จะเริ่มศึกษาว่า เราสามารถนำมาใช้ในการเล่นโป๊กเกอร์ของเราได้อย่างไร

Nash Equilibrium คือชุดของแผนการเล่น ที่

ผู้เล่น มีแผนการเล่นที่แน่นอน และ รู้ถึงแผนการเล่นของฝ่ายตรงข้าม
ต่างฝ่ายต่างเลือกแผนการเล่นที่ดี และมีผลตอบแทนที่ดีที่สุดของตนแล้ว
ผู้เล่นไม่สามารถเปลี่ยนแผนการเล่นเพื่อสร้างผลตอบแทนที่ดีกว่าได้อีก

เราได้นำเกมมาจำลองถึง Nash Equilibrium เพื่อทำความเข้าใจง่ายๆ ด้วย เกม เป่า ยิ้ง ฉุบ

เมื่อคุณต้องเล่น เป่ายิ้งฉุบ โดยให้ นาย A เลือกแผนการเล่นที่จะออก ค้อน ทุกครั้ง แน่นอน คุณต้องเลือกที่จะออกกระดาษ (เป็นการ Exploit) เพื่อเอาชนะค้อน แผนการเล่นนี้ง่ายมากๆ

เมื่อ นาย A รู้ดังนี้ จึงเปลี่ยนแผนการเล่น เป็น กรรไกร ทุกครั้งเพื่อที่จะชนะ กระดาษของคุณ คุณก็เปลี่ยนแผนการเล่นอีกครั้งไปเป็นออกค้อนทุกครั้ง

ทีนี้ ถ้าจะให้เกิด Equilibrium นาย A จึงใช้วิธีสุ่ม ในทุกครั้งของการเล่น เพียงเท่านี้คุณก็ไม่สามารถที่จะเลือกตัดสินใจอย่างใดอย่างหนึ่งที่มีผลตอบแทนที่ดีที่สุดได้อีกต่อไป ดังนั้นการสุ่มของนาย A จึงเป็น Optimal หรือจุดสมดุลที่ไม่ว่าเขาจะออกอะไรก็ไม่มีทางที่ผลตอบแทนจะมากขึ้นหรือน้อยลง

GTO กับ โป๊กเกอร์

สำหรับโป๊กเกอร์ที่เป็นเกมที่มีความซับซ้อนมากที่สุดของโลกที่ปัจจุบันมีความจำเป็นต้องนำ คอมพิวเตอร์มาศึกษาจำลองสถานการณ์โดยการแบ่งสถานการณ์ที่ต้องการจำลองออกเป็นส่วนๆ โดยใช้หลักการของ Nash Equilibrium จุดมุ่งหมายเพื่อให้ไม่สามารถถูก Exploit หรือ เอาเปรียบได้กับตัวอย่างในเกมเป่ายิ้งฉุบ ข้างต้น และเมื่อเราศึกษา GTO ยังช่วยให้เราทราบถึงจุดอ่อนในการเล่นของฝ่ายตรงข้ามเพื่อให้เราโจมตีได้อีกด้วย

โป๊กเกอร์มีวัตถุประสงค์ในการเล่นที่หลากหลาย บางคนเล่นเพื่อความสนุกสนาน, เข้าสังคม หรือ รางวัลจากชัยชนะในทัวร์นาเมนต์เพื่อเป็นเกียรติประวัติ แต่เป้าหมายที่แท้จริงของเกมคือการสร้างรายได้ หรือกำไรในแง่การลงทุนให้แก่ผู้เล่นนั่นเอง

รายได้ ผลกำไร = ความผิดพลาดของคู่ต่อสู้ – ความผิดพลาดของคุณ

หรืออีกนัยหนึ่งก็คือการสร้างรายได้ในการเล่นโป๊กเกอร์คุณไม่จำเป็นต้องมีความสามารถในระดับประเทศที่คุณต้องการก็เพียงความสามารถที่สูงกว่าผู้เล่นอื่น หรือคู่ต่อสู้บนโต๊ะเท่านั้น!

จากความหมายข้างต้น ดังนั้น GTO จึงไม่มีความจำเป็นใดๆ เพื่อเริ่มต้นในการสร้างรายได้ในโป๊กเกอร์

แต่หาก!

เมื่อคุณต้องพบกับสถานการณ์การเล่นที่ยากลำบากในระดับ Micro stake หรือการเผชิญหน้ากับผู้เล่นแถวหน้าในรอบ Final Table ของระดับ High Roller Cash game ความยากง่ายในการเล่นและตัดสินใจ ในการเล่นนั้นคงแตกต่างกันโดยสิ้นเชิง

การเล่นโป๊กเกอร์สามารถศึกษา หรือเพิ่มทักษะในการเล่นได้จากการเล่นไปเรื่อยๆ สะสมประสบการณ์จากการเล่น แต่ด้วยวิธีนี้ผู้เล่นต้องใช้ระยะเวลายาวนาน แม้คุณจะมีเวลาไม่จำกัดในการทำความเข้าใจและศึกษาการเล่นไปเรื่อยๆก็ตามโป๊กเกอร์ก็ยังซับซ้อนเกินกว่าที่จะทำความเข้าใจได้ด้วยตัวเอง

ในเกมหมากรุกที่ผู้เล่นได้สะสมความรู้รุ่นต่อรุ่นเป็นเวลายาวนาน แต่เมื่อเวลาผ่านไปด้วยความช่วยเหลือของคอมพิวเตอร์ ผู้เล่นสามารถค้นหาการเดินที่ดีที่สุด หรือ Best Move ได้อย่างง่ายดาย และสามารถนำมาแก้ไขข้อบกพร่อง หรือนำมาสร้างความได้เปรียบซึ่งเป็นสิ่งที่มนุษย์ไม่สามารถทำได้ในระยะเวลาอันสั้น จนปัจจุบันปัญญาประดิษฐ์ หรือว่า AI ได้พัฒนาจนมนุษย์ ไม่สามารถเอาชนะได้แล้ว

เช่นเดียวกัน กับ โป๊กเกอร์ 9 คนบนโต๊ะ เราสามารถ รู้ได้อย่างรวดเร็วว่า ควรหมอบไพ่ 7-2 ในมือ เมื่อต้องตัดสินใจเล่นที่ตำแหน่ง UTG แล้วไพ่ อย่าง JTo ล่ะ ควรเล่นอย่างไร ควร Raise หรือ Call หรือ Fold เพื่อที่จะเป็นการเล่นที่ดี หากเปลี่ยนจากโต๊ะ 9 คน เป็น 6คน ?หรือ เปลี่ยนจาก Stake 100BB ไปเป็น 200ฺBB ? การเล่นจะยังคงเหมือนเดิมไหม ? หรือในสถานการณ์การเล่นที่มีความซับซ้อน เช่น เมื่อคุณโดน Re-Raise โดยที่คุณ Out of position ด้วยชิป หน้าตัก 50ฺBB ? แล้ว ไพ่ประเภทใดที่จะเป็นไพ่ที่ดีที่ควรเลือกที่จะ Call? ไพ่ประเภทใดที่สามารถ All-in โดยที่คุณไม่ต้องกลัวการถูก Exploit คู่ต่อสู้

คำถามทั้งหมด GTO มีคำตอบให้คุณด้วยวิทยาการคอมพิวเตอร์ในปัจจุบัน สร้างโปรแกรม คำนวณ หรือที่เรียกว่า Solver มาช่วยสร้างแผนการเล่น ตาม Nash Equilibrium ไม่ว่าจะเป็น Ranges Pre-Flop , แผนการ C-bet ที่ Flop ฯลฯ แต่จุดประสงค์ ทั้งหมด ของบทความนี้ ไม่ได้ต้องการให้คุณจำการเล่นทั้งหมดของ Solver (ซึ่งเป็นไปได้ยาก) แต่เพื่อให้คุณทำความเข้าใจกลไกการเล่นของเกม และเราจะกลายเป็นผู้เล่นที่ยากที่จะรับมือ และมองหาจุดอ่อนของคู่ต่อสู้ และโจมตีได้อยู่ถูกต้อง

ยกตัวอย่างเช่น
เมื่อคุณศึกษา GTO คุณทราบว่า เมื่อคุณมีชิป หน้าตัก 50BB คุณสามารถ Open-Raiseสร้างความได้เปรียบ จากตำแหน่ง UTG ด้วย 15% Hands จาก Range

แตกต่างจากที่ตำแหน่ง Button ที่สามารถ Open-Raise 53% ของ Hand จาก Range

คุณรู้ถึงเหตุผลว่าทำไม? คุณถึงสามารถเล่นไพ่ได้มากกว่าจากตำแหน่ง Button เทียบกับ ตำแหน่ง UTG เพราะที่ตำแหน่ง UTG ที่ต้องเล่นก่อนเป็นไปได้ว่าจะมีผู้เล่นที่เล่นที่หลังจะโอกาสที่จะมีไพ่ที่แข็งแกร่ง และบางครั้งที่ตำแหน่ง UTG ยังต้องเล่นโดยเสียเปรียบตำแหน่งในการเล่นที่ Flop ถ้ามีคน Call อีกด้วย ต่างจากตำแหน่ง Button ที่เหลือผู้เล่นอีก เพียง 2 คน และ ยังแน่ใจได้อีกว่า ในการเล่นรอบต่อๆไป จะมีความได้เปรียบตำแหน่งในการเล่นอีกด้วย

จากตัวอย่างข้างต้นเป็นตัวอย่างเล็กๆ ที่ได้จากโปรแกรม ที่ใช้ Computer ที่มีประสิทธิภาพสูง ช่วยคำนวณผล Nash Equilibrium โดยการจำลองสถานการณ์ที่มีผู้เล่นพยายามเลือกเล่นในรูปแบบที่ดีที่สุด ซ้ำๆ หลายพันรอบ ซึ่งเป็นการยากที่มนุษย์เราจะสามารถจำลองและจดจำการเล่นทั้งหมดมาใช้ได้ (ในตอนนี้ก็เพียงจดจำ Range และตำแหน่งที่ใช้เล่น เพียงเท่านั้น)

แต่โป๊กเกอร์ไม่ใช่เกมแข่งกันจำ เมื่อคุณมีความเข้าใจหลักการในการเล่นแบบ GTO แล้ว คุณสามารถนำไปปรับใช้ เช่นเดียวกับเกม เป่ายิ้งฉุบ เมื่อคุณอยู่ที่ตำแหน่ง Button แล้วทราบว่าผู้เล่นที่ตำแหน่ง Blind เป็นผู้เล่นที่ Passive นั่งคัดแต่ไพ่ดีๆ เล่น คุณก็ขยาย Range ของคุณออกไปเป็น 80% ถึง 100% เพื่อโจมตีจุดอ่อนของเขาได้

และนี่เป็นเพียงคำอธิบายเบื้องต้นที่สามารถทำความเข้าใจได้ง่ายๆ ของ GTO และแสดงตัวอย่างเล็กๆ น้อยๆ ของวิธีการนำไปใช้ในโป๊กเกอร์จริง แต่การศึกษาไม่มีที่สิ้นสุด มีความรู้ใหม่ๆ , การวิเคราะห์แผนการเล่น และการวิเคราะห์พฤติกรรมผู้เล่นที่คอมพิวเตอร์สามารถจำลองการเล่นเพิ่มเติมได้กำลังเปลี่ยนแปลงเกมโป๊กเกอร์ไปเรื่อยๆ ดังนั้นการศึกษา GTO หรือ ทฤษฎีเกม เป็นแนวทางเพื่อให้การเล่นของคุณนั้นถูกต้อง หรือมีกำไรในระยะยาวนั่นเอง

Share to