[Discovery] Nhóm nghiên cứu tại Đại học Alberta phát triển phần mềm có thể thắng con người trong mọi ván poker


Tinhte-chuong-trinh-may-tinh-poker.
Nhóm nghiên cứu tại Đại học Alberta và phần mềm máy tính có thể chơi poker chiến thắng con người

Nhóm các nhà nghiên cứu dẫn đầu bởi giáo sư khoa học máy tính Michael Bowling tại Đại học Alberta, Canada, đã phát triển một chương trình máy tính có khả năng chiến thắng con người trong 1 ván bài poker (xì tố) 2 người. Đừng vội nghĩ đây chỉ là vấn đề cờ bạc, thành công của nghiên cứu còn có thể được áp dụng trong các tình huống đòi hỏi đưa ra nhiều quyết định phức tạp nhưng không thể tiên lượng chính xác kết quả, điển hình như chính sách đối ngoại hoặc điều trị y tế.

Khác với cờ vua hoặc cờ đam, đối với poker, không phải lúc nào người chơi cũng có thể biết được biến triển bài của đối phương. Hơn nữa, 1 người chơi nào đó sẽ có tỷ lệ thắng cao hơn nếu một trong người khác quyết định bỏ. Vì vậy, dưới góc độ toán học, poker là một trò chơi có thông tin không hoàn hảo. Giáo sư Bowling cho biết: “Cờ vua có thể được thiết kế các giải pháp chơi hoàn hảo. Đáp án của bài toán cờ vua luôn là hoặc trắng thắng, hoặc đen thắng hoặc cả 2 hòa. Tuy nhiên poker lại phụ thuộc vào xác suất. Nói cách khác, không có người chơi hoặc chiến lược nào là hoàn hảo.”

Trong ván bài poker của máy tính, mức cược giữa 2 đối thủ là cố định và mức tố là có giới hạn. Đầu tiên, người chia bài sẽ chia cho mỗi bên 2 lá bài (deal cards). Sau đó, 2 bên sẽ bắt đầu đặt cược. Tiếp theo, 3 lá bài được lần lượt lật lên giữa bàn cho mỗi bên xem. Sau mỗi lần lật bài là 1 lần người chơi đặt cược, hoặc bỏ, hoặc theo. Nếu tới cuối cùng không ai nhận thua (bỏ), 2 lá bài ban đầu sẽ được lật lên và kết hợp với 3 lá trên bàn để phân định thắng thua.

Trên đây là cách chơi của con người. Máy tính không tính toán các tình huống có thể xảy ra đối với mỗi tụ bài trong mỗi vòng cược. Thay vào đó, nó xây dựng sẵn một bản các kết quả trước khi trò chơi bắt đầu. Bằng cách sử dụng 4000 đơn vị xử lý trung tâm hoạt động suốt 2 tháng, tương đương với gần 2000 năm tính toán, các nhà khoa học đã giúp máy tính mô phỏng được hàng tỷ tình huống tụ bài trong 1 ván poker. Giáo sư Bowling cho biết chỉ riêng bảng kết quả đã có dung lượng lưu trữ lên tới 15 TB.

Sau đó, 1 thuật toán được sử dụng để đọc hết toàn bộ các tình huống trong có thể được đối phương thực hiện, sau đó nó sẽ hình thành nên các chiến thuật khác nhau và kết quả của từng chiến thuật (ví dụ như tố, bỏ hoặc theo). Để dễ hình dung, các nhà nghiên cứu cho biết có tới 13,8 nghìn tỷ tình huống khác nhau có thể diễn ra trong 1 ván chơi poker. Nếu điều này được thực hiện bằng con người, mỗi người trên Trái Đất phải chơi gần 4000 tụ bài.

Đây chính là điểm khác biệt so với cờ vua – máy tính có thể tính toán bằng cách thử các nước đi trong diễn tiến của ván chơi để chọn 1 kết quả đủ tốt nhằm chiến thắng. Điểm độc đáo của thuật toán poker của giáo sư Bowling chính là “hội tụ những nước đi tốt nhất cho 1 tụ bài nhất định” dựa trên các 15 TB tình huống mà máy tính “học” được. Nhóm đã đặt ra các yêu cầu cần thiết để chọn các nước đi và khi đó, trò chơi đã được “giải quyết”.

Dưới góc độ khoa học, 1 trò chơi được “cơ bản giải quyết”, có nghĩa là có 1 cách để khai thác được chiến lược mà máy tính sử dụng. Các nhà khoa học giả định rằng 1 người chơi, đấu bài với máy tính trong vòng 70 năm, mỗi năm 365 ngày và 1 ngày 24 giờ. Chương trình của nhóm viết sẽ hoạt động với điều kiện mức cược lớn nhất và cố định ở đầu ván chơi (big blind) là 1000 đô, người chơi hoàn hảo nhất có thể thắng 1 đô cho mỗi tụ bài hoặc 1/1000 lần so với mức cược. Và bằng chiến thuật tối ưu dựa trên cơ sở dữ liệu, máy tính gần như có thể chiến thắng bất cứ người chơi nào.

Nhóm nghiên cứu tuyên bố họ đã khảo sát một số máy tính chơi poker tại một số Casino và cuối cùng, chưa có một cỗ máy nào đạt được trình độ và đảm bảo tính toán học nghiêm ngặt như thuật toán của nhóm. Tuy nhiên, giới hạn của thuật toán là nó không còn chính xác khi chơi ván 3 người. Tuy nhiên, với thành công của lần nghiên cứu này, Bowling cho biết nó có thể được ứng dụng cho nhiều lĩnh vực khác nhau, từ an ninh quốc phòng, kinh tế đối ngoại hoặc lập phác đồ điều trị bệnh. Điển hình như chương trình tương tự có thể giúp các bác sĩ lựa chọn phương án điều trị mà không chắc kết quả. Khi đó, bác sĩ sẽ chọn được phương án tối ưu và cho tỷ lệ thành công cao nhất có thể,…

Tham khảo LS, Sciencemag
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s