Summary: Chương này trình bày các bài toán để thấy khả năng ứng dụng rộng rãi của quy hoạch tuyến tính. Bài toán trò chơi được trình bày một cách chi tiết, các bày toán còn lại chỉ trình bày mô hình. Việc giải các bài toán này được nghiên cứu thêm trong các môn tiếp theo.
MỞ ĐẦU
Trong thực tế hay gặp tình huống là phải chọn một quyết định (bấp bênh) do phải đối mặt với một đối thủ thông minh và có quyền lợi đối lập với ta : ví dụ trong các trò chơi tranh chấp, trong quân sự, trong vận động tranh cử....
Nghiên cứu việc chọn quyết định trong những trường hợp đối kháng này có tên gọi là lý thuyết trò chơi. Ở đây người chọn quyết định và đối thủ đều được gọi là người chơi. Mỗi người chơi có một tập hợp các hành động để lựa chọn được gọi là chiến lược.
Chúng ta xét một trường hợp đơn giản là trò chơi hai người : phần thưởng sẽ là cái được của một người và chính là cái mất của người kia.
Giải một trò chơi nghĩa là tìm chiến lược tốt nhất cho mỗi người chơi. Hai người chơi thường được ký hiệu là A và B, chiến lược tương ứng của mỗi người được ký hiệu là :
A : i (i=1m)
B : j (j=1n)
Giải thưởng ứng với chiến lược (i,j) của hai người được ký hiệu là aij và được viết thành một bảng như sau :
| B | 1 | 2 | ... | n |
| A | ||||
| 1 | a11 | a12 | ... | a1n |
| 2 | a21 | a22 | ... | a2n |
| ... | ... | ... | ... | ... |
| m | am1 | am2 | ... | amn |
Ví dụ :
| 1 | 2 | 3 | 4 | B | ||||||||||||||||||||
| A |
|
|||||||||||||||||||||||
Ðối với A :
- Nếu A đi nước 1 (dòng 1) thì A sẽ :
. Thắng 1 điểm nếu B đi nước 1(thắng)
. Thắng 0 điểm nếu B đi nước 2(hoà)
. Thắng -2 điểm nếu B đi nước 3(thua)
. Thắng 1 điểm nếu B đi nước 4(thắng)
Những trường hợp còn lại là tương tự .
Ðối với B :
- Nếu B đi nước 2 (cột 2) thì B sẽ :
. Thua 0 điểm nếu A đi nước 1
. Thua 2 điểm nếu A đi nước 2
. Thua -1 điểm nếu A đi nước 3
Những trường hợp còn lại là tương tự .
Nghiệm tối ưu của trò chơi, có khi gọi tắt là nghiệm, là bộ chiến lược (i*,j*) có tính chất là nếu một người lấy chiến lược khác còn người kia vẫn giữ nguyên thì phần thưởng cho người đi khác sẽ bị thiệt hại. Giải trò chơi có nghĩa là tìm nghiệm tối ưu.
Hai nhà chính trị A và B vận động tranh cử 1 ghế ở nghị viện trong 2 ngày cuối quan trọng nhất ở hai thành phố P và Q. Mỗi người phải đặt kế hoạch vận động mà không biết được kế hoạch của đối phương. Các cố vấn đưa ra 3 chiến lược :
- Ở mỗi thành phố một ngày
- Ở cả 2 ngày ở thành phố P
- Ở cả 2 ngày ở thành phố Q và đánh giá kết quả vận động tương ứng như sau :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Dữ liệu là tổng số phiếu, tính theo đơn vị là ngàn, mà A sẽ dành được từ B hay ngược lại .
Đây là một trường hợp đơn giản mà người ta có thể giải được bằng khái niệm chiến lược bị trội hơn như sau :
- Đối với A thì chiến lược 3 bị trội hơn bởi chiến lược 1 và 2 vì nó mang đến cho A số điểm thắng ít, nên dù B có chọn chiến lược nào thì A cũng vẫn chọn chiến luợc 1 hoặc 2 mà bỏ chiến lược 3 . Ta có :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Đối với B thì chiến lược 3 bị trội hơn bởi chiến lược 1 và 2 vì nó mang đến cho B số điểm thua nhiều nên B bỏ chiến lược 3. Ta có :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Đối với A thì chiến lược 2 bị trội hơn bởi chiến lược 1 vì vậy A bỏ chiến lược 2. Ta có :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Đối với B thì chiến lược 2 bị trội hơn bởi chiến lược 1 vì vậy B bỏ chiến lược 2. Ta có :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Cuối cùng thì bộ chiến lược (1,1) là nghiệm tối ưu của trò chơi với kết quả là người A thu thêm được 1 (ngàn) phiếu từ người B.
Trong nhiều trường hợp, khi dùng chiến lược bị trội hơn chỉ mới giảm được cở của bài toán mà chưa giải quyết xong vấn đề đặt ra.
Chiến lược MaxiMin và MiniMax
Xét ví dụ tương tự như ví dụ trên nhưng bảng kết quả vận động được các cố vấn đánh giá như sau :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Đây là trường hợp người chọn quyết định nghĩ là đối phương thông minh và cố ý chọn quyết định chống lại mình nên họ luôn nghĩ đến chiến lượt “ăn chắc” , đó là MaxiMin(A) và MiniMax(B) như sau :
a- MaxiMin(A)
A luôn xem B là đối thủ thông minh. Khi A đi nước i0 (dòng i0) thì B sẽ chọn nước đi j0 (cột j0) sao cho A thắng điểm ít nhất . Nghĩa là B đi vào ô :
Trong tình huống đó A sẽ chọn nước đi sao cho A thắng nhiều điểm nhất. Chiến thuật của A là đi vào ô :
A đi nước 1 thì B sẽ đi nước 1: a11=-3
A đi nước 2 thì B sẽ đi nước 2 : a22=0
A đi nước 3 thì B sẽ đi nước 3 : a33=-4
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Vậy MaxiMin(A) = a22 = 0
b- MiniMax(B)
B luôn xem A là đối thủ thông minh. Khi B đi nước j0 (cột j0) thì A sẽ chọn nước đi i0 (dòng i0) sao cho B thua điểm nhiều nhất . Nghĩa là A đi vào ô
Trong tình huống đó B sẽ chọn nước đi sao cho B thua ít điểm nhất. Chiến thuật của B là đi vào ô :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
B đi nước 1 thì A sẽ đi nước 3: a31=5
B đi nước 2 thì A sẽ đi nước 2 : a22=0
B đi nước 3 thì B sẽ đi nước 1 : a13=6
Vậy MiniMax(B) = a22= 0
Lần này ta thấy rằng :
MaxiMin(A) = MiniMax(B) = a22= 0
Bộ chiến lược (2,2) có giá trị là 0 là nghiệm tối ưu của trò chơi vì nếu người nào đi lệch và người kia đi đúng thì người đi đúng thu lợi nhiều hơn giá trị của trò chơi. Nghiệm tối ưu trong trường hợp này còn được gọi là nghiệm ổn định.
Xét ví dụ tương tự như trên với bảng kết quả được các chuyên gia đánh giá như sau :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Khi A và B dùng chiến lược MaxiMin và MiniMax của mình thì cho kết quả như sau :
MaxiMin(A) = a12 = -2
MiniMax(B) = a13 = 2
Vì MaxiMin(A) và MiniMax(B) là khác nhau nên trò chơi không có nghiệm ổn định. Ta xem điều gì có thể xảy ra ?
- A tính rằng nếu B thực hiện đúng chiến lược của mình là chọn cột 3 thì A sẽ chọn chiến lược 1 để thắng 2 từ B (thay vì thắng -2)
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Lúc này B sẽ suy tính và thấy rằng phải chọn chiến lược 2 để thua -2 từ A (thay vì thua 2).
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Đến lượt A cũng đủ thông minh để tính liền được 2 nước, biết được B sẽ chọn chiến lược 2 nên A sẽ dùng chiến lược 2 để thắng 4 từ B .
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Nhưng B cũng tính được điều này nên sẽ quay lại chọn chiến lược 3 để thua -3 từ A .
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
- Cũng như B , A cũng sẽ tính được điều này nên sẽ quay lại chọn chiến lược 1 để thắng 2 từ B.
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Như vậy ta đã xoay đúng một vòng, và nếu cứ lập luận như vậy thì ta sẽ xoay vòng mãi. Những bộ chiến lược nhận được trong khi xoay vòng là những nghiệm không ổ định.
Chiến lược hỗn hợp
Để có được lời giải của trò chơi không có nghiệm ổn định người ta đưa ra khái niệm chiến lược hỗn hợp. Mỗi người chơi không chọn một chiến lược thuần túy như trước đây mà chọn một phân bố xác suất sử dụng tất cả các chiến lược.
Xét trò chơi giữa A và B có ma trận điểm dương có dạng tổng quát :
| 1 | 2 | ... | n | B | ||||||||||||||||||||||||||
| A |
|
|||||||||||||||||||||||||||||
Giả sử rằng :
Gọi :
. pi > 0 (i=1 m ) là tần suất nước đi thứ i của A với
p1 + p2 + ... + pm = 1
. qj > 0 (j=1 n ) là tần suất nước đi thứ j của B với
q1 + q2 + ... + qn = 1
| q1 | q2 | ... | qn | ||||||||||||||||||||||||||||||||
| 1 | 2 | ... | n | B | |||||||||||||||||||||||||||||||
| A |
|
||||||||||||||||||||||||||||||||||
Vấn đề đặt ra là :
-Tìm tần suất pi > 0 của nước đi thứ i (i =1 m) của A sao cho đối với mỗi nước đi thứ j của B số điểm thắng trung bình của A không nhỏ thua gA :
p1a1j + p2a2j + ..... + pmamj(j = 1 n)
Cũng có nghĩa là tìm pi sao cho :
p1a1j + p2a2j + ..... + pmamj g1 gA (j = 1 n)
g1 max
- Tìm tần suất qj > 0 của nước đi thứ j (j =1 n) của B sao cho đối với mỗi nước đi thứ i của A số điểm thua trung bình của B không lớn hơn gB :
q1ai1 + q2ai2 + .... + qnain (i = 1 m)
Cũng có nghĩa là tìm các qj sao cho :
q1ai1 + q2ai2 + ..... + qnain g2 gB (i = 1 m)
g2 min
Khi đó hai bài toán quy hoạch tuyến tính thu được là :
Chia các ràng buộc của bài toán thứ nhất cho g1>0 và đặt :
Chia các ràng buộc của bài toán thứ hai cho g2>0 và đặt :
Khi đó hai bài toán quy hoạch tuyến tính trên trở thành :
(D)
(P)
Ðây là hai bài toán đối ngẫu . Chọn một trong hai để giải
Ví dụ :
Xét trò chơi giữa A và B có bảng điểm như sau :
| 1 | 2 | 3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
Theo chiến thuật của A và của B ta có :
MaxiMin(A) = a11
MiniMax(B) = a23
Tăng đồng loạt các ô của bảng điểm lên 4 ta được :
| 1 | 2 | 3 | B | ||||||||||||
| A |
|
||||||||||||||
| 3 | 7 | 8 | 1 | ||||||||||||
Gọi
pi 0 là tần suất nước đi thứ i của A (i=1 3)
p1 + p2 + p3 = 1
qj 0 là tần suất nước đi thứ j của B (j=1 3)
q1 + q2 + q3 =1
Thực hiện tương tự như trên ta được hai bài toán đối ngẫu như sau :
| q1 | q2 | q3 | B | |||||||||||||||||
| A |
|
|||||||||||||||||||
(D)
Ta chọn bài toán (P) để giải.
Ðưa bài toán (P) về dạng chuẩn :
(P)
Dùng giải thuật đơn hình cải tiến :
|
|
|
|
|
|
|
|
|
|
| 0 | 4 | 3 | 6 | 5 | 1 | 0 | 0 | 1 |
| 0 | 5 | 5 | 2 | 6 | 0 | 1 | 0 | 1 |
| 0 | 6 | 7 | 8 | 1 | 0 | 0 | 1 | 1 |
|
|
1 | 1 | 1 | 0 | 0 | 0 |
|
|
|
|
1 | 1 | 1 | 0 | 0 | 0 | 0 | |
|
|
|
|
|
|
|
|
|
|
| 0 | 4 | 0 |
|
|
1 | 0 |
|
|
| 0 | 5 | 0 |
|
|
0 | 1 |
|
|
| 1 | 1 | 1 |
|
|
0 | 0 |
|
|
|
|
1 | 1 | 1 | 0 | 0 | 0 |
|
|
|
|
0 |
|
|
0 | 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 0 | 4 | 0 |
|
0 | 1 |
|
|
|
| 1 | 3 | 0 |
|
1 | 0 |
|
|
|
| 1 | 1 | 1 |
|
0 | 0 |
|
|
|
|
|
1 | 1 | 1 | 0 | 0 | 0 |
|
|
|
|
0 |
|
0 | 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 | 2 | 0 | 1 | 0 |
|
|
|
|
| 1 | 3 | 0 | 0 | 1 |
|
|
|
|
| 1 | 1 | 1 | 0 | 0 |
|
|
|
|
|
|
1 | 1 | 1 | 0 | 0 | 0 |
|
|
|
|
0 | 0 | 0 |
|
|
|
|
|
Phương án tối ưu của bài toán (P) là :