Pada tahun 1930-an, John von Neumann dan Oscar Morgenstern menjadi pengasas cabang matematik baharu dan menarik yang dipanggil "teori permainan". Pada tahun 1950-an, ahli matematik muda John Nash mula berminat ke arah ini. Teori keseimbangan menjadi subjek disertasinya, yang ditulisnya pada usia 21 tahun. Maka lahirlah strategi permainan baharu yang dipanggil "Nash Equilibrium", yang memenangi Hadiah Nobel beberapa tahun kemudian - pada tahun 1994.
Jurang panjang antara menulis disertasi dan pengiktirafan umum telah menjadi ujian bagi seorang ahli matematik. Genius tanpa pengiktirafan mengakibatkan gangguan mental yang serius, tetapi John Nash dapat menyelesaikan masalah ini berkat fikiran logiknya yang sangat baik. Teori Nash Equilibriumnya memenangi Hadiah Nobel dan hidupnya dirakam dalam Beautiful mind.
Secara ringkas tentang teori permainan
Memandangkan teori keseimbangan Nash menerangkan tingkah laku orang dalam keadaan interaksi, adalah wajar mempertimbangkan konsep asas teori permainan.
Teori permainan mengkaji tingkah laku peserta (ejen) dari segi interaksi antara satu sama lain seperti permainan, apabila hasilnya bergantung kepada keputusan dan tingkah laku beberapa orang. Peserta membuat keputusan berdasarkan ramalannya tentang kelakuan orang lain, yang dipanggil strategi permainan.
Terdapat juga strategi dominan di mana peserta mendapat hasil terbaik untuk sebarang tingkah laku peserta lain. Ini adalah strategi menang-menang terbaik pemain.
Dilema banduan dan penemuan saintifik
Dilema banduan ialah kes permainan di mana peserta dipaksa membuat keputusan yang rasional, mencapai matlamat bersama dalam menghadapi konflik alternatif. Persoalannya ialah pilihan mana yang akan dia pilih, menyedari kepentingan peribadi dan umum, serta kemustahilan untuk mendapatkan kedua-duanya. Para pemain kelihatan seperti dipenjarakan dalam persekitaran permainan yang sukar, yang kadangkala membuatkan mereka berfikir dengan sangat produktif.
Dilema ini diterokai oleh ahli matematik Amerika John Nash. Keseimbangan yang dicapainya adalah revolusioner dengan caranya sendiri. Terutama sekali pemikiran baharu ini mempengaruhi pendapat ahli ekonomi tentang cara pemain pasaran membuat pilihan, dengan mengambil kira kepentingan orang lain, dengan interaksi rapat dan persimpangan kepentingan.
Adalah yang terbaik untuk mempelajari teori permainan melalui contoh konkrit, kerana disiplin matematik ini sendiri bukanlah teori yang kering.
Contoh dilema banduan
Contoh, dua orang melakukan rompakan, jatuh ke tangan polis dan sedang disoal siasat dalam sel berasingan. Pada masa yang sama, pegawai polis menawarkan setiap peserta syarat yang menggalakkan di mana dia akan dibebaskan jika dia memberi keterangan terhadap pasangannya. Setiappenjenayah mempunyai set strategi berikut yang akan dia pertimbangkan:
- Kedua-duanya memberi keterangan pada masa yang sama dan mendapat 2.5 tahun penjara.
- Kedua-duanya diam pada masa yang sama dan masing-masing menerima 1 tahun, kerana dalam kes ini asas bukti kesalahan mereka akan menjadi kecil.
- Seorang memberi keterangan dan dibebaskan, manakala seorang lagi diam dan dipenjara 5 tahun.
Jelas sekali, keputusan kes bergantung kepada keputusan kedua-dua peserta, tetapi mereka tidak boleh bersetuju, kerana mereka duduk dalam sel yang berbeza. Konflik kepentingan peribadi mereka dalam perjuangan untuk kepentingan bersama juga jelas kelihatan. Setiap banduan mempunyai dua pilihan untuk tindakan dan 4 pilihan untuk keputusan.
Rantai inferens logik
Jadi, pesalah A sedang mempertimbangkan pilihan berikut:
- Saya diam dan pasangan saya diam - kami berdua akan dipenjara selama 1 tahun.
- Saya menyerahkan pasangan saya dan dia menyerahkan saya - kami berdua dipenjara 2.5 tahun.
- Saya diam, dan pasangan saya mengkhianati saya - Saya akan dipenjara 5 tahun, dan dia akan bebas.
- Saya menyerahkan pasangan saya, tetapi dia diam - Saya mendapat kebebasan, dan dia mendapat 5 tahun penjara.
Mari berikan matriks penyelesaian dan hasil yang mungkin untuk kejelasan.
Jadual kemungkinan hasil dilema banduan.
Persoalannya, apakah yang akan dipilih oleh setiap peserta?
"Diam, anda tidak boleh bercakap" atau "Anda tidak boleh diam, anda tidak boleh bercakap"
Untuk memahami pilihan peserta, anda perlu melalui rantaian pemikirannya. Mengikut alasan penjenayah A: jika saya berdiam diri dan pasangan saya berdiam diri, kami akan menerima tempoh minimum (1 tahun), tetapi sayaSaya tidak tahu bagaimana dia akan berkelakuan. Jika dia memberi keterangan terhadap saya, lebih baik saya memberi keterangan, jika tidak saya boleh duduk selama 5 tahun. Saya lebih suka duduk selama 2.5 tahun daripada 5 tahun. Jika dia berdiam diri, maka lebih-lebih lagi saya perlu memberi keterangan, kerana dengan cara itu saya akan mendapat kebebasan saya. Peserta B.
Tidak sukar untuk melihat bahawa strategi dominan bagi setiap pelaku adalah untuk memberi keterangan. Titik optimum permainan ini datang apabila kedua-dua penjenayah memberi keterangan dan menerima "hadiah" mereka - 2.5 tahun penjara. Teori permainan Nash memanggil keseimbangan ini.
Penyelesaian Nash optimum tidak optimum
Sifat revolusioner pandangan Nashian ialah keseimbangan sedemikian tidak optimum apabila mempertimbangkan peserta individu dan kepentingan dirinya. Lagipun, pilihan terbaik ialah berdiam diri dan pergi bebas.
Nash equilibrium ialah titik penumpuan kepentingan, di mana setiap peserta memilih pilihan yang optimum untuknya hanya jika peserta lain memilih strategi tertentu.
Memandangkan pilihan apabila kedua-dua penjenayah senyap dan menerima hanya 1 tahun, kami boleh memanggilnya sebagai pilihan Pareto-optimum. Walau bagaimanapun, ia hanya mungkin jika penjenayah boleh bersetuju terlebih dahulu. Tetapi ini tidak akan menjamin keputusan ini, kerana godaan untuk berundur daripada perjanjian dan mengelakkan hukuman adalah hebat. Kekurangan kepercayaan sepenuhnya antara satu sama lain dan bahaya mendapat 5 tahun terpaksa memilih pilihan dengan pengiktirafan. Renungkan apa yang peserta akan patuhipilihan dengan diam, berlakon secara konsert, adalah tidak rasional. Kesimpulan sedemikian boleh dibuat jika kita mengkaji keseimbangan Nash. Contoh hanya membuktikan anda betul.
Mementingkan diri sendiri atau rasional
Teori Keseimbangan Nash menghasilkan kesimpulan yang mengejutkan yang menyangkal prinsip yang wujud sebelum ini. Sebagai contoh, Adam Smith menganggap tingkah laku setiap peserta sebagai benar-benar mementingkan diri sendiri, yang membawa sistem menjadi seimbang. Teori ini dipanggil "tangan halimunan pasaran."
John Nash melihat bahawa jika semua peserta bertindak untuk kepentingan mereka sendiri, ini tidak akan membawa kepada keputusan kumpulan yang optimum. Memandangkan pemikiran rasional adalah wujud dalam setiap peserta, pilihan yang ditawarkan oleh strategi keseimbangan Nash adalah lebih berkemungkinan.
Percubaan lelaki semata-mata
Contoh utama ialah permainan paradoks berambut perang, yang, walaupun kelihatan tidak pada tempatnya, merupakan ilustrasi yang jelas tentang cara teori permainan Nash berfungsi.
Dalam permainan ini anda perlu membayangkan bahawa sekumpulan lelaki bebas datang ke bar. Berdekatan adalah sekumpulan gadis, salah satunya lebih disukai daripada yang lain, katakan seorang berambut perang. Bagaimanakah lelaki bertindak untuk mendapatkan teman wanita yang terbaik untuk diri mereka sendiri?
Jadi, alasan lelaki: jika semua orang mula berkenalan dengan si berambut perang, maka, kemungkinan besar, tiada siapa yang akan memahaminya, maka rakan-rakannya tidak akan mahu berkenalan. Tiada siapa yang mahu menjadi sandaran kedua. Tetapi jika budak-budak memilih untuk mengelakberambut perang, maka kebarangkalian bagi setiap lelaki untuk mencari teman wanita yang baik dalam kalangan gadis adalah tinggi.
Situasi keseimbangan Nash tidak optimum untuk lelaki, kerana, hanya mengejar kepentingan diri sendiri, semua orang akan memilih berambut perang. Dapat dilihat bahawa mengejar hanya kepentingan diri sendiri akan sama dengan keruntuhan kepentingan kumpulan. Keseimbangan Nash bermakna setiap lelaki bertindak mengikut kepentingannya sendiri, yang bersentuhan dengan kepentingan seluruh kumpulan. Ini bukan pilihan terbaik untuk semua orang secara peribadi, tetapi yang terbaik untuk semua orang, berdasarkan strategi keseluruhan untuk berjaya.
Seluruh hidup kita adalah permainan
Membuat keputusan dalam dunia nyata adalah seperti permainan yang anda mengharapkan tingkah laku rasional tertentu daripada peserta lain juga. Dalam perniagaan, di tempat kerja, dalam pasukan, dalam syarikat, dan juga dalam hubungan dengan lawan jenis. Daripada tawaran besar kepada situasi kehidupan biasa, semuanya mematuhi satu undang-undang atau yang lain.
Sudah tentu, situasi permainan di atas dengan penjenayah dan bar hanyalah ilustrasi terbaik yang menunjukkan keseimbangan Nash. Contoh dilema sebegini selalunya timbul dalam pasaran sebenar, dan ini berkesan terutamanya dalam kes di mana dua syarikat monopoli mengawal pasaran.
Strategi Campuran
Selalunya kami tidak terlibat dalam satu, tetapi beberapa permainan sekaligus. Memilih salah satu pilihan dalam satu permainan, berpandukan strategi rasional, tetapi anda berakhir dalam permainan lain. Selepas beberapa keputusan rasional, anda mungkin mendapati bahawa keputusan anda tidak sesuai dengan keinginan anda. Apaambil?
Mari kita pertimbangkan dua jenis strategi:
- Strategi tulen ialah tingkah laku peserta, yang datang daripada memikirkan kemungkinan tingkah laku peserta lain.
- Strategi campuran atau strategi rawak ialah penggantian strategi tulen secara rawak atau pilihan strategi tulen dengan kebarangkalian tertentu. Strategi ini juga dipanggil rawak.
Memandangkan tingkah laku ini, kita mendapat pandangan baharu pada keseimbangan Nash. Jika sebelum ini dikatakan bahawa pemain itu memilih strategi sekali, maka tingkah laku lain boleh dibayangkan. Ia boleh diandaikan bahawa pemain memilih strategi secara rawak dengan kebarangkalian tertentu. Permainan yang tidak dapat mencari keseimbangan Nash dalam strategi tulen sentiasa mempunyai mereka dalam strategi campuran.
Keseimbangan Nash dalam strategi campuran dipanggil keseimbangan campuran. Ini ialah keseimbangan di mana setiap peserta memilih kekerapan optimum untuk memilih strateginya, dengan syarat peserta lain memilih strategi mereka dengan kekerapan tertentu.
Pen alti dan strategi campuran
Contoh strategi campuran boleh didapati dalam permainan bola sepak. Ilustrasi terbaik bagi strategi campuran mungkin adalah penentuan sepakan pen alti. Jadi, kami mempunyai penjaga gol yang hanya boleh melompat ke satu sudut, dan pemain yang akan mengambil pen alti.
Jadi, jika kali pertama pemain memilih strategi untuk merembat ke sudut kiri, dan penjaga gol juga jatuh ke sudut ini dan menangkap bola, bagaimana keadaan boleh berkembang untuk kali kedua? Jika pemainakan memukul di sudut bertentangan, ini kemungkinan besar terlalu jelas, tetapi memukul di sudut yang sama tidak kurang jelasnya. Oleh itu, kedua-dua penjaga gol dan penyepak tidak mempunyai pilihan selain bergantung pada pemilihan rawak.
Oleh itu, dengan menukar pilihan rawak dengan strategi tulen tertentu, pemain dan penjaga gol cuba untuk mendapatkan hasil yang maksimum.