Blöf Yapmayı Öğrenen Bilgisayar

03 Mart 2015Son güncelleme: 03 Mart 2015

0 326 3 dakika okuma süresi

YZ (Yapay Zeka) bugün hatasız poker oynayabiliyorsa ulusal güvenliği de sağlayabilir mi? Hatasız olmak için pratik gerekir, derler. Bir yapay zekâ ürünü olsanız bile durum değişmiyor.

Alberta Üniversitesinden Michael Bowling liderliğindeki bir deneyde, Cepheus adlı bir yazılım pokerin “heads-up limit Texas Hold’Em” denilen bir türünü kendisiyle milyar kere milyar defa (evet, bir milyar çarpı bir milyar defa) oynadı. Cepheus 4.600 işlemci üzerinde çalıştı, saniyede 6 milyar el poker oynadı ve her bir galibiyetten, yenilgiden, beraberlikten ders çıkardı. 70 güne denk gelen ı.ooo yıl CPU zamanının ardından, Cepheus tüm insanlığın oynadığından daha fazla poker oynamış durumda. Science dergisinde paylaşılan bir habere göre Bowling’in ekibi oyunu tümüyle “çözdüklerini” açıkladılar. Yani programın kararları kusursuza o denli yakın ki 70 yıl boyunca günde 12 saat, her el 200 oyun oynayan, teorik bakımdan kusursuz bir insanın bundan iyisini yapması olanaksız.

İstatistikçilerin kullandığı, modası biraz geçmiş olan “oyun çözme” bir bakıma gerekli çünkü Cepheus her elde yenilmez değil. Bunun nedeni de oyunun üstesinden gelinemez bir şans unsuru içermesi. Eli kötü geldiyse, en kurnaz profesyonel bile bir acemiye yenilebilir.

“En kötü senaryo elinizin iyi, hasmmızın elinin daha da iyi olması,” diyor yayımlanan araştırmanın eş yazarlarından Mike Johanson. “Kazanacağınızı zannedip bir sürü para yatırıyorsunuz; kaybınız da ona göre büyük oluyor.”

Fakat binlerce el oynandıktan sonra istatistiksel gürültünün etkileri kayboluyor ve poker becerisi uzun vadede para kaybetmeyeceğinin garantisi oluyor.

“İlk adım poker uzmanlarını yenebilecek bir program inşa etmekti. Bunu 2008’de yaptık zaten,” diyor Johanson. “Şu anda makalemizle duyurduğumuz şey ise Cepheus’un kusursuz, hata yapmadan oyun oynayabilmesi.”

Texas Hold’Em pokerin araştırmada kullanılan versiyonunda iki oyuncu, sabit bahis ücretiyle ve 2 kart gizli oynuyor. Burada işin yeni olan yanı, Cepheus’un rakibin elindeki kartlara dair “mükemmel olmayan bilgi” sahibi olduğu halde karar vermesi. Bilgisayar bilimciler daha önce Connect Four ya da dama gibi “kusursuz bilgi” oyunlannı çözdülerse de, bu oyunlarda bilgisayar daha önceki hareketlerin ve olası sonuçların tamamım biliyor. Alberta ekibinin çalışması ise insanların oynadığı, basit olmayan kusurlu bilgiye dayalı bir oyunun ilk defa çözülmesi anlamına geliyor.

“Cepheus’un insan uzmanların yardımı olmadan oyun oynamayı öğrenmesi gerekti,” diyor Johanson. “Biz sadece kuralları gösterdik gerisini kendi kendine oynayarak öğrendi. Blöf ve yavaş oyun gibi şeyleri kendi kavradı.”

Blöf, eli zayıf olan oyuncunun rakibini kandırmak için agresif biçimde bahis yükseltmesi anlamına geliyor. Yavaş oyun ise tam tersi; eli güçlü olan oyuncu, rakibini oyunda kalmaya ikna etmek için küçük bahis artırımları yapıyor. Diğer oyuncunun elindekilerin bilinmemesinden kaynaklanan “kusurlu bilgi” bu psikolojik taktikleri diğer bilgisayarlar için çok zor hale getiriyordu. Ama artık hepsi değişti. Milyar kere milyar Texas Hold’Em oyununun ardından, Cepheus’un bir poker oyuncusunun kalkışacağı her türlü numaraya hazırlıklı olduğunu söyleyebiliriz.

Cepheus’a karşı http://poker.srv. ualberta.ca/ adresinden oynayabilir ya da strateji soruları yöneltebilirsiniz.

Poker büyük bir sektör olsa da oyun, bilgisayar bilimcileri daha çok bir mihenk taşı olarak ilgilendiriyor.

Johanson, başka alanlardaki oyun kuramcılarının da bu yöntemleri kusurlu bilginin var olduğu diğer alanlarda (örneğin uzlaşmalar ve anti terörizm) kullanabileceğini düşünüyor.

Örneğin Güney California Üniversitesinde öğretim üyesi olan Milind Tambe, hem Los Angeles Uluslararası Havaalanı’nın hem de uçaklardaki federal güvenlik görevlilerinin kullandığı, ARMOR (zırh) adında bir oyun teorisi aracı geliştirdi.

Bu sayede devriyeler ve güvenlik noktaları rastlantısallık içeren ama potansiyel tehditleri de hesaba katan bir biçimde belirleniyor.

Johanson’a bakılırsa havaalanı güvenliği satranç gibi bir strateji oyunu olarak görülebilir.

“Satranç gibi düşünün, ama iki ordunun büyüklüğü farklı. Havaalanının birden çok taşı var ve bunlar güvenlik görevlilerini, bomba köpeklerini ve kontrol noktalarım temsil ediyor. Teröristin ise belki de tek bir taşı var; ama bu taş iyi bir taş. Tıpkı bir vezir gibi tahtada rahatça hareket edebiliyor ve havaalanına en zayıf noktasından saldırabiliyor.

Aynı Texas Hold’Em oyununda olduğu gibi, havaalanı güvenliğinde de iki taraf rakibinin yapacağı hareketler konusunda kusurlu bilgiye sahip. Terörist havaalanında güvenlik tedbirleri olduğunu biliyor fakat yerinden habersiz. Los Angeles Havaalanı gibi karmaşık ve devasa bir havaalanını satranç tahtası gibi düşünmek kolay değil. Fakat kendi kendine trilyonlarca defa oynayarak pratik yapan, bu sırada blöfü ve yavaş oyunu öğrenen Cepheus gibi, yarının tekrarlamak YZ güvenlik simülasyonla-rının aklımızın kıyısından bile geçmeyen açıkları ortaya sermesi bekleniyor. andrew rosenblum

03 Mart 2015Son güncelleme: 03 Mart 2015

0 326 3 dakika okuma süresi