Zihnin derinliklerinden oyunlara

3 Ağustos 2021

Evvel zaman içinde, kalbur saman içinde… Göçmenliğin zor zanaat, içimizdeki üretme ve yaratma gücünün en güzele ve en iyiye varmasının da yine de mümkün olduğu bir vakitte, iki göçmen ailenin oğulları varmış; arkadaşmışlar; zekiymişler ve çalışkanmışlar. Aileleri tahminen daha iyi imkânlar için İngiltere’ye göçmüş. Biri uluslararası düzeyde satranç şampiyonu olmuş; sonra satrancı bırakmış; başarılı bilgisayar oyunları yazmış; üniversitede bilgisayar bilimleri okumuş. Diğeri, Mustafa Süleyman, üniversiteyi de bırakmış; dini temel alan ayrımcılığa karşı aktivist olarak kendini geliştirmiş [1,2]. Satranç şampiyonu olan, Demis Hassabis, oyun şirketleri kurarak geliştirdiği başarılı iş yaşamını bir noktada bırakmış, zihnin işleyişini anlamak için bilişsel sinirbilim doktorası yapmış. Demans hastalarının yeni anılar biriktirememe sorununun, aslında hayali deneyimleri de imgeleyememelerini içerdiğini bulmuş takım arkadaşlarıyla. Belleğin anıları biriktirme gücüyle imgeleme gücünün beyinde ortak sinirsel ağları kullandıklarını göstermişler [3,4]. İnsan zihnini yok saymadan yapay zekâya dönmüş Demis Hassabis.

Zor bir oyun: Go

Mustafa Süleyman’la beraber yapay zekâ tekniklerini ve bilgisayarların beyin gibi bilgiyi depolayabilme ve kullanabilme gücünü, insanlık ve bilim için önemli problemleri çözmek için kullanabilir miyiz sorusuyla başlamışlar. 2010 yılında DeepMind (Tr. Derin Zihin) adını verdikleri bir şirket kurmuşlar. Yapay zekânın başarısı açısından satrancın gerisinden gelen Çin kökenli Go oyununa konsantre olmuşlar. Hassabis ve Süleyman, DeepMind’ı Google’a 2014 yılında 400 milyon dolara satmışlar; ancak DeepMind için çalışmaya devam etmişler; küçük takımları 700 kişilik bir ekibe dönüşmüş [2].

İlk göz ağrıları Go oyununa dönersek, Go niye yapay zekâ programları için satrançdan daha zor? Go standart olarak 19 yatay, 19 dikey çizgiden oluşan 19×19’luk başlangıçta boş bir oyun tahtasında oynanır. Oyuncular sırayla kesişim noktalarına birer taş koyarlar; kısaca oyuncunun amacı, rakip oyuncunun taşlarını ve tahtadaki oyun alanlarını çepeçevre kendi taşlarıyla sarmalamak ve rakipten daha çok alan alabilmektir. Go daha kolay kuralları olmasına rağmen en gelişmiş donanımların bile üstesinden gelemediği bir dallanma kapasitesine sahip.

Yani oyunun belli bir noktasında satrançta ortalama 35 hamle yapılabiliyorsa Go’da bu sayı 250. Satrançta ortalama 80 hamleyle bir oyun bitebiliyorsa, Go’da bu sayı, yani oyun hamlelerini yansıtan ağacın derinliği ortalama 150 hamle. Ayrıca oyun tahtasındaki bir hamlenin ve ardından gelebilecek pozisyonların iyi mi kötü mü sonuç getireceğinin değerlendirmesini yapmak da Go’da satranca göre daha zor. Dolayısıyla Go oyununu üst düzey ustalar düzeyinde oynayabilen bir program, uzun yıllardır bilgisayar oyunları alanında yapay zeka uygulamalarının gelişimi için bir kilometre taşı olarak bekleniyordu [5]. IBM’in Deep Blue’sunun satranç ustası Kasparov’u 1997’de yenmesinden yaklaşık 20 yıl sonra, Deep Mind bu kilometre taşına erişilmesini sağladı. Geliştirdikleri yazılım AlphaGo, Ekim 2015’de Avrupa Go şampiyonu Fan Hui’yi resmi bir 5 serilik maçta 5-0 yenerek ilk büyük başarımını elde etmiş. Daha büyük bir başarımı ise yaşayan en üst düzey Go ustalarından sayılan Koreli Lee Sedol’u Mart 2016 yılında 4-1 yenerek kazanmış.

Go oyunlarında kullanılan ipuçları

DeepMind’ın AlphaGo’sunu başarılı kılan yapay zekâ etmenleri nelerdir? Aslında hiç biri yapay zekâ dünyasında tamamen yeni değil. Bir kısmı başka Go programlarında da kısmen denenmiş teknikler; ancak işinin ustası bir takımın uyumlu çalışmasıyla biraraya getirilişleri birden fazla yenilik içeriyor [6]: Teknik olarak üç ayaklı bir yapı var. Birincisi, istenirse dağıtık işlemci ve grafik işleme ünitelerini de eş zamanlı kullanarak verimini maksimize eden Go tahtası pozisyonlarının kodlanmasını ve değerlendirmesini sağlayan derin sinir ağları (İng. Deep neural networks). İkincisi hem Go ustalarının oyunlarının, hem kendi oyunlarının versiyonlarıyla defalarca karşılaşarak oyun ustalığını geliştiren pekiştirmeli öğrenme (İng. Reinforcement Learning) ve oyun hamleleri ağacı üzerinde istatistiki olarak arama yapan Monte Carlo Ağaç Arama algoritmaları; sonuncusu ise diğer Go oyunlarında kullanılan ipuçları veya oyuna özel bilgiler yerine Genel Yapay Zekâ prensiplerinin (İng. General Artificial Intelligence) kullanılması. Alpha Go’nun yaratıcıları bu üçlü yapıyı da kendi içinde geliştirerek Alpha Go’nun Lee Sedol’u yendikten sonra bile gelişmesini sağlıyorlar [6].

İnsan zekâsına denk mi?

Bir diğer soru ise ters köşeden: AlphaGo’nun başarısı gerçekten yapay zekânın insan zekâsına denkliği için bir kilometre taşı mıdır? Daha bugünkü anlamda bilgisayarlar yokken, İngiliz matematikçi ve bilgisayar bilimlerinin kurucularından Alan Turing yapay zekânın başarısı için taklit temelli bir test öngörür: Turing Testi olarak anılan taklit oyunu. Karşısındakini insan olduğuna inandırmaya çalışan bir bilgisayar programı ve bir insanın, kontrollü şartlarda bir hakem tarafından yeterince sık karıştırılmasına dayanan Turing Test ve çeşitlemelerini geçmek için AlphaGo’nun başarısı yeterli mi [7]? Yoksa, oyun alanında bir Turing Test kazananı istiyorsak, Go veya satranç yerine Zindanlar ve Ejderhalar (İng. Dungeons and Dragons) gibi bir fantastik rol yapma oyununu oynabilen bir yapay zekâ programı daha mı anlamlı [8]? Sosyal rollere bürünme, o rolleri değiştirme, bedenimizle zekamızı birleştirme gibi insan zekâsını bilişsel olarak farklılaştıran bazı özellikler AlphaGo düzeyinde de olsa yapay zekâ tekniklerini daha sınırlı kullanan programlarda yok maalesef.

Gerçi, Deep Mind’ın başarısı en iyi Go oynayan programı yazmakla sınırlı kalmamış. Aynı ekip, sağlık gibi dünyada eşitliğin dengesiz olduğu konularda Alpha- Go’yu başarılı kılan algoritmaları kullanarak projeler yürütüyorlar. Yapay zekâ etmenleri içeren programların hukuki ve etik boyutunun daha doğru değerlendirilmesi için Google’ın yapay zekâ için bir etik kurul kurmasında da aktif rol oynamışlar.

Zorunlu Göçmenlik tüm ağırlığıyla insanlığı sınamaya devam ediyor. Deep Mind’ın ve kurucularının yolculuğu, niye bir Suriyeli mülteci çocuk ve bir Türkiyeli arkadaşının da öyküsü olmasın? Teknolojinin evrilme kapasitesi yüksek; nitelikli bilgiye erişim hiç olmadığı kadar kolaylaştı. Özellikle çocukların olabilecekleri güzelliklere ulaşmaları için doğru aile, eğitim ve insanlık ortamı sürdürülebilir olursa, niye olmasın? Bir tohumu olduğuyla değil, olabileceğiyle ölçersin. Dileğim devlet, üniversite ve STKlar, bilim insanları ve eğitimcilerin projelendirmeleriyle benzer öykülere Türkiye’den genç fidanların eklenmesi..

Dr. Öğretim Üyesi Bilge Say
Atılım Üniversitesi, Mühendislik Fakültesi Yazılım Mühendisliği Bölümü

Kaynaklar:
[1] S. Shead. “The incredible life of DeepMind founder Demis Hassabis, the computer whiz who sold his AI lab to Google for £400 million”. Internet: http://uk.businessinsider.com/the-incredible-life-of-deepmind- cofounder-demis-hassabis-2017-5/ . 21 Mayıs, 2017 [Erişim: Mart 2018]
[2] S. Shead. “Mustafa Suleyman: The liberal activist who cofounded Google’s £400 million artificial intelligence lab”. Internet: http://uk. businessinsider.com/mustafa-suleyman-the-lefty-activist-ensuring-google- deepmind-benefits-all-of-humanity-2017-12. 20 Ocak, 2018 [Erişim: Mart 2018]
[3] D. Hassabis ve E. A. Maguire, “Deconstructing episodic memory with construction,” Trends in Cognitive Sciences, vol. 11, no. 7, s. 299–306, Temmuz 2007.
[4] D. Hassabis, D. Kumaran, S. D. Vann, ve E. A. Maguire, “Patients with hippocampal amnesia cannot imagine new experiences,” Proceedings of the National Academy of Sciences, vol. 104, no. 5, s. 1726–1731, Ocak 2007.
[5] D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G. van den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, S. Dieleman, D. Grewe, J. Nham, N. Kalchbrenner, I. Sutskever, T. Lillicrap, M. Leach, K. Kavukcuoglu, T. Graepel, ve D. Hassabis, “Mastering the game of Go with deep neural networks and tree search,” Nature, vol. 529, no. 7587, s. 484–489, Ocak 2016.
[6] D. Silver, J. Schrittwieser, K. Simonyan, I. Antonoglou, A. Huang, A. Guez, T. Hubert, L. Baker, M. Lai, A. Bolton, Y. Chen, T. Lillicrap, F. Hui, L. Sifre, G. van den Driessche, T. Graepel, and D. Hassabis, “Mastering the game of Go without human knowledge,” Nature, vol. 550, no. 7676, pp. 354–359, Ekim 2017.
[7] A. Hodges. The Alan Turing Internet Scrapbook: Turing Test. Internet: http://www.turing.org.uk/scrapbook/test.html [Erişim: Nisan 2018]
[8] B. Dingler. “Dungeons and Dragons, not chess and Go: why AI needs roleplay”. Internet: https://aeon.co/ideas/dungeons-and-dragons- not-chess-and-go-why-ai-needs-roleplay. Nisan, 2018.

Bu yazı HBT’nin 109. sayısında yayınlanmıştır.