Hayaller ve gerçekler

Cem Say
Hayaller ve gerçekler

Bilgisayarın insan şampiyonu yendiği birkaç gösteri maçı, yapay zekâ tarihinin unutulmaz anları arasında yer alır. Satranç şampiyonu Kasparov ve go şampiyonları Li ve Kı’nın canlı yayınlanan yenilgileri hâlâ belleklerdedir. Türk televizyonlarında “Riziko” adıyla çekilen “Jeopardy!” bilgi yarışması da 2011’de benzer bir dönüm noktasından geçmişti.

IBM şirketinin yapay zekâ sistemi Watson, bu oyunda o tarihe dek en yüksek başarıyı göstermiş iki insanı net bir şekilde geride bırakarak bilgisayarların “doğal dil anlama” engelini de artık aştığı izlenimini yaymış, maçın ertesi günü de şirket Watson’ın “anlama” becerilerini tıbbi teşhis gibi alanlarda hayata geçireceğini duyurmuştu.

Watson’ın dile derin bir hakimiyet gerektirdiği düşünülen Riziko’yu nasıl oynadığını benzer bir programın yaratıcısı olan Noriko Arai’nin verdiği bir örnekle görelim: “Mozart’ın son senfonisiyle aynı addaki gezegen” sorulduğunda Watson bu metinden “Mozart’ın son senfonisi” öbeğini çıkarmayı becerip bu öbeği dev bilgi bankasında Google gibi bir arama motoruna aratır. Çıkan listedeki Vikipedi sayfalarından en üsttekine bakar. (Tabii bu sistem sadece Vikipedi’nin yasak olmadığı yerlerde çalışır.) Bu sayfanın “Mozart”, “son” ve “senfoni” kelimelerinin yoğun şekilde geçtiği bir kısmında bir gezegen adı da geçiyorsa herhalde aranan cevap odur!


Riziko soruları genellikle bu örnektekinden daha dolaylı ipuçları ve konu başlıkları içerdiğinden Watson’ın insanüstü performansa ulaşması için (gezegen isimlerinin basit bir listesinden çok daha karmaşık) “varlık tanıma” algoritmaları kullanması ve tanıdığı şeyler arasındaki ilişkileri temsil edebilmesi gerekiyordu. Binlerce (doğru veya yanlış diye etiketlenmiş) örnek Riziko soru-cevap çifti üzerinde çalışarak bu oyun için girdilerden yararlanmanın birçok yolunu öğrenmişti. Erişebildiği bilgi miktarının büyüklüğü, tökezlediği birkaç soruda meydana çıkan “derin anlama” eksikliğini telafi ederek onu şampiyonluğa taşımıştı.

Elde çok az ürün

Yazı dizimizin önceki bölümlerinde söz ettiğim gibi, Watson’ın bir insanın takip edemeyeceği hızda büyüyen tıp literatürünü tarayarak doktorların teşhis koyma aşamasında hiçbir şeyi gözden kaçırmamalarını sağlayacak bir bilgi desteği sağlaması amaçlanıyordu. Eliza Strickland’ın saygın mühendislik dergisi IEEE Spectrum’un geçen ayki sayısındaki makalesinde de belirttiği gibi bu uygulama da IBM’in büyük umutlarla başlayıp sonra performans veya maliyet açısından bir artısı olacağını göremeyince ticarileştirmemeye karar verdiği birçok Watson tıp projesinden biri oldu.

Milyarlarca dolarlık yatırıma karşılık şimdilik elde çok az ürünün bulunmasının ardındaki teknik zorlukların başta geleni, insan dilinin (doktorların kullandığı alt kümesine sınırlandığında bile) çok zor olması. Watson’ın hastalar hakkında tutulmuş kayıtlardaki İngilizce bilgileri özümseyip onları sayısal diğer verilerle bütünleşik olarak yapay öğrenme algoritmalarına girdi olarak vermesi, böylelikle hastalıklar ve tedaviler âleminde yeni örüntüleri keşfetmesi umuluyordu.

Ne yazık ki gerçek tıbbi kayıtlarda kullanılan dil, makinelerin henüz çözemeyeceği düzeyde eksiklikler, muğlaklıklar ve ortak örüntüler bulunmasını güçleştiren “düzensizlik”lerden muzdarip. İnsan doktorların çözebildiği bu şifre şimdilik YZ için kilitli bir kapı.

Kanser hakkındaki bilimsel makaleleri ve gerçek hasta kayıtlarını alıp harikalar yaratması umulan “Watson for Oncology” ürününü eğiten Memorial Sloan Kettering Kanser Merkezi uzmanlarının Strickland’e anlattıkları bir anekdot, programın “öğrenme” stiliyle insan doktorlarınki arasındaki bir farkı gözler önüne seriyor:2018’de belli bir gen mutasyonu içeren her tümöre karşı etkin olduğu görülen larotrectinib adında bir ilaç, dördü akciğer kanseri olan 55 hasta üzerinde gösterdiği başarıya dayanarak ABD resmi makamlarınca onaylanmış. İnsan doktorlar bu gelişme üzerine eski prosedürleri terkedip tüm akciğer kanseri hastalarının bu gen testine tabi tutulmasını istemeye başlamış. Oysa Watson’ın bilimsel makalelerin ana sonuçlarından çıkardığı istatistikleri temel alan yöntemi onun sadece dört hastayla ilgili bilgiye dayanarak aynı yargıya varmasına izin vermiyormuş. Sloan Kettering’deki doktorlar Watson’ın bu konuda kendileriyle aynı sonucu çıkarması için gerçekte varolmayan birçok hasta uydurup sisteme kaydetmek zorunda kalmış.

Tıp dünyasında gerçek nedensel ilişkileri tesadüfler ve diğer istatistiksel bağlantılardan ayırt etmek için kullanılan ölçütler yapay öğrenme araştırmacılarının başarı tanımlarındakilere çok benzemiyor. Yapay zekâyı tıp gibi ölüm kalım meselelerine uygulamak ona satranç, go vs. oyunlar oynatmaktan zor elbet. Ama işin ucundaki ödül de çok büyük. Çalışmalar sürüyor.

Cem Say / sayster@gmail.com

*Bu yazı HBT'nin 163. sayısında yayınlanmıştır.

Cem Say

1987'den beri Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü'nde çalışıyor. Çalışmaları Yapay Zeka ve Kuramsal Bilgisayar Bilimi üzerine. Sahte dijital deliller üzerine incelemeleri var. Bilimkurgu, uzay yolculuğu, seçim hileleri ve başka bir çok konuya da meraklı.