Yapay zekâda sağduyu işareti

30 Kasım 2021

Daha önceki yazılarımızda da değindiğimiz Çekişmeli Üretici Ağlar (kısa adları ile GAN’lar) günümüzde sosyal medyanın yıldızları oldular. Geçenlerde bir GAN’ın yaptığı tablo Christies’in bir açık arttırmasında 432.000 dolara ulaşan bir fiyatla alıcı buldu! GAN’lar iki sinir ağını birbirlerine karşı yarıştırarak, kendilerine verilen girdilerden hareketle gayet gerçekçi ve özgün çıktılar oluşturuyorlar. Örneğin insan yüzü görüntüleri ile ‘beslenirlerse’ yepyeni yüzler çizebiliyorlar. Yine GAN’lar, örneğin Van Gogh tabloları ile eğitildiklerinde onun stili ile resim çizmeyi öğreniyorlar, soyut resim dalında müzelerde sergilenebilecek düzeyde eserler ‘yaratabiliyorlar’, ya da bozuk görüntüleri netleştirebiliyorlar. Ne yazık ki bu ‘sanatsal yetenekleri’ yalan haber (fake news) üretimi gibi alanlarda kötüye kullanımlarının da yolunu açıyor.

GAN’lar nedir ve nasıl çalışırlar?

GAN ‘lar yapay sinir ağlarına (Artificial Neural Networks) dayalı derin öğrenim (Deep Learning) sistemleridir. GAN fikri ve mimarisi ilk kez 2014 yılında Montreal üniversitesinden Ian Goodfellow ve ekibinin bir makalesinde ortaya çıkmıştır. Facebook yapay zeka bölümü başkanı ve yapay zeka disiplininin en saygın isimlerinden biri olan Yann LeCun, GAN’ları, ‘Makine öğrenimi dalında son 10 yolda ortaya çıkan en orijinal fikir’ olarak nitelemiştir.

Her GAN birbirine karşı çalışan iki rakip ağdan oluşur ve bu nedenle ‘Çekişmeli’ (Adversarial) adını alır. Bu ağlardan biri ‘Üretici’ (Generator), diğeri ise ‘Ayırt edici’ (Discriminator) görevi yapar. Örneğin bir üretici ağa çok miktarda köpek resmi göstererek bunlardan hareketle kendi yarattığı köpek resimleri üretmesini sağlayabiliriz. Ayırt edici ağ ise köpek resimlerinden hangilerinin gerçek, hangilerinin yapay olduklarını belirleme görevini üstlenir. Her ağın çıktısının diğer ağa iletilmesi sayesinde de üretici ağ kısa sürede gerçeğine giderek daha benzer köpek resimleri üretir, ayırt edici ağ ise gerçek olmayan resimleri daha doğru belirlemeyi öğrenir.

Düşünen Robot’a iyice yaklaşılıyor

Geçen yıl, MIT, IBM, Google ve Hong Kong üniversitesi araştırıcıları GAN’ların çok güçlü diğer bir potansiyeli de olabileceğini fark ettiler: GAN’lar ‘düşündüklerini’ çizdiklerine göre, biz insanlara, yapay sinir ağlarının nasıl öğrendiklerini ve ‘akıl yürüttüklerini’ anlama olanağı verebilirlerdi. Gerçekten de, yapay zeka algoritmaları giderek karara destek, hatta kendi başına karar alma (tıpta tanı koyma, sürücüsüz araçları yönetme..) uygulamalarında kullanılıyor ama kararlarını neden ve nasıl aldıkları bilinmiyor!

Yukarıda sözünü ettiğimiz araştırıcılar, GAN’ların öğrenme mekanizmalarını, içerisinde ağaçlar, otlar, binalar ve gökyüzü olan görüntülerle beslediler. Merak ettikleri, bir GAN’ın, kendisine önceden öğretilmese bile, görüntülerdeki pikselleri anlamlı gruplara (kavramlara, konseptlere!) dönüştürüp dönüştüremeyecekleri idi. GAN, zaman içinde ve verilen örnek sayısı arttıkça, bunu akıllara durgunluk verici bir biçimde başardı. Belirli nöron kümeleri ‘açık’ ya da ‘kapalı’ duruma getirip, GAN’dan ‘düşündüğünü’ çizmesi istendiğinde (yani, yapay zeka programına uygun komut verildiğinde..) ağaç, ot vs nin yanında binaların bileşenleri olan duvar, kapı gibi objeleri bile ayırt etmeye başladı. Ve, bunu, kendisine eğitim amacı ile gösterilen resimlerdeki objelerin yeri, büyüklükleri, renkleri vs ne olursa olsun yapmayı başardı.

Üstteki resimdeki GANPaint adlı çizim aracı bu özellikleri kullanıyor. Fırça türü yerine örneğin kapı sembolünü seçiyor ve görüntüye bir kez tıklayarak oradaki bir binanın stiline uygun bir kapı ekliyor, mevcut kapıyı kaldırabiliyor ya da bir başkası ile değiştirebiliyorsunuz. Hepsi bu kadar da değil, yanlış yere, örneğin gökyüzüne tıklayarak oraya bir kapı çizdiremiyor ya da Gregorian stilde bir binaya Gotik stilde bir kapı konduramıyorsınuz!

Bütün bunların, biz insanların öğrendiğimiz ya da oluşturduğumuz kavramlardan hiçbir farkı yok açıkçası. Hatta eksikleri yok fazlaları var çünkü kimse onlara ‘Bak, bu bir kapıdır.’ demiyor. Kapı türlerini, stillerini de kendileri buluyor GAN’lar, örneklere bakarak. Denilebilir ki, GAN’lar sayesinde yapay zeka artık ‘sağ duyu’ sahibi. Bu da, günümüzdeki uzman yapay zekadan, (hakkında her türlü felaket senaryosu yazılan) genel yapay zekaya geçişte çok önemli bir adım. Genel yapay zekadan henüz çok uzak olsak da, bu gelişmeler beynimizin nasıl çalıştığını, kavramları nasıl oluşturduğumuzu anlama yönünde de yepyeni ufuklar açıyor.

GAN’ların bu yetenekleri yapay zekayı ses tanıma, bilgisayar çevirisi ve dil işleme alanlarında kullanan araştırıcılar için de çok değerli. Şimdiden, dillerin gramer yapılarının isim, sıfat, zamir gibi bileşenlerinin GAN’ların yapay sinir ağlarında ayrı yerlerde kümelendiği, yani kavramsallaştığı ortaya çıkarıldı. Bu da, örneğin bilgisayarlarlı çeviri sistemlerini hızla bir üst aşamaya taşıyabilecek.

Neyi neden ve nasıl yaptığını bilmek, işte asıl mesele!

Bütün bu buluşlar, yapay zeka temelli uzman sistemlerin en önemli sorunlarından birini de çözebilecek potansiyelde. Günümüzde bu sistemler, konusuna hakim ama çok ketum, neyi nasıl bildiğini ve yaptığını asla söylemeyen bir uzman gibiler. Peki, ya o uzman yanılırsa? Bunun neden olduğunu anlamamız olanaksız. Kim ister böyle biriyle çalışmayı? Yapay zeka sistemleri halen aynı o uzman gibi. Tıbbi bir görüntüde, örneğin bir tümörü farkedebiliyor ama bunu nasıl yaptıklarını açıkla(ya) mıyorlar. Bu da, hata yaptıklarının farkedilebilmesi ve daha da geliştirilebilmelerinin önünde önemli bir engel. Yukarıda özetlediğimiz araştırma ve bulgular bu sorunları aşmamızı sağlayarak yapay zekaya yeni bir sıçrama yaptırabilecekler.

Erdal Musoğlu / emusoglu@gmail.com

Kaynaklar
https://www.technologyreview.com/s/612746/aneural-network-can-learn-to-organize-the-world-itsees-into-conceptsjust-like-we-do/
https://www.wired.co.uk/article/artificial-intelligence-will-be-a-creative-tool
https://skymind.ai/wiki/generative-adversarial-network-gan

Bu yazı HBT'nin 149. sayısında yayınlanmıştır.