Bilgisayarla görme tarihi – 2

Lale Akarun
Bilgisayarla görme tarihi – 2

Geçen haftaki yazımda, bilgisayarla görmenin gerçek anlamda, 1980’lerde başladığını, benim de o dönem öğrenci olarak bilgisayarla görme dersi aldığımı söylemiştim. 1980’lerde, ancak basılı harflerin tanınması ve basit kalite kontrolü problemleri çözülebiliyordu.

El yazısı harflerin tanınması ve genel olarak dökümanların sayısallaştırılması problemleri, 90’larda çözüldü ve yavaş yavaş bu işleri yapan yazılım ürünleri ortaya çıktı. Aynı dönemlerde, parmak izi tanıma, yüz tanıma gibi biyometri ürünleri de ortaya çıktı. 90’ların sonuna gelindiğinde, bilgisayarla görme, bilim kurgunun konusu olmaktan çıkıp hayata geçmeye başlamıştı. Ben de bu dönemde öğretim üyesi olarak bu alanda çalışmaya başladım.

1990’lar bir bakıma yakın, bir bakıma da çok uzak bir tarih. Çocuklarımız için milattan önce; bizim için yakın. Aslında ne kadar uzak olduğunu anlamak için, o dönem hangi teknolojilerin ortaya çıktığını hatırlamak lazım. 1990’da cep telefonu yoktu. Türkiye’de 1993 yılında İnternet hayatımıza girdi. Ancak aklınıza şimdiki gibi bir şey gelmesin: www dediğimiz teknolojiyi kullanmaya başlamamız yıllar aldı. 1996’da ilk web sayfamdaki resmin yüklenmesi bir dakikaya yakın sürüyordu. 1990’larda dijital imgeler ve videolar yaygın değildi: Evimizde analog televizyon seyrediyorduk; BETA ve VHS teknolojisi ile analog video kaydediyorduk; fotoğraflarımızı analog filme çekip, fotoğraf kağıdına bastırıyorduk. Dijital teknolojiler olan VCD ve DVD, ancak 90’ların sonlarında hayatımıza girdi.


İlk proje yüz tanıma

İlk bilgisayarla görme projemiz, yüz tanıma üzerineydi: Bunun için bölümdeki öğrencileri denek olarak kullandık. Veri tabanımızın adı, bölümde bu konuda çalışan asistanımızın adı olan ESRA’ydı. Bilgisayarla görme için ilk adım, görüntülerin bilgisayarlara aktarılmasıdır. Bunun için bir kamera gerekir. O dönem kameralar, analogdu. Analog görüntüleri kaydedip dijitalleştirebilen, bilgisayara aktarabilen kameralar çok pahalıydı; o dönem fiyatları yüzbinlerce dolardı. Yani şu anda akıllı telefonlarımızın kolayca yaptığı fotoğraf çekip paylaşma işini yapmak kolay değildi. Böyle bir kameraya ulaşıp ödünç alıp bu işi başardığımızda ilk yüz tanıma projesine başlayabilir duruma gelmiştik.

1980’lerde kişisel bilgisayar ana bellekleri kilobayt, yani binlerce bayt ile ölçülüyordu; dolayısıyla bir resmin hepsi belleğe sığmıyordu. 1990’ların sonuna gelindiğinde ise, bilgisayar ana bellekleri Megabayt, yani milyonlarca bayt ile ölçülüyordu; dolayısıyla bir imge değil, onlarca, hatta yüzlerce imge belleğe sığıyordu. Bizim imge sayımız da zaten o kadardı. Yani bellek kapasitesi sınırlayıcı olmaktan çıkmıştı.

Sorunlar... sorunlar...

Yüz tanıma için kullanılan yöntemler kolay hesaplamaya dayalı yöntemlerdi. Dalgacık dönüşümü, 20. yüzyılın en önemli buluşları arasına girip, imgelerin sıkıştırılmasında büyük yarar sağlamıştı; ancak hesaplanması yavaş ve zordu. 90’larda yüz bulma için kullanılan Haar dalgacıkları, çarpma olmadan, toplama ve çıkarmayla hesaplanabilen bir yöntem olarak, hızla hesap- lanabiliyordu. İmgelerde değişken alanların toplamlarının önceden hesaplanmış toplamları kullanarak hızla hesaplanabilmesini sağlayan integral imgeleri, yöntemin gerçek zamanlı uygulanabilmesini sağlıyordu. Aynı şekilde, yüz tanıma için o dönem popüler olan özyüz yönteminin en büyük yeniliği, hızlı hesaplamaya dayalı yeni bir yöntemdi.

Demek ki 90’ların sonunda, yapay görme problemi, bellek tarafından sınırlanan bir problem olmaktan çıkıp, hesaplama tarafından sınırlanan bir probleme dönüşmüştü: Yüksek hesaplama gerektiren işleri nasıl daha hızlı yaparız?

Bilgisayarlarda hesaplama, merkezi hesaplama birimi (CPU) denen yongalarca yapılır. 1980’lerden 1990’ların sonuna dek, bir yongaya sığan transistör sayısı, her iki yılda ikiye katlanarak, bellek kapasiteleri artarken, bir CPU’ya sığan hesaplama birimi sayısı da artmaya başlamıştı. Öte yandan, 1999yılı, Nvidia firmasının, GeForce Grafik Hesaplama Ünitesinin (GPU) çıktığı yıl olarak, hesaplamada yeni bir devrin başladığını müjdeliyordu.

Lale Akarun

*Bu yazı, HBT Dergi 384. sayıda yayınlanmıştır.

Lale Akarun