Sentetik DNA = Yeni veri merkezi

Edip Emil Öymen
Sentetik DNA = Yeni veri merkezi

Veriyi (data) kartların üzerine delikler delerek kaydetme, 1800’den beri biliniyordu.

Fransız Joseph-Marie Jacquard (1752-1834), dokuma işini otomatikleştirmek amacıyla 1801’de delikli kartonlar kullanmayı akıl etti. Zaten makineleşmeye başlamış olan tekstil üretimi, otomasyonla tanıştı. Jacquard’ın buluşu o kadar ilgi çekti ki hükümet, kendisini Paris’te Bilim ve Teknik Kurulu’na davet ederek uygulamayı göstermesini istedi.

Sonuç: 1806’da bu sistem “ülke malı” ilan edildi. “Jakarlı” sistem yerleşti. Altı yılda Fransa’da 11 bin, 1833’e kadar İngiltere’de 100 bin tezgahta kullanılıyordu.


1884’te Alman asıllı ABD’li Herman Hollerith, ilk bilgisayarın “büyük dedesinde” delikli kart kullandı. Bunun patentini 8 Ocak 1889’da aldı. Bu yıl, bilgisayarın 130’uncu yıldönümü sayılıyor. Hollerith, 1890 ABD genel sayımı sonuçlarını bu sayede hızlandırdı. Bu e-devlet (!) uygulamasıyla ABD hükümetine 5 milyon Dolar tasarruf sağladı.

1896’da kurduğu şirketinin adını 1924’te “International Business Machines”e çevirdi: IBM doğdu. Dünyada 1930’larda Amerikan IBM, Alman Zuse bilgisayarları kullanılıyordu artık. 

1948: Claude Shannon devrimi

Ama, veriyi elektronikle yeniden tanımlamak 1948’de mümkün oldu.

Amerikan Bell Laboratuvarı mühendislerinden Claude Shannon, “sıfır ve bir” rakamlarını, alfabenin bütün harfleri ve sembolleri için tanımlayan ikili (binary) sayı sistemi formülünü kurdu. Sistem 70 yıldır Shannon’ın tanımladığı şekilde çalışıyor. (Kuantum, daha farklı çalışacak)

Bugün bütün bilgisayarlardan robotlara, cep telefonundan internete kadar her türlü elektronik işlem hâlâ bu kod sistemiyle yapılıyor. İşte bu yüzden, çocukların en erken yaştan itibaren kodlama öğrenerek bilgisayar programı yazma alışkanlığı edinmesi gerektiğini savunuyor eğitimciler.

Kodlama, dünyanın ortak iletişim dili İngilizce kadar geçerli yeni bir dil artık. Bunu “yabancı dil” olarak değerlendiren küresel üniversiteler var.

0 ve 1’den oluşan alfabe

Shannon’ın formülüne göre örneğin, OKU sözcüğünü yazarken O harfi için 01001111, K harfi için 01001011, U harfi için 01010101 rakamları hepsi bitişik nizam (ara vermeden) yazılır. Bilgisayar, bu 0 ve 1’leri sekizerli gruplar halinde “okumaya” ayarlı olduğu için bu rakamları OKU diye okur.

Shannon’ın alfabesinde küçük harf için farklı, semboller için farklı diziler var. Ama hepsi sadece 0 ve 1’den oluşur. [Kuantum bilgisayarda ise “üstüne bindirme” (superposition) denilen bir yöntemle 0+1, 1+0, 1+1, 0+0 şeklinde kullanılacak. Böylece işlem hızı pek pek pek çok artacak].

Yenilikçi bellek: Sentetik DNA

Bilgisayar hızı/işlemi arttıkça, veri miktarı büyüdükçe, veriyi saklayacak daha büyük depolar (veri merkezleri) gerektikçe, bütün bu sürekli artışlar nasıl sürdürülecek?

Bu, apayrı bir konu. Ama, kapısını şöyle bir aralayıp içeri bakarsak şunu görüyoruz: Dünyada 8.4 milyon irili-ufaklı veri merkezi var. En büyük 10 tanesinin kapladığı alan 1.7 milyon metre kare.

“Bulut Bilişim” denilen şeyin, göklerde dolaşan bulutlar değil, yeryüzündeki bu veri merkezleri olduğunu da ara-not olarak buraya koyalım. Veriyi, disklerde, manyetik bantlarda saklamanın maliyeti, işletmesi arttıkça, “bu işin nereye varacağı” hep düşünülüyordu.

Bu konuda teorik fikirler tartışılırken, 2011-12 gibi, laboratuvarda üretilen sentetik DNA’nın, veri depolamada kullanılabileceği fiilen gösterildi. Ve Ar-Ge’ler birbirini kovaladı.

Sentetik DNA nasıl veri deposu olur?

İnsan, hayvan, ve pek çok organizmada “hayatı tanımlayan” DNA’da “nüklobaz” (kısaca: baz) denilen 4 kimyasal madde var: Sitosin (C harfiyle kısaltılır). Guanin (G). Adenin (A). Timin (T).

Bilimciler A için 00, C için 01, G için 10, T için 11 rakamını vererek, laboratuvar ortamında ürettikleri sentetik DNA’ya veri yüklemeyi başardılar. Ve ortaya, 1948 Shannon Modeli’nin üst-modeli çıktı. Bu tek satırlık özet, çok sayıda bilimcinin, yıllar süren sabırlı Ar-Ge çalışmasının çalakalem bir özeti.

Böylece, doğal DNA’nın çalışma ilkesinin, sentetik DNA vasıtasıyla veri depolamada kullanılabileceği anlaşıldı. Şimdilik fazlasıyla pahalı bir kimyasal işlem bu.

Bu konudaki öncü bilimcilerden George Church/Harvard, 2012’de 53 bin 400 sözcükle yazılmış bir kitabı, 11 tane JPEG resmini ve başka kayıtları “sadece” 1 milimetreküp sentetik DNA’ya kaydetti. Bu başarının anlamı çok büyük: Dünyada milyonlarca metrekareye yayılan veri merkezleri yerine, mikroskopik mekanlarda ve çok daha muazzam miktarda veri depolanabilecek.

Sentetik DNA ve veri depolama konusundaki araştırmaların hepsi birbirinden ilginç. Örneğin:

ABD/Columbia Üniversitesi’nden Yaniv Erlich ve Dina Zielinski, 1 gram sentetik DNA’ya 215 petabit veri depolamayı başardı.

[Petabit’in ne anlama geldiğine örnek: İnsan beyninin anı/veri saklama kapasitesi 2.5 petabit olarak tahmin ediliyor. Sentetik DNA’ya “şimdilik” sığdırılan 215 petabit’in kapladığı yer ise sadece 1 gram].

Bu akıl-ötesi teknoloji üretiminde maliyetler yıllar içinde düşerken, depolama kapasitesi artırılıyor. On yıla kalmaz, GAFAM (Google, Apple, Facebook, Amazon, Microsoft) şirketlerinin milyarlar harcadıkları veri merkezlerine de gerek kalmaz. Tek koşul var: Sentetik DNA’yı soğuk ortamda, karanlıkta saklamak yeterli. Doğal DNA da zaten doğada pek uzun yıllar bozulmadan kalıyor. (Moğolistan’da 700 bin yıl önceye ait at kalıntısında DNA bulunmuştu).

Sentetik DNA’nın 4 yeni bazı oldu

Bu yenilikçi gelişmelere bir üst-model yenisi daha geldi: 22 Şubat 2019’da, yani üç hafta önce açıklanan bir buluşla, Sentetik DNA’ya dört “yeni” sentetik baz eklendi. Bunlara S ve B, P ve Z2 adı verildi. Kimyasal isimleri uzun.

Buluş, Harvard ve Zürih ETH Üniversiteleri sentetik biyoloji uzmanı Steven Benner ve ekibinin çalışmalarının bir sonucu.
(doi: 10.1126/science.aat0971)

Bugüne kadar, Doğal DNA’nın dört bazı ile çalışan bilimciler, şimdi 8 bazla çalışabilecek. Böylece, sentetik DNA’nın veri depolama kapasitesi aniden iki katına çıktı. Belki de yakın gelecekte daha da fazla sentetik baz “icat etmek” mümkün olacak?

Bunun bilimsel açıklamasını Hacettepe Üniversitesi Analitik Kimya Profesörü Sema Bektaş’a sordum:

“Dr. Benner ve arkadaşları dördü doğal ve dördü doğal olmayan sekiz bazlı bir DNA oluşturuyorlar. Bu yeni sisteme Hachimoji DNA’sı adını veriyorlar (Japonca’da hachi 8, ve moji harf). Hachimoji DNA’sı doğal DNA’ya benzer, ancak nükleobazların sayısı ve türleri farklıdır. Hachimoji DNA’sında doğal bazlardan daha hidrofobik (sudan kaçan) doğal olmayan nükleobazlar kullanılmıştır. Bu doğal olmayan dört yeni baz DNA’nın sarmal yapısına uymakta ve enzimler bunları doğal bazlar kadar kolaylıkla okuyabilmekte. Böylece sekiz bazlı DNA ile genetik alfabe ikiye katlanmış oluyor. Eklenen farklı, doğal olmayan bazlarla dijital bilgilerin uzun süre saklanması sağlanabilir. Doğal DNA dışında farklı yapıdaki DNA’lar evrende başka canlıların varlığı ihtimalini akla getiriyor.”

Boya spreyinde müzik albümü

Akıl-ötesi gelişmelerin –şimdilik- son gelinen aşamasında, anlatması iyice zor bir yenilik daha var: BBC, haftalık teknoloji programı Click’te 16 Şubat’ta, Massive Attack müzik grubunun Mezzanine adlı albümünün, Sentetik DNA ile kaydedildiğini gösterdi.

https://www.youtube.com/watch?v=vjc4LIcoux4

1998’de Massive Attack, Mezzanine albümünü internetten dünyada ilk kez ücretsiz yayınlamıştı. Albümün 20’inci yıldönümünde grup, albümü (4 bazlı) sentetik DNA üzerine kaydettirdi.

DNA, “nano” boyutta 5 bin cam küre içine gömüldü. Bu cam küreler çıplak gözle görülmüyor.  Sonra bunlar, siyah sprey boyasının içine konuldu. Her sprey kutusunda en az 0.1 mikrogram Sentetik DNA var. Bu ise, albümün 1 milyon (milyon!) kopyası demek. Çünkü sadece 1 gram DNA’da 100 exabyte veri saklanabiliyor.

[Exabyte= Biraz önce adı geçen petabyte’tan bin kat daha büyük. 18 sıfırlı bir rakam. Ölçek olarak: 341 milyar adet, her biri üç dakika süren pop parçası 1 Exabyte ediyor].

Über-teknolojik bu proje için müzik grubu, sentetik biyoloji konusunda dünyanın önde gelen bilimcilerinden Zürih ETH (Einstein’in önce öğrenci, sonra 1912-14 döneminde hoca olduğu teknik üniversite) profesörü Robert Grass’ın Fonksiyonel Materyal Laboratuvarı ve üniversitenin teknoloji şirketi TurboBeads ile işbirliği yaptı.

Bu Ar-Ge projesinin maliyeti yüksek: Her megabyte’ın Sentetik DNA kopyası bin dolara mal oldu. Bütün albümün kopyalanması ise 15 bin dolara...

Ama maliyetler düşecek. Çünkü bilim ve teknoloji hiç duraklamadan ilerliyor: Bilgisayarda 1946 – 1959 döneminde işlemci olarak vakumlu tüp kullanılmıştı. Sonra silikona geçildi. Boyut küçüldü. Yakında Sentetik DNA’ya geçilecek. Boyut daha da küçülecek.

Edip Emil Öymen

*Bu yazı 08.03.2019 tarihli Dünya gazetesinde yayınlandı.

Edip Emil Öymen