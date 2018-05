Columbia Mühendislik’ten bilgisayar bilimcileri, düz metin dosyalarının içine enformasyon gizlemek için yeni bir yöntem geliştirdiklerini duyurdu. Times New Roman veya Helvetica gibi yazı tiplerinin harflerinin şeklinde gözle algılanamayacak kadar ufak değişiklikler yapılmasına dayanan bu yeni teknikle, şifrelenmiş bir mesajı çözmek için akıllı telefona yüklenebilen bir uygulama kullanmak yeterli oluyor. Yazılım, her harfin 52 değişik versiyonunu oluşturabiliyor.

Chang Xiao, Cheng Zhang, Changxi Zheng isimli 3 araştırmacıdan oluşan ekip, 'FontCode' (Yazı Tipi Kodu) ismini verdikleri tekniği, arXiv sitesinde yayımladıkları makalede şu şekilde anlatıyor: “Metin dosyaları için bir enformasyon gömme tekniği olan FontCode’u sunuyoruz. Belirli yazı tipleri ile yazılmış bir metin belgesi verildiğinde, yöntemimiz metin içeriğini değiştirmeden, metni oluşturan karakterlerin oyuntularında hafif değişimler yaparak, kullanıcının belirlediği bilgiyi gömebiliyor.

Bir yazı tipi dağıtıcısı üzerindeki her bir karakterin oyuntularını sürekli olarak değiştiren, daha önceden geliştirilmiş üretken bir modeli güçlendirerek, göze çarpmayan ama makine tarafından tanınabilir oyuntu değişimleri seçmek için bir algoritma geliştirdik. Ardından, kullanıcı tarafından verilen bir iletiyi metin belgesine gömen ve başlangıçtaki belgeden çok az değişik görünümde bir belge üreten bir algoritma ekledik. Ayrıca, vektör grafiği ya da piksel görüntüsü veya hatta basılı kağıt şeklinde saklanmış durumdaki kod içeren bir belgede gömülü olan bilgiyi yeniden oluşturabilen bir oyuntu tanıma yöntemi sunduk. Bunlara ek olarak, çok sayıda tanıma hatasını düzeltebilen yeni bir hata düzeltme kodlama şeması da sunduk. Son olarak, metin dosyası metadata saklayıcı, göze çarpmayan optik barkod, şifreli ileti gömme şeması ve metin belgesi imzası için kullanılabilecek olan tekniğimizin geniş bir uygulama alanı olduğunu gösterdik.”

Changxi Zheng, FontCode‘un gizli mesaj gönderme maksatlı kullanımın yanında, şirketlerin işine yarayabilecek uygulamalarının da önemini belirtiyor: Belgelerin görüntüsü bozulmadan kullanım haklarının korunmasını, QR kodu ya da farklı metadata çeşitlerinin gömülmesini sağlıyor. Bu teknikte bir metin belgesine gizlenebilecek veri miktarı, belgedeki metnin uzunluğuna bağlı oluyor. Çoğu yazı tipi ile kullanılabiliyor ve öteki belgeye veri gizleme yöntemlerinden farklı olarak çoğu belge tipi ile kullanılabiliyor. Üstelik belgenin dosya türü değiştirilse veya çıktısı alınsa dahi gizli ileti kaybedilmiyor. Ama şayet şifreli metni bir editörde açıp kopyalarak, farklı bir metin editörü penceresine yapıştırırsanız, iletiyi kaybediyorsunuz.

Program gizlenecek mesajı bir bit dizisine çevirdikten sonra, bir tamsayı dizisine çeviriyor. Her bir tamsayı, normal metindeki beş harflik bir bloğa atanıyor.

FontCode‘u kullanarak veri gömmek için gizli bir mesaj ve bir taşıyıcı belge sunuyorsunuz. Program saklanacak mesajı 0 ve 1’lerden meydana gelen bir bit dizisine (ASCII veya Unicode) çevirdikten sonra, bir tamsayı dizisine çeviriyor. Her bir tamsayı, normal metindeki beş harflik bir bloğa atanıyor. Ardından normal metindeki her bir harfin yerine, kod kitabındaki değiştirilmiş hâli yerleştiriliyor. Her beşlideki değiştirilmiş hâldeki harflerin kod kitabındaki konum numaralarının toplamı, o beşliye atanmış olan tamsayı ediyor.

Gizli iletiyi açığa çıkarmak içinse işlem tersinden yapılıyor. Dijital bir dosyadan ya da akıllı telefonla çekilmiş bir fotoğraftan, FontCode harfleri orijinalleriyle karşılaştırarak değiştirilmiş harfleri tespit ediyor ve kod kitabından iletiyi oluşturuyor.

Karşılaştırma, evrişimli sinirsel ağlar (İng. convolutional neural networks – CNN) kullanılarak yapılıyor. Vektör çizimli (PDF biçiminde kaydedilenler veya Illustrator gibi programlarla hazırlananlar gibi olan) yazı tiplerinde söz konusu belirleme işlemi kolay, zira biçim ve yol tanımları bilgisayar tarafından okunabilir oluyor. Fakat PNG, IMG gibi pikselli yazı tiplerinde iş o denli basit değil. Aydınlatma farkı, farklı kamera açıları, gürültü ve netlikteki bozukluklar dolayısıyla karşılaştırma ve oyuntusu farklı olanları saptama işlemi zorlaşıyor.

'Hello World' iletisinin 'Bilbo was very rich…' diye başlayan metnin içine gizlenme ve gizli metnin tekrar oluşturulma sürecini gösteren şema.

Ekip bu zorluğu aşabilme adına 1700 senelik Çinli Kalan Teoremi‘nden faydalandıklarını ifade ediyor. Söz konusu teorem, bilinmeyen bir sayının, birkaç farklı bölenle bölümünden kalan sayılara bakarak bulunmasını sağlar. Efsaneye göre eski bir Çin hükümdarı, ordusundaki asker sayısını bulmak için bütün orduyu önce 3 kişilik, sonra 5 kişilik, akabinde de 7 kişilik gruplara ayırır ve her defasında grup dışı kalan asker sayısına bakarmış. Buna göre de, ordudaki toplam asker sayısını hesaplarmış. Zheng, FontCode için bu teoremden nasıl yararlandıklarını şu şekilde açıklıyor: “Üç tane bilinmeyen değişken olsun. Üç tane lineer eşitlik ile bunların üçünü de bulabilmeniz gerekir. Eğer eşitlik sayısını üçten beşe çıkarırsanız, bu beş eşitlikten herhangi üçünü bildiğiniz sürece, üç bilinmeyeni yine bulursunuz.”

Çinli Kalan Teoremi’ni kullanarak, harflerdeki değişikliklerin %25’i tanınamasa dahi mesajların tekrar oluşturulabileceğini araştırmacılar gösterdi.