Politik Konuşma Metinleri Yazabilen Yapay Zeka Algoritması

John F. Kennedy’nin bir sözü: “Ülkenizin sizin için ne yapabileceğini değil, sizin ülkeniz için ne yapabileceğinizi sorgulayın.”

Politikacıların beyanatlarına baktığımızda, yukarıdaki gibi anlamlı ve etkileyici olanların sayısı pek az olduğunu görürüz.

Öte yandan meclis konuşmaları gibi sıradan olanların sayısı fazladır ve birbirine çok benzerler. Bu tip konuşmalar genellikle standart kalıplar kullanır, benzer iddiaları tekrar eder ve hatta bir görüşü dile getirmek için aynı ifadeleri kullanırlar. Öyle ki altında belli bir algoritmanın yattığı söylenebilir.

İşte bu durum ilginç bir soruyu getiriyor: bu tip politik konuşmaların bir makine tarafından yazılması mümkün mü?

Massachusetts Üniversitesinden Valentin Kassarnig sayesinde bugün bu soruya bir yanıt bulabiliyoruz. Kassarnig, gerçek politik konuşmalara benzer metinler yazabilen bir yapay zekaya makine yarattı.

Kassarnig, 53 adet meclis oturumundan, sayısı toplamda 4000’e yaklaşan politik konuşmayı barındıran bir veritabanı kullanıyor. Bu sayede, bir öğrenen makine algoritmasını eğitebiliyor ve kendi metinlerini yazmasını sağlayabiliyor.

Bu metinler, her biri ortalama 23 kelimeden oluşan toplam 50.000 cümleden oluşuyor. Ayrıca bazı sınıflandırmalara tabi tutulmuş durumdalar: örneğin demokrat parti veya cumhuriyetçi partininkiler ayrı kategorilerde yer alıyorlar. Belirli bir konuyu destekleme veya karşı çıkma durumu da bir başka sınıflandırma örneği.

Elbette veritabanının analiz yöntemi esas belirleyici faktör oluyor. Kassarnig, bazı teknikleri denedikten sonra “n-gram” olarak adlandırılan modelde karar kılmış. Bu teknik, “n” adet kelime veya tümcenin ardışıklık durumunu inceliyor. Yani özü itibari ile seçilen ketegori için, en sık kullanılan sözcükleri yakalamaya çalışıyor.

Veritabanında bulunan gerçek konuşma metinleri, kelime veya tümce bazında analiz ediyor ve her bir sözcüğün  veya tümcenin rolü belirliyor (isim, fiil, sıfat gibi). Daha sonra spesifik bir sözcüğün, kendinden önceki 5 sözcükle bir grup halinde bulunma olasılığını ele alıyor.  Metnin başından sonuna kadar devam ettirilince, metinin tamamı ortaya çıkıyor. Sonuçlar oldukça etkileyici olabiliyor.

Bu algoritmanın başka kullanım alanları da olabilir. Örneğin belli olaya ilişkin haber metinleri oluşturulabilir. Hangi alanda olursa olsun, gerçek bir insan tarafından yazılmış gibi sunulması gibi etik olmayan kullanımlar ihtimalini de barındırıyor.

Algoritmanın kaynak kodu, Github’da ücretsiz olarak bulunabiliyor. Kassarnig: “Herkesi algoritmayı kullanmaya, uyarlamaya ve geliştirmeye davet ediyoruz. Yeni fikirler ve değerlendirmelere açığız.” diyor.

Türkiye gibi yıllardır kısır politik tartışmaların yaşandığı ülkemizde de bu algoritmanın maalesef iyi çalışabileceğini düşünüyoruz.

Etiketler