
Çin’den çıkan ve az tanınan bir yapay zeka laboratuvarı, Amerika’nın en iyi modellerini geride bırakan AI sistemleri geliştirerek Silicon Valley’de paniğe yol açtı. Bu modeller, daha düşük maliyetlerle ve daha az güçlü çipler kullanılarak inşa edildi.
DeepSeek adlı laboratuvar, Aralık sonunda ücretsiz ve açık kaynaklı bir büyük dil modeli yayınladı. Şirket, bu modelin yalnızca iki ay ve 6 milyon dolardan az bir bütçeyle, Nvidia’nın düşük kapasiteli H800 çiplerini kullanarak geliştirildiğini açıkladı.
Bu gelişmeler, Amerika’nın yapay zekadaki küresel liderliğinin sarsılıp sarsılmadığına dair endişeleri artırırken, büyük teknoloji şirketlerinin AI modelleri ve veri merkezleri için yaptığı devasa harcamaları da sorgulanır hale getirdi.
Üçüncü Taraf Testlerde Üstün Performans
Bağımsız benchmark testlerinde, DeepSeek’in modeli; karmaşık problem çözmeden matematik ve kodlamaya kadar çeşitli alanlarda Meta’nın Llama 3.1’ini, OpenAI’nın GPT-4o’sunu ve Anthropic’in Claude Sonnet 3.5’ini doğruluk açısından geride bıraktı.
DeepSeek, Pazartesi günü yayınladığı r1 adlı bir “akıl yürütme modeli” ile OpenAI’nın en yeni o1 modelini de birçok testte geride bıraktı.
Microsoft CEO’su Uyardı
Microsoft CEO’su Satya Nadella, İsviçre’nin Davos kentindeki Dünya Ekonomik Forumu’nda yaptığı açıklamada, “DeepSeek’in yeni modeli, hem açık kaynaklı bir model olarak etkili çıkarım hesaplaması yapması hem de işlem verimliliği açısından son derece etkileyici. Çin’deki gelişmeleri çok ciddiye almalıyız” dedi.
Yarı İletken Kısıtlamalarına Rağmen Başarı
DeepSeek, ABD’nin Çin’e uyguladığı ve en güçlü çiplerin (örneğin Nvidia H100) satışını engelleyen yarı iletken kısıtlamalarını da aşmak zorunda kaldı. Son gelişmeler DeepSeek’in ya kuralları aşmanın bir yolunu bulduğunu ya da ihracat kontrollerinin Washington’un amaçladığı gibi bir engel olmadığını gösteriyor.
“Damıtma Süreciyle Verimlilik Sağladılar”
Yatırım firması Benchmark’ın Genel Ortağı Chetan Puttagunta, “Büyük bir modeli alıp, küçük bir modelin belirli bir alanda uzmanlaşmasını sağlayan damıtma sürecini kullanıyorlar. Bu son derece maliyet etkili bir yöntem” diye açıkladı.
Gizemli Bir Laboratuvar
Medya raporlarına göre, 8 milyar dolarlık bir varlık yönetim şirketi olan High-Flyer Quant’tan doğan DeepSeek ve kurucusu Liang WenFeng hakkında çok az şey biliniyor.
Çin’den Diğer Hamleler
Önde gelen yapay zeka araştırmacısı Kai-Fu Lee, 01.ai adlı startup’ının sadece 3 milyon dolar kullanılarak eğitildiğini söyledi. TikTok’un ana şirketi ByteDance Çarşamba günü, önemli bir kıyaslama testinde OpenAI’nin o1’inden daha iyi performans gösterdiğini iddia eden modelinde bir güncelleme yayınladı.
Perplexity CEO’su Aravind Srinivas ise durumu şöyle özetledi:
“Zorunluluk icadın anasıdır. Kısıtlamalara çözüm bulmak zorunda kaldıkları için, aslında çok daha verimli bir şey inşa ettiler.”