DeepSeek ve açık kaynak modeller yapay zeka dünyasını nasıl sarsıyor?
Teknoloji şirketleri ve akademisyenler, uzun zamandır açık kaynak yazılım geliştirmenin riskleri ve faydaları üzerine kafa yoruyor. Ancak üretken yapay zeka etrafında yaşanan çılgınlık, bu tartışmaya yeni bir boyut kazandırdı.
Teknoloji şirketleri ve akademisyenler, uzun zamandır açık kaynak yazılım geliştirmenin riskleri ve faydaları üzerine kafa yoruyor. Ancak üretken yapay zeka etrafında yaşanan çılgınlık, bu tartışmaya yeni bir boyut kazandırdı.
DeepSeek ve diğer Çinli şirketler, önde gelen Amerikalı yapay zeka geliştiricilerinin yazılımlarına rakip, düşük maliyetli açık kaynak modelleri piyasaya sürdü. Buna karşılık olarak, önde gelen bir Amerikan yapay zeka şirketi olan OpenAI, altı yıl sonra ilk kez yeni bir açık model yayımladı. ABD’deki Donald Trump yönetimi ise daha fazla Amerikan teknoloji şirketine aynısını yapmaları çağrısında bulundu. İşte bilinmesi gerekenler:
Açık kaynak nedir?
Genel olarak, açık kaynak; kaynak kodu herkesin kullanımına veya değiştirmesine açık olan yazılımları ifade eder. Bu çalışma yönteminin faydalarını savunan, Kaliforniya merkezli kar amacı gütmeyen bir kuruluş olan Open Source Initiative’e (OSI) göre bir yazılımın açık kaynak olarak nitelendirilebilmesi için dağıtım ve erişim konusunda belirli koşullara uyması gerekir.
Bir yapay zeka modelinin gerçekten açık olarak kabul edilebilmesi için OSI’ye göre geliştiricilerin modelin eğitildiği veriler hakkında ayrıntılı bilgi sunması ve insanların bu sistemi herhangi bir amaç için inceleyebilmesine, kullanabilmesine ve değiştirebilmesine imkan tanıması gerekir. Buna karşılık kapalı kaynak, geliştiricinin kontrolünde olan, değiştirilemeyen ve teknik yapısı konusunda daha az şeffaflık sunan yazılım ve modelleri ifade eder.
Herhangi bir önde gelen yapay zeka geliştiricisi açık kaynak yazılım sunuyor mu?
Birçok teknoloji şirketi yapay zeka yazılımlarını açık kaynak olarak tanımlıyor ancak herkes bu tanımın gerçekten karşılandığı konusunda hemfikir değil. Meta Platforms Fransız girişim Mistral ve şimdi de DeepSeek, açık kaynak olarak tanımladıkları yapay zeka modellerini piyasaya sürdü. Ancak bu modellerin çoğu aslında “açık ağırlıklı modeller” olarak biliniyor. Bu modelin ve belki bazı kaynak kodlarının sunulmasının yanı sıra, geliştiricilerin modeli daha iyi özelleştirebilmelerine olanak tanıyan ağırlıkların paylaşılması anlamına geliyor. Ancak genellikle modelin eğitildiği veriler hakkında ayrıntılar sunulmuyor.
Örneğin Meta, Llama adlı yapay zeka modelleri serisi için bazı kaynak kodları sunuyor ancak eğitim verileri hakkında ayrıntılı bilgi sağlamıyor. Ayrıca Meta, OSI tarafından daha önce ticari kullanımlara yönelik bazı kısıtlamalar içeren lisanslama koşulları nedeniyle eleştirilmişti. Benzer şekilde DeepSeek, ocak ayında en yeni sistemi olan R1’i açık kaynak model olarak yayımladığını söyledi ancak kod ya da eğitim verisi sunmadı. Bu da şirketin modelini tam olarak neyle inşa ettiği konusunda soru işaretlerine yol açtı. Adında 'açık' ifadesi geçmesine rağmen, OpenAI modellerinin çoğunu açık kaynak yapmıyor. Ancak DeepSeek’in viral başarısının ardından, OpenAI CEO’su Sam Altman, ChatGPT geliştiricisinin “farklı bir açık kaynak stratejisi” geliştirmesi gerektiğini kabul etti. Şöyle ekledi: Bence şahsen burada tarihin yanlış tarafında kaldık.