OpenAI önemli bir dönüm noktasının eşiğindeydi. Girişim, ChatGPT’nin arkasındaki teknolojinin önceki sürümlerini önemli ölçüde aşacağını ve insanları geride bırakan güçlü yapay zeka hedefine yaklaşacağını umduğu devasa yeni bir yapay zeka modeli için geçen Eylül ayında ilk eğitim turunu tamamladı.
Ancak şirket içinde Orion olarak bilinen model, şirket işlerini görüşmek üzere anonimlik şartıyla konuşan, konuya aşina iki kişiye göre şirketin arzu edilen performansını sağlamadı. Kaynaklar, örneğin yaz sonundan itibaren Orion’un eğitim almadığı programlama sorularını yanıtlamakta başarısız olduğunu söyledi. Kaynaklar, genel olarak Orion’un, başlangıçta şirketin ana sohbet robotunu çalıştıran sistem olan GPT-3.5’ten GPT-4 gibi mevcut OpenAI modellerinden ileriye doğru büyük bir adım olarak görülmediğini söyledi.
Son zamanlarda yanlış adımlarla karşılaşan tek şirket OpenAI değil. Yıllarca baş döndürücü bir hızla son teknoloji ürünü yapay zeka ürünlerini piyasaya sürdükten sonra, önde gelen üç yapay zeka şirketi artık daha yeni modeller oluşturmaya yönelik maliyetli çabalarının getirilerinin azaldığını görüyor. Konuya aşina üç kişiye göre, Alphabet Inc.’in Google’ında Gemini yazılımının yakında çıkacak sürümü şirket içi beklentilerin gerisinde kalıyor. Bu arada Anthropic, Claude’un uzun zamandır beklenen 3.5 Opus adlı modelinin çıkış programında bir gecikme gördü.
Şirketler birçok zorlukla karşı karşıyadır. Daha gelişmiş yapay zeka sistemleri oluşturmak için kullanılabilecek, insan tarafından üretilen yüksek kaliteli eğitim verilerinin yeni, kullanılmamış kaynaklarını bulmak giderek zorlaşıyor. İki kişi, Orion’un yetersiz şifreleme performansının kısmen eğitim için yeterli şifreleme verisinin bulunmamasından kaynaklandığını söyledi. Aynı zamanda, en küçük iyileştirmeler bile yeni modellerin oluşturulması ve çalıştırılmasıyla ilgili muazzam maliyetleri haklı çıkarmak veya ürünü büyük bir yükseltme olarak markalamanın getirdiği beklentileri karşılamak için yeterli olmayabilir.
Bu modelleri geliştirmek için çok fazla potansiyel var. Kaynaklardan birine göre OpenAI, Orion’u genellikle eğitim sonrası olarak adlandırılan aylarca süren bir süreçten geçirdi. Bir şirketin yeni bir yapay zeka programını halka açık bir şekilde başlatmasından önce rutin olan bu prosedür, diğer şeylerin yanı sıra yanıtları iyileştirmek ve modelin kullanıcılarla etkileşim kurma biçimini iyileştirmek için insan geri bildirimlerinin dahil edilmesini içerir. Ancak kaynaklardan biri, Orion’un hala OpenAI’nin kullanıcılara sunulmasını istediği seviyede olmadığını ve şirketin sistemi önümüzdeki yılın başlarına kadar piyasaya sürmesinin pek mümkün olmadığını söyledi.
Bu sorunlar, özellikle OpenAI’nin iki yıl önce ChatGPT’yi başlatmasından bu yana Silikon Vadisi’nde hakim olan ortodoks inanışa meydan okuyor. Teknoloji endüstrisinin büyük bir kısmı, daha fazla bilgi işlem gücünün, daha büyük verilerin ve modellerin kaçınılmaz olarak yapay zeka gücünde daha da büyük sıçramaların önünü açacağını söyleyen ölçeklendirme yasalarına güveniyor.
Son zamanlardaki aksilikler, yapay zekaya yapılan büyük yatırım ve bu şirketlerin yapay genel zeka alanında agresif bir şekilde takip ettiği kapsayıcı bir hedefe ulaşmanın fizibilitesine ilişkin şüpheleri de artırıyor. Bu terim genellikle birçok entelektüel görevde insanlarla yarışabilecek veya onları aşabilecek varsayımsal yapay zeka sistemlerini ifade eder. OpenAI ve Anthropic’in CEO’ları daha önce yapay genel zekanın sadece birkaç yıl uzakta olabileceğini söylemişti.
Yapay zeka girişimi Hugging Face’in baş etik uzmanı Margaret Mitchell, “YGZ balonu biraz patlıyor” dedi. Yapay zeka modellerinin çeşitli görevlerde iyi performans göstermesini sağlamak için “farklı eğitim yöntemlerine” ihtiyaç duyulabileceğinin açıkça ortaya çıktığını söyledi; bu fikir, birçok yapay zeka uzmanının Bloomberg News’te de dile getirdiği bir fikir.
Bir Google DeepMind sözcüsü yaptığı açıklamada, şirketin “Gemini’de gördüğümüz ilerlemeden heyecan duyduğunu ve hazır olduğumuzda daha fazlasını paylaşacağız” dedi. OpenAI yorum yapmayı reddetti. Anthropic yorum yapmayı reddetti ancak Bloomberg News’e CEO Dario Amodei’nin Pazartesi günü yayınlanan beş saatlik bir podcast’ine atıfta bulundu.
Podcast’te “İnsanlar bunlara ölçeklendirme yasaları diyor. Bu yanlış bir isim” dedi. “Bunlar evrenin yasaları değil. Bunlar ampirik düzenlilikler. Devam etmelerinden yana bahse girerim ama bundan pek emin değilim.”
Amodei, önümüzdeki birkaç yıl içinde daha güçlü yapay zekaya ulaşma sürecini “raydan çıkarabilecek” “verilerimizin tükenmesi” olasılığı da dahil olmak üzere “pek çok şeyin” olduğunu söyledi. Ancak Amodei, yapay zeka şirketlerinin her türlü engeli aşmanın bir yolunu bulacağı konusunda iyimser olduğunu söyledi.
Yayla performansı
ChatGPT’yi ve yapay zekaya rakip olan bir dizi sohbet robotunu destekleyen teknoloji, çok sayıda sosyal medya gönderisi, çevrimiçi yorum, kitap ve web’den ücretsiz olarak elde edilen diğer veriler üzerine inşa edilmiştir. Bu, akıllı makaleler ve şiirler yayınlayabilecek ürünler yaratmak için yeterliydi, ancak bazı şirketlerin yapmayı umduğu gibi, Nobel ödüllü bir kişiden daha akıllı yapay zeka sistemleri oluşturmak, Wikipedia gönderileri ve YouTube ek açıklamaları dışında veri kaynakları gerektirebilir.
Özellikle OpenAI, yüksek kaliteli verilere olan ihtiyacın bir kısmını karşılamak ve üretken AI ürünleri oluşturmak için kullanılan veriler üzerinde yayıncıların ve sanatçıların artan yasal baskısına uyum sağlamak için yayıncılarla anlaşmalar yaptı. Bazı teknoloji şirketleri, matematik ve programlama gibi konu uzmanlıklarıyla ilgili verileri ayrıştırabilen ileri dereceli kişileri de işe alıyor. Amaç, bu sistemlerin belirli konulardaki sorgulara yanıt verme yeteneğini geliştirmektir.
Bu çabalar, web kazımaktan daha yavaş ve daha pahalıdır. Teknoloji şirketleri aynı zamanda bilgisayar tarafından oluşturulan görseller veya gerçek insanlar tarafından oluşturulan içeriği taklit etmesi amaçlanan metinler gibi sentetik verilere de yöneliyor. Ancak burada da sınırlar var.
New Enterprise Associates yapay zeka stratejisi başkanı ve Microsoft’un teknolojiden sorumlu eski başkan yardımcısı Leila Tretikov, “Bu, nicelikten çok verinin kalitesi ve çeşitliliğiyle ilgili” dedi. “Niteliği sentetik olarak üretebiliyoruz ancak özellikle dil söz konusu olduğunda, insan rehberliği olmadan benzersiz, yüksek kaliteli veri kümeleri elde etmekte zorlanıyoruz.”
Ancak yapay zeka şirketleri “daha fazlası daha iyidir” ilkesini takip etmeye devam ediyor. İnsan düzeyinde zekaya yaklaşan ürünler geliştirme arayışlarında teknoloji şirketleri, yeni modelleri eğitmek için kullandıkları bilgi işlem gücünü, verileri ve zamanı artırıyor; bu da süreçteki maliyetleri artırıyor. Amodei, şirketlerin bu yıl gelişmiş bir model yetiştirmek için 100 milyon dolar harcayacağını, önümüzdeki yıllarda bu miktarın 100 milyar dolara ulaşacağını söyledi.
Maliyetler arttıkça, geliştirilmekte olan her yeni modelin riskleri ve beklentileri de artıyor. Waltham, Massachusetts’teki Bentley Üniversitesi’nde matematik alanında yardımcı doçent olan Noah Giansiracusa, AI modellerinin gelişmeye devam edeceğini, ancak bunun gerçekleşme oranının şüpheli olduğunu söyledi.
“Kısa bir dönemde çok hızlı ilerleme kaydedilmesi bizi çok heyecanlandırdı” dedi. “Bu sürdürülebilir değildi.”
Silikon Vadisi’nin ikilemi
Bu ikilem son aylarda Silikon Vadisi’nde belirginleşti. Mart ayında Anthropic, üç yeni modelden oluşan bir dizi yayınladı ve Claude Opus adı verilen en güçlü seçeneğin, lisansüstü düzeyde akıl yürütme ve programlama gibi önemli kıyaslamalarda OpenAI’nin GPT-4 ve Google’ın Gemini sistemlerinden daha iyi performans gösterdiğini söyledi.
Önümüzdeki birkaç ay içinde Anthropic, Opus’a değil, diğer iki Claude modeline güncellemeler sundu. Bağımsız yapay zeka araştırmacısı Simon Willison, “Herkesin heyecanlandığı şey buydu” dedi. Ekim ayına gelindiğinde, Willison ve diğer sektör gözlemcileri, 3.5 Opus ile ilgili ifadelerin, “bu yılın sonlarında” geleceği ve “yakında geleceği” ifadelerinin de dahil olduğu ifadelerin şirketin web sitesindeki bazı sayfalardan kaldırıldığını fark ettiler.
Konuya aşina iki kişiye göre, rakipleri gibi Anthropic de 3.5 Opus’u geliştirirken perde arkasında zorluklarla karşılaştı. Bir kişi, Anthropic’in eğitim sonrasında 3.5 Opus’un değerlendirmelerde eski sürüme göre daha iyi performans gösterdiğini ancak modelin boyutu ve inşa edilmesi ve çalıştırılmasının ne kadar pahalı olduğu göz önüne alındığında olması gerektiği kadar olmadığını bulduğunu söyledi.
Antropik bir sözcü, Opus’la ilgili dilin, yalnızca mevcut, ölçülmüş modelleri göstermeye yönelik bir pazarlama kararının parçası olarak web sitesinden kaldırıldığını söyledi. Opus 3.5’in bu yıl da yayınlanıp yayınlanmayacağı sorulduğunda sözcü, Amodei’nin sesli açıklamalarına dikkat çekti. Röportajda CEO, Anthropic’in hala modeli piyasaya sürmeyi planladığını ancak bir zaman çizelgesi taahhüt etmeyi defalarca reddettiğini söyledi.
Teknoloji şirketleri ayrıca, eski yapay zeka modellerini, belki bazı artımlı iyileştirmelerle sunmaya devam edip etmeyecekleri, yoksa çok daha iyi performans göstermeyebilecek pahalı yeni sürümleri desteklemenin maliyetlerini üstlenip üstlenmeyecekleri konusunda da boğuşmaya başlıyorlar.
Google, amiral gemisi yapay zeka modeli Gemini’yi daha kullanışlı hale getirmek için, insan fotoğrafları oluşturma yeteneğinin geri getirilmesi de dahil olmak üzere güncellemeler yayınladı, ancak temel modelin kalitesinde birkaç büyük atılım sağladı. Bu arada OpenAI, bu yıl, kullanıcıların ChatGPT ile daha akıcı konuşmalar yapmasına olanak tanıyan sesli asistan özelliğinin yeni bir sürümü gibi bir dizi nispeten artan güncellemeye odaklandı.
Son zamanlarda OpenAI, şirketin buluşsal yöntem olarak adlandırdığı bir süreç olan, bir sorguya yanıt vermeden önce yanıtı hesaplamak için fazladan zaman harcayan o1 adlı bir modelin önizleme sürümünü kullanıma sundu. Google, daha karmaşık sorguları ele almayı ve zaman içinde daha iyi yanıtlar almayı amaçlayan benzer bir yaklaşım üzerinde çalışıyor.
Teknoloji şirketleri ayrıca, istedikleri bilgi işlem kaynaklarının çoğunu, çok daha iyi olmayabilecek daha büyük modeller geliştirmeye ve çalıştırmaya yönlendirerek anlamlı ödünleşmelerle karşı karşıya kalıyor.
OpenAI CEO’su Sam Altman, Reddit’te yakın zamanda gerçekleşen Bana Her Şeyi Sor oturumu hakkındaki bir soruya yanıt olarak, “Bu modellerin tümü çok karmaşık hale geldi ve istediğimiz kadar çok şeyi paralel olarak gönderemiyoruz” diye yazdı. ChatGPT’nin yapımcısının, mevcut bilgi işlem gücüyle ne yapacağına nasıl karar vereceği konusunda “birçok kısıtlama ve zor kararlarla” karşı karşıya olduğunu söyledi.
Altman, OpenAI’nin bu yılın sonlarında bazı “çok iyi sürümler” çıkaracağını, ancak bu listenin GPT-5’i içermeyeceğini söyledi; bu, yapay zeka endüstrisindeki birçok kişinin şirketin GPT-4’ten sonraki büyük bir sürüm için kullanmasını beklediği bir isim. 18 ay önce açıklandı.
Google ve Anthropic gibi, OpenAI de artık dikkati bu modellerin ölçeğinden, kullanıcı adına uçuş rezervasyonu yapabilen veya e-posta gönderebilen aracılar adı verilen bir dizi yapay zeka aracı dahil olmak üzere daha yeni kullanım örneklerine kaydırıyor. Altman Reddit’te “Daha iyi modellere sahip olacağız” diye yazdı. “Fakat bir sonraki dev atılımın müşteriler olacağını düşünüyorum.”
(Bu hikaye NDTV personeli tarafından düzenlenmemiştir ve ortak yayından otomatik olarak oluşturulmuştur.)
- Bengal, Rabindrasangeet yerine bomba sesini duyuyor: Kalküta’da Amit Shah
- Trudeau hükümeti Hindistan’ın ‘elektronik düşman’ olduğunu söylüyor ve Yeni Delhi iddiaları yerle bir ediyor
- Manipur’da bir kadının tecavüze uğrayıp öldürülmesinden bir gün sonra bugün başka bir kadın vurularak öldürüldü
- Donald Trump’ın zaferi küreselleşmeyi nasıl etkileyecek? S Jaishankar açıklıyor
- Hollywood yönetmeni Elon Musk’u robot tasarımlarını kopyalamakla suçluyor: “Alabilir miyim…”