Londra’nın sırılsıklam sokakları, şubat ayının dondurucu soğuğu anti-yapay zeka yürüyüşündekilerin paltolarından sızarken — Pause AI’dan buruşuk bir broşür gözüme çarpıyor, sektörün büyük planlarıyla alay ediyor.
O broşür. Adım 1: Dijital bir süper zihin yetiştir. Adım 2: ? Adım 3: ?
South Park’ın gnomları 98’de bunu daha iyi yapmıştı, kâr hayalleriyle donlarını çalmışlardı ama planları yoktu. Şimdi sıra yapay zekada — OpenAI ve Anthropic gibi şirketler modeller üretiyor, dönüştürücü gelecekler hakkında gürültü koparıyor, peki o bariz Adım 2’yi kim dolduracak?
Pause AI bir duraklama, ortalığı toparlamak için düzenleme istiyor. Destekçileri mi? Kurtuluşa doğru dört nala koşuyorlar, boşluğu görmezden gelerek. OpenAI’ın baş bilim insanı Jakub Pachocki bunu “ekonomik olarak dönüştürücü bir teknoloji” olarak nitelendiriyor — parlak sözler, bulanık bir harita.
Yapay Zekanın 2. Adımı Neden Gnomların Sunumu Gibi Hissediliyor?
PR’ı bir kenara bırak. İki çalışma durumu netleştiriyor. Anthropic, LLM’lerin en çok yöneticileri, mimarları, medya tiplerini etkileyeceğini tahmin ediyor — yer görevlileri şimdilik güvende. Ama bu tahminler laboratuvar görevlerine dayanıyor, ofis karmaşasına değil.
Bir yapay zeka işe alım şirketi olan Mercor, OpenAI, Anthropic, Google DeepMind’dan en iyi ajanları 480 gerçek bankacı, danışman, avukat işi üzerinde test etti. Sonuç? Her alanda destansı başarısızlıklar.
Test ettikleri her ajan, görevlerinin çoğunu tamamlayamadı.
İşte alıntı bu — acımasız, hiçbir rimel yok. Bu uçurumun sebebi ne? İddia sahiplerinin işin içinde bir çıkarı var. Anthropic güvenliği satmak için kesintiyi öngörüyor. Hype kodlama araçlarının hızına biner, ama strateji? Yargı? LLM’ler bu konularda çuvallıyor.
Gerçek dünya işleri karıştırıyor — insanlar, iş akışları direniyor. Onları yapay zeka için parçalamak mı? Zaman alır, işletmelerin cesareti yetmez.
Boşluk, çılgın iddiaları içine çekiyor. Bir gönderi piyasaları sarsıyor. Bizi demirleyen hiçbir kanıt yok.
İşte benzersiz içgörü: Bu, dot-com 1999’u yansıtıyor, o zamanlar fiber optikler ve sunucular yığılmıştı (Adım 1), kârlar buharlaşmıştı (Adım 3 yoktu) ve Adım 2 — yani gerçek e-ticaretin yaşayabilirliği — ortaya çıkması için acımasız bir darbe almıştı. Yapay zeka da aynı temizliği riske atıyor; karmaşık işletmelerde yatırım getirisini (ROI) kanıtlamadan, bu ikinci balon olur.
Yapay Zeka Ajanları Hiçbir Zaman İş Yüklerini Yerine Getirebilecek mi?
Yakın zamanda pek sanmıyorum. Çalışmalar kodlama dışı işlerde başarısızlığı haykırıyor. Bankacılık hassasiyeti? Hukuki nüanslar? Danışmanlar satır aralarını okuma üzerine kuruludur — yapay zekanın kör noktası.
Model üreticileri verileri saklıyor, kara kutu dağıtımları yapıyor. Şeffaflık, gerçek dünya kıyaslamaları gerekiyor. İşletmeler araştırmacılarla koordine olmalı, yoksa bu sonsuz bir tahmin oyunu olur.
Sektör dönüşüme bahse giriyor. Henüz kesin bir bahis değil. Bir sonraki cüretkar iddia mı? Donları hatırla.
Kötümser mi? Vadi’deki yirmi yıllık mücadele şunu öğretti: Hype turları fonlar, gerçeklik mezarları fonlar. Şimdi kim kâr ediyor? Broşür basan aktivistler, belki. Girişim sermayesi yatırımcıları mı? Adım 2 sağlamlaşana kadar.
Düzenleme, Yapay Zekanın 2. Adımı İçin Çözüm mü?
Pause AI evet diyor — güvenli olana kadar durdur. Ama uygulama? Küresel bir karmaşa. AB Yapay Zeka Yasası kenarları tırnaklıyor; ABD’de mi? Lobiciler ziyafet çekiyor.
Destekçiler inovasyon katili diye bağırıyor. Gerçek şu: Düzenleme, Adım 2’nin netliğini zorlar, yoksa sonsuza kadar hype döngüsünde kalırız.
Mercor’un testi münferit değil. Zincir ajanlar, ince ayar — yine de kenar durumlarında başarısız oluyor. İş akışları birbirine dolanıyor; yapay zeka içeri giriyor, durumu daha da beter sarıyor.
Tarihsel paralellik acıtıyor: Dot-com sonrası telekom balonu, yalnız altyapının parasallaşma olmadan çuvalladığını gösterdi. Yapay zeka laboratuvarları parametreleri yığıyor (Adım 1), AGI altını vaat ediyor (Adım 3). Adım 2, 10 kat kazanç sağlayan kurumsal pilotları gerektiriyor — nadir görülen olaylar.
Tahminler mi? 2026’da bir silkinme yaşanacak. Bu ajanların yarısı rafa kaldırılacak; hayatta kalanlar rutin görevlerde niş bulacak. Geniş bir dönüşüm mü? En erken 2030, eğer olursa. İşletmeler nakitlerini saklıyor, kanıt bekliyor.
Ekonomi vaade bağlı. Pause AI gibi şüpheciler delikler açıyor. Akıllı para, anahtar konuşmaları değil, Mercor tarzı değerlendirmeleri izliyor.
O broşür mü? Kehanet gibi. Adım 2’yi doldur, yoksa gnomlarla birlikte meme cehennemine katıl.
🧬 İlgili İçgörüler
- Daha Fazlasını Okuyun: Anthropic’in Peş Peşe Sızan Bilgileri Rakip Claude’un Kod Taslağını Ele Geçirdi
- Daha Fazlasını Okuyun: Sentetik Sirenlere Dikkat: Yapay Zeka Podcast Yayıncıları Flört Çaresizliğinden Para Kazanıyor
Sıkça Sorulan Sorular
Yapay Zekanın ‘Eksik Adım 2’si Nedir?
Güçlü modeller inşa etmekten gerçek kârlara ve dönüşüme giden belirsiz yol — çalışmalar ajanların gerçek görevlerde başarısız olduğunu gösteriyor.
Yapay Zeka Ajanları Gerçekten İş Yerindeki Görevlerde Başarısız mı Oluyor?
Evet, Mercor’un OpenAI gibi en iyi modellerden alınan 480 görev üzerindeki testi, görevlerin çoğunun tamamlanmadığını ortaya koydu.
Düzenleme Yapay Zeka Hype’ını Düzeltir mi?
Kanıtları vaatlerin önüne koymaya zorlayabilir, ancak küresel uygulama geride kalıyor.