Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Parkta buldu, yıllarca içinde altın var sanıp kırmaya çalıştı, gerçeği öğrenince nutku tutuldu: Bu, altından bile değerli!

David Hole, içinde altın olduğuna inandığı taşı balyozla bile kıramayınca çareyi uzmanlara danışmakta buldu. Aldığı cevap ise şok ediciydi: Elinde tuttuğu şey, bilimsel olarak altından kat kat değerliydi…

Yapay zeka tehlikesi büyüyor: Spotify ölü sanatçılar adına şarkılar yayınlıyor

Spotify, hayatını kaybeden sanatçıların hesaplarından yapay zeka ile üretilmiş müzikler yayınladı.

İlaçlı içeceği tespit eden dövme: Temas edince renk değiştiriyor

Her 10 kadından biri hayatında en az bir kez “spiking” mağduru oluyor. Koreli bilim insanlarının geliştirdiği geçici dövme, içeceğe GHB maddesi karıştığında sarıdan kırmızıya dönerek anında uyarı veriyor.

Otomobil devi 700 bin aracı geri çağırıyor! Yolda alev alma riski var

Otomobil üreticileri araçları güvenlik riski oluşturacak problemleri saptadığında geri çağırıyor. Bu riskler motor arızaları, fren sistemi arızaları veya yakıt sistemindeki sorunlar gibi sorunlar sebebiyle ortaya çıkıyor. Ünlü marka da yakıt enjektörlerinde sorun nedeniyle yangın riski taşıyan yaklaşık 700 bin aracını geri çağırma kararı aldı.

Android’te sinsi tehlike: Kullanıcıların verilerini çalıyor

Avrupa’nın önde gelen teknoloji üniversitelerinden TU Wien’deki araştırmacılar, Android işletim sistemini hedef alan yeni bir siber saldırı yöntemini açığa çıkardı. “TapTrap” adı verilen bu yöntemle hackerlar, arka planda görünmeyen bir uygulama …

Sırrınızla birlikte kaybolacak: Tek tuşla kendini imha eden cihaz tanıtıldı

Veri güvenliği için teknoloji şirketi Teamgroup tarafından önemli bir adım atıldı. Teknoloji devi kendi kendini imha eden yeni nesil SSD’leri resmen tanıttı. Bu özellik sayesinde tek tuşla tüm veriler anında yok edilecek.