Teknolojinin baş döndürücü hızla gelişmesiyle birlikte, yapay zeka artık hayatımızın her alanında karşımıza çıkıyor. ChatGPT gibi araçlar, günlük işlerimizi kolaylaştırmaktan akademik çalışmalara kadar geniş bir yelpazede bize yardımcı oluyor. Hatta bu sistemlerin zorlu sınavlarda üstün başarı göstermesi, karmaşık makaleler yazması ve doğal bir insan konuşmasını taklit etmesi, yapay zekanın potansiyelini gözler önüne seriyor.

Ancak, bu parlak ilerlemenin bir diğer yüzü de var. Yapay zekanın bu hızlı gelişimi birçok insan için hem heyecan verici hem de biraz ürkütücü. Özellikle ChatGPT’nin Turing testini geçmesi gibi gelişmeler, yapay zekanın yetenekleri ve sınırları hakkında önemli soruları gündeme getiriyor. Peki, Turing testi tam olarak nedir ve bu testi geçmek yapay zeka için neden bu kadar önemli bir dönüm noktasıdır?
Turing Testi Nedir?
Söz konusu test ismini İngiliz matematikçi, bilgisayar bilimcisi ve kriptolog Alan Turing’den alır. Kısaca Turing testi, bir makinenin insan zekasına sahip olup olmadığını ölçmek için tasarlanmış bir testtir. Testin işleyişi oldukça basittir.
Bir yargıç, bir insan ve bir makine arasında yazılı bir sohbet başlatır. Ancak yargıç, iletişim kurduğu tarafların kim olduğunu bilmez. Sohbet süresince yargıç, hangi tarafın insan olduğunu anlamaya çalışır. Eğer makine, insan olduğunu düşündürtecek kadar başarılı bir şekilde yazışmayı sürdürebilirse ve yargıcı yanıltabilirse, Turing testini geçmiş sayılır. Bu durum, makinenin insan benzeri bir zeka sergilediği şeklinde yorumlanır.

Yazımızın başında da belirttiğimiz gibi ChatGPT Turing testini geçmeyi başardı. Başarısını ise sahip olduğu şu 3 beceriye borçlu: Diyalog yönetimi, doğal dil işleme ve sosyal beceriler. ChatGPT’nin testte verdiği cevaplar, yargıcın onun insan olduğunu sanmasına sebep oldu. Bu sayede de testi geçti. Ancak ChatGPT, Turing testini geçen ilk chatbot değil. Google’ın LaMDA (Language Model for Dialogue Applications) modeli, geçen yaz Turing testini geçmeyi başaran ilk yapay zeka olmuştu.
Turing Testi Artık Geçersiz mi?
Turing testi başlangıçta, bir düşünce deneyi idi. Alan Turing’in bu fikri, insan ve makine arasındaki ayrımı dil becerileri üzerinden ele alıyordu. Bu testin temel fikri hâlâ güncel, ancak Büyük Dil Modelleri (LLM) gibi teknolojilerin gelişimi, Turing testini geçmeyi oldukça kolaylaştırdı. Modern yapay zeka sistemleri, GPT-4 gibi modeller sayesinde insan benzeri dil becerileri sergileyebiliyor ve yargıçları kandırarak testi geçebiliyor.

Bu testin temel fikri hâlâ güncel, ancak Büyük Dil Modelleri (LLM) gibi teknolojilerin gelişimi, Turing testini geçmeyi oldukça kolaylaştırdı. Modern yapay zeka sistemleri, GPT-4 gibi modeller sayesinde insan benzeri dil becerileri sergileyebiliyor ve yargıçları kandırarak testi geçebiliyor. Bu, yapay zekanın dil işleme gücünün arttığını gösterse de, Turing testinin artık bir yapay zekanın “düşünme yeteneğini” değerlendirmek için yeterli olmadığını da ortaya koyuyor.
Bununla birlikte, Turing testi tamamen geçersiz bir araç haline gelmiş değil. Hâlâ, yapay zekayı değerlendirmek için etkili bir yöntem. Ancak bunu yaparken, dil modellerini alışılmış bağlamlarının dışına çıkararak değerlendirmek gerekiyor. Örneğin, yapay zekanın kapasitesini ve sınırlamalarını ortaya koymak için karmaşık veya beklenmedik sorular sorabiliriz. Yapay zekanın bu tür sorulara verdiği yanıtlar, onun yeteneklerini ve eksikliklerini daha net bir şekilde görmemizi sağlar.
Yapay Zekayı Turing Testi Dışında Yöntemlerle de Sınıyoruz
Bilim insanları artık bir yapay zeka sistemini değerlendirirken dil yeteneği, sağduyulu akıl yürütme, matematiksel kapasite gibi çeşitli kriterlere odaklanmakta. Ayrıca, akademik ve profesyonel sınavları da yapay zeka performansını ölçmek için kullanıyoruz.
OpenAI, ChatGPT-4’ü 2023 yılının Mart ayında piyasaya sürdüğünde, bu yapay zeka modelinin okuduğunu anlama, matematik, kodlama ve diğer becerilerini ölçmek için bir dizi test uyguladı. Sonuçlar oldukça dikkat çekiciydi. Örneğin, ABD’de birçok eyalette geçerli olan avukatlık sınavında ChatGPT-4, sınava girenler arasında ilk %10’luk dilimde yer almayı başardı. Bu performans, insan hukuk öğrencilerinin büyük bir kısmından daha iyi bir sonuç elde ettiğini gösteriyor.

Ayrıca GPT-4, ABD’li lise öğrencilerinin standart sınavlarını, doktorların klinik becerilerini değerlendiren sınavları ve lisansüstü eğitim için seçme sınavlarını çözmeyi de başardı. Bu başarılar, yapay zeka sistemlerinin eğitim ve profesyonel alanlarda nasıl bir potansiyele sahip olduğunu gözler önüne seriyor.
Ancak bu sınav sonuçları, yapay zekanın insanlar kadar “düşünme” veya “akıl yürütme” kapasitesine sahip olduğu anlamına gelmez. Yapay zekalar, eğitildikleri süreçte büyük miktarda veriyle karşılaştıkları için bu bilgileri sınav sırasında yeniden kullanır. Örneğin, GPT-4, eğitildiği metinlerde gördüğü bir sorunun doğru yanıtını arayıp bulur. Ancak aynı soru bağlamı değiştirilerek veya farklı kelimelerle ifade edildiğinde başarısız olabilir.
Bu, yapay zekanın cevapları ezbere dayalı olarak verdiğini ortaya koyar. Bilim insanları bu durumu “kontaminasyon sorunu” olarak adlandırıyor. Bu nedenle yapay zekanın performansını ölçmek için çeşitli yaratıcı değerlendirme yöntemleri üzerinde çalışıyor.
Yapay Zeka Akıl Yürütme Yeteneğine Sahip mi?
Harvard Üniversitesi’nde yapılan bir deney, büyük dil modellerinin (LLM’lerin) soyut kavramlar hakkında temel bir akıl yürütme yeteneğine sahip olabileceğini ortaya koymuştu. Deneyde, Othello adlı strateji oyununun dijital bir versiyonu kullanıldı.

Deney sırasında model, hamle sıralarını hatırlaması için eğitildi. Daha sonra, bu hamlelerin oyun tahtasında yarattığı durumu doğru bir şekilde temsil edip edemeyeceği değerlendirilecekti. Sonuçlar, modelin hamleleri takip edebildiğini ve tahtadaki taşların konumlarını doğru bir şekilde temsil edebildiğini göstermişti.
Modelin, stratejik bir bağlamda doğru hamleleri tahmin etmesi de mümkün olmuştu. Bu bulgular, LLM’lerin yalnızca dilsel kalıpları öğrenmediğini, aynı zamanda olaylar arasındaki ilişkileri anlamlandırabildiğini göstermişti.
Bilim insanları, yapay zekayı daha iyi değerlendirmek için yeni testler geliştirmeye devam ediyor. Ancak bu çabalar sırasında dikkat edilmesi gereken önemli bir nokta var. İnsanlar yapay zekayı anlamaya çalışırken genellikle antropomorfik düşünme eğiliminde olur. Yani zeka belirtisi gösteren her şeyi insan biçimci bir bakış açısıyla değerlendirir.
Bu nedenle, yapay zekanın insan düşünce ve zekasının bir kopyası olduğu gibi yanlış bir varsayım vardır. Halbuki gerçek, bundan oldukça farklıdır. Yapay zeka, insan zekası gibi bir bilinç ya da duygusal derinliğe sahip değildi. Bunun yerine, belirli kurallar ve algoritmalar çerçevesinde çalışan bir sistemdir.
Bu farklılığı anlamak, yapay zekayı daha doğru bir şekilde değerlendirrmek ve onun potansiyelini anlamlı bir şekilde kullanmak için kritik bir öneme sahip.
Kaynaklar ve İleri Okumalar
- Celeste Biever ; ChatGPT broke the Turing test. The race is on for new ways to assess AI .doi: https://doi.org/10.1038/d41586-023-02361-7
- ChatGPT Passes Turing Test: A Turning Point for Language Models. Bağlantı: ChatGPT Passes Turing Test: A. Turning Point for Language Models (mlyearning.org) ; Yayınlanma tarihi: 9 Mayıs 2023
Size Bir Mesajımız Var!
Matematiksel, matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.
Matematiksel