Yapay Zekânın İnsan Katmanı

Esra OBUT
6 gün önce
6 dakikada okunur

Güncelleme tarihi: 24 saat önce

Son yıllarda Outlier, Invisible ve micro1 gibi uluslararası platformlarda çalıştım. Bu firmalar, yapay zekâ modellerini geliştirmek için insan uzmanlığına ihtiyaç duyan şirketler ve dünya genelinde farklı alanlarda uzman kişilerle proje bazlı çalışıyorlar.

Bu platformlarda üç farklı rol üstlendim. Tasker olarak yapay zekâ modellerinin ihtiyaç duyduğu metinleri ürettim. Evaluator olarak üretilen içerikleri dil doğruluğu, bağlam uyumu, kültürel yerindelik açısından değerlendirdim. Bir kısım projede ise metnin bütünlüğünü, noktalama işaretlerini ve tutarlılığını değerlendirdiğim daha editöryal bir rolle çalıştım. Süreç içinde de projelerin koordinasyonundan sorumlu olacak, diğer katılımcıları yönetecek konuma yaklaşmak anlamına gelen Queue Manager bekleme listesine alındım.

Çalışma şekli her projede farklıydı. Bir projeye katılmak için önce o projeye özgü kuralları ve yönergeleri çalışıyordunuz, sınava giriyordunuz, webinarlarla bilginizi pekiştiriyordunuz. Hiçbir projenin kuralı bir diğerine benzemiyordu. Her biri kendi bağlamına ve standartlarına göre şekillenmiş bağımsız bir dünya. Ben bu projelerde ağırlıklı olarak Türkçe metin lokalizasyonu ve kültürel içerik üretimi alanlarında çalıştım. Bu süreçte zihnimde yalnızca yapay zekâya bir dili ve kültürü kimin öğrettiği sorusu kalmadı, aynı zamanda yapay zekânın tek başına çalışan bağımsız bir sistem değil, arkasında insan bilgisi, insan emeği ve insan yargısı bulunan bir yapı olduğunu daha açık biçimde gördüm.

Yapay zekâ yalnız çalışmaz

Yapay zekâ çoğu zaman kendi kendine öğrenen, kendi kendine düşünen ve kendi kendine karar veren bir sistem gibi anlatılıyor. Oysa bu anlatı eksik. Bugün kullandığımız birçok yapay zekâ sisteminin arkasında yalnızca mühendisler, veri bilimciler ya da büyük veri setleri yok. Alanında uzman insanlar, dil uzmanları, çevirmenler, editörler, içerik değerlendiriciler, hukukçular, sağlık profesyonelleri, eğitimciler, kültür ve bağlam bilgisine sahip kişiler de var.

Bir modelin daha iyi yanıt verebilmesi için, ürettiği yanıtların insanlar tarafından değerlendirilmesi gerekiyor. Bir metnin doğal olup olmadığını, bir cevabın bağlama uyup uymadığını, bir ifadenin kültürel olarak sorunlu görünüp görünmediğini ya da bir görselin doğru temsil edilip edilmediğini anlamak çoğu zaman yalnızca teknik bir ölçümle mümkün olmuyor. Burada insanın alan bilgisi, dili kullanma deneyimi, sezgisi ve yargısı devreye giriyor.

Bu yüzden yapay zekâ meselesini yalnızca teknoloji meselesi olarak düşünmek yetersiz kalıyor. Yapay zekâ aynı zamanda dil, kültür, yorum, anlam ve insan yargısı meselesi. Beşeri bilimlerin, editöryal düşünmenin ve kültürel okuryazarlığın bu alanda giderek daha önemli hâle gelmesinin nedeni de burada yatıyor çünkü bu sistemler yalnızca bilgi işlemiyor, aynı zamanda insanlara anlamlı, doğru ve bağlama uygun görünen çıktılar üretmeye çalışıyor. Bu çıktının gerçekten işe yarayıp yaramadığına karar vermekse hâlâ insan değerlendirmesine bağlı.

Ethan Mollick, yapay zekâyı tamamen otomatik bir araç gibi değil, insanla birlikte çalıştığında anlam kazanan bir "ortak zekâ" olarak ele alıyor. Bu yaklaşım bana önemli geliyor çünkü yapay zekâyı verimli kullanmak, ondan çıkan her şeyi olduğu gibi kabul etmek anlamına gelmiyor. Tam tersine, onunla çalışırken insanın daha dikkatli, daha seçici ve daha iyi bir değerlendirici olması gerekiyor.

Lokalizasyon yalnızca çeviri değildir

Bu platformlarda ağırlıklı olarak Türkçe projelerde çalıştım. Bu tesadüf değil. Bu tür firmalarda her dil için yalnızca o dili ana dili olan kişiler, yani native'ler, çalışıyor. Bunun nedeni çok basit: Bir dilin kültürel inceliklerini, bağlamsal doğrularını ve yanlışlarını ancak o dille büyümüş biri sezebiliyor çünkü dil yalnızca kelimelerden oluşmaz.

Bir cümlenin kulağa doğal gelip gelmediğini, bir ifadenin fazla resmî mi, fazla yapay mı, yoksa bağlama uygun mu olduğunu çoğu zaman sözlükten kontrol edemezsiniz. Bazen sorun dilbilgisi değildir. Cümle teknik olarak doğrudur ama Türkçede öyle söylenmez. Bazen yanıt bilgi verir ama tonu yanlıştır. Bazen içerik zararsız görünür ama kültürel bağlam içinde tuhaf, eksik ya da yerinden edilmiş durur.

Lokalizasyon tam da burada devreye giriyor. Bu süreç, bir metni başka bir dile çevirmekten daha fazlasını içeriyor. Yapay zekânın bir soruya verdiği yanıtın dilbilgisel olarak doğru olmasının ötesinde, kültürel olarak da yerli yerine oturmasını sağlaması gerektiriyor.

Emily M. Bender ve Timnit Gebru'nun büyük dil modelleri üzerine yaptıkları tartışmalar da bu noktada önemli. Dil modelleri etkileyici ve akıcı metinler üretebilir ama bu metinlerin anlamını, bağlamını ve toplumsal etkisini değerlendirmek hâlâ insana ait bir sorumluluk olarak kalır. Bir metnin akıcı olması, onun doğru, güvenilir ya da yerinde olduğu anlamına gelmez.

Bu projelerde fark ettiğim şeylerden biri de "Kültürel olarak doğru" dediğimizde aslında sabit bir şeyden bahsetmediğimizdi. Bağlam değiştikçe doğrunun sınırları da değişiyor. Bir yanıt bir senaryoda uygun olabilirken, başka bir senaryoda sorunlu hâle gelebiliyor. Aynı kelime bir yerde doğal, başka bir yerde kaba, fazla mesafeli ya da fazla yapay duyulabiliyor.

Yapay zekânın Türkiye'yi "görmesi"

Metin projelerinin dışında, görsel veriyle ilgili bir projede de çalıştım. Bu projede kendi çektiğim fotoğrafları yapay zekâ eğitim verisi olarak gönderdim. Fotoğraflar Türkçe yazılı tabelalar, Türk yemekleri, tarihî eserler, geleneksel giysiler gibi Türkiye'ye ait görsel unsurları içeriyordu.

İlk bakışta fotoğraf çekmek, yüklemek ve göndermek çok basit bir iş gibi görünebilir ama aslında süreç bundan daha karmaşıktı çünkü proje başlığına göre hangi görselin "Türkiye'yi temsil ettiğine" karar vermek gerekiyordu. Bir tabela mı daha temsilîdir, bir yemek mi, tarihî bir yapı mı, geleneksel bir kıyafet mi, yoksa modern bir sokak görüntüsü mü?

Benim çektiğim fotoğraf, benim seçtiğim açı ve benim "bu görsel bu başlığa uygun" dediğim karar, yapay zekânın Türkiye'ye dair görsel hafızasına küçük de olsa bir katkı sunuyor. Bu katkı tek başına belirleyici görünmeyebilir ama binlerce benzer seçim bir araya geldiğinde, modelin bir ülkeyi, bir kültürü ya da bir gündelik hayat biçimini nasıl tanıyacağı üzerinde etkili hâle geliyor.

Kate Crawford, yapay zekânın sanıldığı kadar "yapay" olmadığını; insan emeği, veri, sınıflandırma, altyapı ve toplumsal bağlamlarla kurulduğunu söyler. Bu düşünce, benim bu projelerde gördüğüm şeyle çok örtüşüyor. Yapay zekânın kültürel hafızası, yalnızca büyük veri setleriyle değil, böyle küçük ama etkili insan kararlarıyla da şekilleniyor.

Kuralların bittiği yerde insan yargısı başlar

Bu projelerde en öğretici alanlardan biri de sınır durumlar, yani edge case'lerdi. Her projenin ayrıntılı kuralları vardı. Ancak hiçbir kural seti hayatın bütün ihtimallerini kapsayamaz.

Bazı durumlarda içerik net biçimde doğru ya da yanlış değildi. Bir yanıt kısmen uygundu ama eksikleri vardı. Bir ifade dil açısından sorunsuzdu ama bağlam açısından tartışmalıydı. Bir görsel başlığa uyuyordu ama temsil gücü zayıftı. Böyle anlarda yalnızca kuralları uygulamak yeterli olmuyor; kuralların neyi amaçladığını anlamak ve o amacı somut duruma göre yorumlamak gerekiyor.

NDA nedeniyle spesifik proje, müşteri ya da içerik örneği paylaşamam ama genel olarak aynı içeriğin iki farklı değerlendirici tarafından farklı sonuçlarla değerlendirilebildiğini söyleyebilirim. Bu her zaman bir hata anlamına gelmiyordu. Çoğu zaman insan yargısının doğası buydu çünkü değerlendirme yalnızca ölçme işlemi değildir, aynı zamanda yorumdur.

Lucy Suchman'ın insan-makine ilişkileri üzerine çalışmaları burada hatırlanabilir. Teknolojik sistemler hiçbir zaman yalnızca teknik yapılardan ibaret değildir. Kullanıldıkları bağlam, onlarla etkileşime giren insanlar ve o an verilen kararlarla birlikte anlam kazanırlar. Yapay zekânın arkasındaki insan emeğini önemli kılan şey de tam olarak budur.

Gündelik hayatta da iş hayatında da insan değerlendirmesi şart

Bu mesele yalnızca yapay zekâ eğitim platformlarıyla sınırlı değil. Bugün şirketlerde, ajanslarda, içerik ekiplerinde ve danışmanlık süreçlerinde yapay zekâ giderek daha fazla kullanılıyor. Fakat aynı temel sorun burada da devam ediyor: Yapay zekâ çıktı üretir ama o çıktının iyi, doğru, bağlama uygun, etik, güvenilir ve kullanılabilir olup olmadığına bir insanın karar vermesi gerekir.

Yapay zekâ çoğu zaman ikna edici bir akıcılıkla konuşur. Hatalı olduğunda bile kendinden emin görünebilir, eksik bağlamla çalışabilir, kültürel tonu kaçırabilir, fazla genel ifadeler üretebilir ya da kurumun diliyle uyuşmayan metinler yazabilir. Bu nedenle, yapay zekâ çağında önemli becerilerden biri yalnızca iyi prompt yazmak değil, aynı zamanda iyi değerlendirme yapmaktır.

NIST'in AI Risk Management Framework belgesinde yapay zekâ sistemleri sosyo-teknik sistemler olarak ele alınır. Bu önemli bir ayrım çünkü bu sistemler yalnızca modelden, koddan ya da algoritmadan ibaret değildir. İnsan davranışları, kurum kültürü, kullanım bağlamı, risk algısı ve karar süreçleriyle birlikte çalışır.

Human-in-the-loop soyut bir kavram değil

Bugün "human-in-the-loop" ifadesi sık kullanılıyor ama bu kavram bazen fazla soyut kalıyor. Oysa benim deneyimimde bunun çok somut bir karşılığı vardı. Bir insan gerçekten oradaydı ve bir cümleyi okuyor, bir yanıtı puanlıyor, bir görseli seçiyor, bir ifadenin doğal olup olmadığını tartıyor, bir yönergeyi yorumluyor ve sınır bir durumda karar veriyordu.

Yapay zekâ ile çalışmanın geleceği bence daha fazla otomasyonla değil, daha nitelikli insan değerlendirmesiyle şekillenecek. Daha hızlı çıktı almakla değil, o çıktının değerini anlayabilmekle. İnsan yerine yapay zekâyı koymakla değil, insanın yargısını yapay zekâ ile birlikte daha görünür ve daha etkili hâle getirmekle.

Görünmeyen ama etkisi somut olan katman

Bugün yapay zekâ çoğu zaman büyük modeller, algoritmalar, otomasyon ve verimlilik üzerinden konuşuluyor. Fakat bu tartışmalarda çoğu zaman eksik kalan bir katman var: İnsan katmanı.

Yapay zekânın daha iyi yanıt vermesi, daha doğal konuşması ve kültürel bağlama daha uygun içerik üretmesi için birilerinin sürekli değerlendirme yapması gerekiyor. Partnership on AI'nın veri zenginleştirme çalışanları üzerine yaptığı çalışmalar da bu görünmeyen insan emeğine dikkat çekiyor. Veri etiketleyen, içerik değerlendiren ve kalite kontrol sağlayan insanlar, yapay zekâ sistemlerinin gelişiminde kritik rol oynuyor.

Özellikle Türkiye'de şirketler yapay zekâyı benimserken bu insan katmanını daha fazla düşünmek zorunda çünkü bu sistemleri kullanmak yalnızca aracı sisteme entegre etmek değildir. Türkçe çalışan bir modelin gerçekten iyi çalışıp çalışmadığını değerlendirmek için Türkçeyi bilen, kültürü bilen ve bağlamı okuyabilen insanlara ihtiyaç vardır.

Yapay zekâ hız sağlar, olasılıkları çoğaltır ve ilk taslağı çıkarır ama değeri belirleyen şey, o çıktının insan bilgisiyle nasıl değerlendirildiğidir. Bu yüzden yapay zekâ çağında asıl mesele insanın yerini makinenin alması değil, insanın kendi mesleki yargısını daha bilinçli, daha sorumlu ve daha görünür biçimde kullanmak zorunda kalmasıdır.

Kaynakça

Bender, Emily M.; Gebru, Timnit; McMillan-Major, Angelina; Shmitchell, Shmargaret. "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" FAccT, 2021.

Crawford, Kate. Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. Yale University Press, 2021.

Mollick, Ethan. Co-Intelligence: Living and Working with AI. Portfolio / Penguin, 2024.

NIST. Artificial Intelligence Risk Management Framework (AI RMF 1.0). National Institute of Standards and Technology, 2023.

Partnership on AI. Responsible Sourcing Across the Data Supply Line.

Suchman, Lucy. Human-Machine Reconfigurations: Plans and Situated Actions. Cambridge University Press, 2007.

Yapay Zekâ Destekli Dil, İçerik ve İletişim Stratejisti | İnsan–Yapay Zekâ İş Birliği | Editör ve Çevirmen