İnsanların çoğu yapay zeka ile gerçek sesler rasındaki farkı ayırt edemiyor

12 Ekim 2025

Araştırma

Giderek yaygınlaşan sanal asistanlar ve sesli yapay zeka sistemleri, günlük yaşamın olağan bir parçası haline geldi. Ancak yeni bir araştırma, insanların bu teknolojilerle üretilen sesleri gerçek insan seslerinden ayırt etmekte zorlandığını ortaya koydu.

PLoS One dergisinde yayımlanan çalışmaya göre, yapay zeka teknolojisinin ilerlemesiyle birlikte, sentetik sesler artık gerçek insan sesleri kadar doğal duyulabiliyor.

Araştırmada katılımcılara, yarısı yapay zeka tarafından oluşturulmuş, diğer yarısı ise gerçek insanlara ait 80 ses örneği dinletildi. Katılımcılardan bu sesleri güvenilirlik ve baskınlık açısından değerlendirmeleri istendi.

Yapay zeka kategorisinde iki tür ses yer aldı: tamamen sıfırdan oluşturulan jenerik sesler ve gerçek kişilerin seslerinden klonlanan örnekler. Katılımcılar jenerik yapay zeka seslerinin büyük kısmının sahte olduğunu fark edebildi. Ancak klonlanmış sesler daha inandırıcı bulundu; örneklerin yüzde 58’i gerçek sanıldı. Buna karşın, gerçek insan seslerinin yüzde 62’si doğru biçimde tanımlandı. Bu sonuç, iki grup arasında yalnızca küçük bir fark kaldığını gösteriyor.

Londra Queen Mary Üniversitesi Psikoloji Bölümü’nden Dr. Nadine Lavan, Euronews Next’e yaptığı açıklamada şunları söyledi:

Lavan ayrıca, bu kadar gerçekçi sesler yaratmak için artık pahalı yazılımlara ya da ileri düzey teknik bilgiye gerek olmadığını belirterek, “Bu tür sesleri herkesin erişebileceği ticari araçlarla üretmek mümkün hale geldi,” dedi.

Ses klonlama ve güvenlik endişeleri

Yapay zeka tabanlı ses klonlama sistemleri, bir kişinin ses özelliklerini analiz ederek bu sesi yüksek doğrulukla yeniden üretebiliyor. Ancak bu teknoloji, kötüye kullanıma da açık. Bazı dolandırıcılar, insanların sosyal medyada paylaştıkları ses kayıtlarını kullanarak sevdiklerinin seslerini taklit ediyor ve telefon dolandırıcılığı yapıyor.

Portsmouth Üniversitesi araştırmasına göre, 75 yaş üstü bireylerin üçte ikisi en az bir kez telefon dolandırıcılığı girişimine maruz kalıyor. Bu girişimlerin yaklaşık yüzde 60’ının sesli aramalar yoluyla yapıldığı tespit edildi.

Her ne kadar tüm bu aramalar yapay zeka kaynaklı olmasa da, ses klonlama teknolojisinin erişilebilirliği ve hızla gelişmesi, riski artırıyor. Hume AI ve ElevenLabs gibi araçlar, bu alandaki öne çıkan örnekler arasında yer alıyor.

Yapay zeka ses klonlama teknolojisi, eğlence sektöründe de tartışmalara neden oluyor. Birçok ünlünün sesi izinsiz biçimde kopyalanıyor. Geçtiğimiz yıl Scarlett Johansson, OpenAI’nin ChatGPT hizmetinde kullanılan bir sesin, “Her” filmindeki sesine “ürkütücü derecede benzediğini” söyleyerek tepki göstermişti.

Benzer şekilde, politikacıların ya da gazetecilerin sesleri taklit edilerek kamuoyunu yanıltmaya yönelik ses kayıtlarının sayısı da artıyor.

Dr. Lavan, bu tür etik sorunlara dikkat çekerek, “Yapay zeka geliştiricileri, etik uzmanları ve politika yapıcılar birlikte çalışmalı,” diyor. Ayrıca, “seslerin mülkiyeti, rıza kavramı ve bunların teknolojik gelişmeler ışığında nasıl yeniden tanımlanacağı” konularının dikkatle ele alınması gerektiğini vurguluyor.

Faydalı kullanım alanları

Tüm bu risklerin yanında, yapay zeka ses teknolojisinin büyük bir toplumsal fayda potansiyeli de bulunuyor. Özellikle konuşma yetisini kaybetmiş ya da iletişim güçlüğü çeken bireyler için bu sistemler hayatı kolaylaştırabiliyor.

Dr. Lavan, “Stephen Hawking bu teknolojinin en bilinen örneklerinden biriydi,” diyerek şunları ekledi:

Bu tür sistemlerin, etik biçimde kullanıldığında eğitim, yayıncılık ve sesli kitap alanlarında erişilebilirliği artırabileceğini belirten Lavan, yapay zeka seslerinin özellikle DEHB gibi nöroçeşitliliğe sahip öğrencilerin öğrenme motivasyonunu artırdığını gösteren araştırmalara da dikkat çekti.

Ayrıca, bir sesin farklı dillere çevrilip aynı tınıyla korunabilmesi sayesinde kullanıcıların “kendi ses kimlikleriyle” farklı dillerde kendilerini ifade edebildiğini belirtti.

İnsan–makine etkileşiminin geleceği

Yapay zeka sesleri hayatımıza giderek daha fazla entegre oldukça, insanlarla bu sesler arasındaki etkileşim biçimi de sürekli değişiyor. Dr. Lavan, gelecekteki araştırmaların bu etkileşimleri daha iyi anlamaya odaklanması gerektiğini söylüyor:

Ayrıca, “Kulağa hoş gelen ama açıkça insan olmayan seslerin insan davranışları üzerindeki etkisi de merak konusu,” diyen Lavan, insanların bu tür seslere daha fazla mı güveneceği yoksa hata yaptıklarında daha mı hoşgörülü olacaklarının araştırılması gerektiğini belirtiyor.

Diğer Haberler