Teknoloji

OpenAI, 15 saniyelik kayıttan ses klonlayabilen teknolojisini tanıttı

Yapay zeka sohbet robotu ChatGPT'nin geliştiricisi OpenAI, ‘Voice Engine’ adını verdiği yeni teknolojisinin yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak orijinal konuşmacıya çok benzeyen doğal bir konuşma üretebildiğini duyurdu.

OpenAI tarafından, şirketin ses klonlayabilen yeni teknolojisine ilişkin açıklama yapıldı.

Açıklamada, ‘Voice Engine’in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine çok benzeyen bir konuşma üretebildiği bilgisi paylaşıldı.

Söz konusu teknolojinin 2022'de geliştirildiği belirtilen açıklamada, "kötüye kullanım potansiyeli" nedeniyle daha geniş bir sürüm için temkinli ve bilinçli yaklaşım benimsendiği ifade edildi.

"İnsanların seslerine benzeyen konuşmalar üretmenin özellikle de seçim yılında ciddi riskler taşıdığının farkındayız." denilen açıklamada, bu kapsamda ABD'nin de dahil olduğu çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandığı belirtildi.

Güvenlik endişelerine ilişkin, Voice Engine'in test aşamasındaki kullanıcı partnerlerine, kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.

Açıklamada ayrıca, Voice Engine'in orijinal konuşmacının sesini koruyarak çeviri yapabileceği de kaydedildi. Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak "kendi sesleriyle" dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının "aksanını" da koruyabileceği bilgisi paylaşıldı.