OpenAI, son zamanlarda ChatGPT ‘ye geliştirdiği ses klon lama yapay zeka modeli olan Voice Generation ile sesli okuma özelliğini güçlendiriyor. Voice Generation, kişilerin seslerinden sadece 15 saniyelik bir örnek alarak sentetik bir ses oluşturabiliyor. Voice Engine, sınırlı erişime sahip.
Voice Engine’in sınırlı erişimine sahip olan şirketler arasında eğitim teknolojisi firması Age of Learning, görsel hikaye anlatım platformu HeyGen, sağlık yazılımı üreticisi Dimagi, yapay zeka iletişim uygulaması geliştiricisi Livox ve sağlık sistemi Lifespan gibi önemli isimler bulunuyor.
Bu şirketler, Voice Engine’i farklı amaçlar için kullanarak teknolojinin potansiyelini keşfediyorlar. Örneğin Age of Learning, önceden yazılmış seslendirme içeriği oluşturmak ve öğrenciler için kişiselleştirilmiş yanıtlar sunmak için bu teknolojiyi kullanıyor.
OpenAI, Voice Engine’i geliştirmeye 2022’nin sonlarında başladı ve şimdiye kadar metinden sese dönüştürme API’si ve ChatGPT’nin Sesli Okuma özelliği gibi birçok alanda kullanıldı. Bu yeni teknoloji, yapay zeka alanında devrim niteliğinde bir adım olarak görülüyor çünkü sadece kısa bir ses örneğiyle gerçekçi bir ses sentezleme yeteneği sunuyor.
Ancak bu yeni teknolojinin kullanımıyla birlikte bazı etik ve güvenlik endişeleri de ortaya çıkıyor. Özellikle yapay zeka tarafından üretilen seslerin gerçek seslerle karıştırılması ve yanlış amaçlarla kullanılması riski bulunuyor.
Bu nedenle OpenAI, Voice Engine’i kullanan şirketlerin belirli kullanım politikalarına uymalarını şart koşuyor. Örneğin, Voice Engine’i kullanarak üretilen seslerin AI tarafından üretildiğini açıkça belirtmeleri ve orijinal konuşmacıdan izin almaları gerekiyor.
Gelin The Verge’ün paylaştığı orijinal ses ve o sesten üretilen kayıtlara birlikte göz atalım.
Orijinal ses:
Yapay zeka tarafından üretilen ses kayıtları:
Siz ChatGPT ses klonlama hakkında ne düşünüyorsunuz? Düşüncelerinizi aşağıdaki yorumlar kısmından bizlerle paylaşmayı lütfen unutmayın.