OpenAI, Gelişmiş Ses Modu’nu geçen yıl GPT-4o’nun lansmanıyla birlikte tanıttı. Bu özellik, GPT-4o gibi doğal olarak çok modlu modeller kullanıyor ve sesli girdilere yalnızca 232 milisaniye kadar kısa sürede, ortalama 320 milisaniyede yanıt verebiliyor; bu da tipik bir konuşmadaki insan tepki süresine benziyor. Ayrıca daha doğal hissettiren ses üretebiliyor, konuşma hızınız gibi sözel olmayan ipuçlarını algılayabiliyor ve duyguyla yanıt verebiliyor.
Bu yılın başlarında OpenAI, Gelişmiş Ses Modu için kesintileri azaltan ve aksanları iyileştiren küçük bir güncelleme yayınlamıştı. Bugün ise OpenAI, Gelişmiş Ses Modu için sesi daha da doğal ve insan benzeri hale getiren büyük bir yükseltme sundu. Artık yanıtlar daha ince tonlamalara, gerçekçi konuşma akışına—duraksamalar ve vurgular dahil—ve empati ile alaycılık gibi belirli duygular için daha doğru bir ifadeye sahip.
Bu güncelleme aynı zamanda çeviri desteğini de beraberinde getiriyor. ChatGPT kullanıcıları artık Gelişmiş Ses Modu’nu kullanarak diller arasında çeviri yapabiliyor. Tek yapmanız gereken ChatGPT’den çeviriye başlamasını istemek; siz durdurmasını söyleyene kadar konuşma boyunca çeviriye devam edecek. Bu özellik, özel sesli çeviri uygulamalarına olan ihtiyacı fiilen ortadan kaldırıyor.
Şimdilik, güncellenmiş Gelişmiş Ses Modu yalnızca ChatGPT’nin ücretli kullanıcıları için kullanılabilir. OpenAI ayrıca bu son güncellemeyle ilgili bilinen bazı sınırlamaları da not etti.
Bu güncelleme bazen ses kalitesinde küçük düşüşlere yol açabiliyor; özellikle bazı ses seçeneklerinde ton ve perde gibi beklenmedik değişiklikler fark edilebiliyor. OpenAI, zaman içinde ses tutarlılığını artırmayı planlıyor.
Ses Modu’nda nadir de olsa hâlâ halüsinasyonlar oluşabiliyor ve bazen reklam, anlamsız sesler veya arka plan müziği gibi istenmeyen sesler üretebiliyor.
Bazı küçük sınırlamalar sürse de, bu sürekli gelişen özellikler dizisi, insan ile yapay zekâ arasındaki konuşma çizgisinin gelecekte giderek daha da belirsizleşeceğine işaret ediyor.
Samsung, Galaxy A55 ve A53 modelleri için Nisan 2026 güvenlik yamasını kullanıma sundu. 47 kritik…
Google, Android 17'nin final betasını yayımladı. Yeni güncelleme, cihazları hızlandıracak katı RAM sınırları, yerel ağ…
Microsoft, Windows 11 Başlat menüsünü WinUI 3 altyapısıyla yeniden inşa ediyor. Performans sorunlarını gidermeyi hedefleyen…
Gemini’ın "Kişisel Zeka" özelliği, kullanıcıların Google uygulamalarındaki verilerini güvenle entegre ederek, tamamen kişisel bağlama uygun,…
ASUS ProArt ve NVIDIA iş birliğiyle ve "İçerik Oluşturucular İçin Geliştirildi, İlham Vermek İçin Tasarlandı"…
Anthropic, yeni Claude Design çalışma alanı ile kullanıcıların UI prototiplerini hızla oluşturmasına ve kodlama sürecine…