İnternet

ChatGPT’nin Gelişmiş Ses Modu artık daha doğal ve duygulu konuşuyor

OpenAI, Gelişmiş Ses Modu’nu geçen yıl GPT-4o’nun lansmanıyla birlikte tanıttı. Bu özellik, GPT-4o gibi doğal olarak çok modlu modeller kullanıyor ve sesli girdilere yalnızca 232 milisaniye kadar kısa sürede, ortalama 320 milisaniyede yanıt verebiliyor; bu da tipik bir konuşmadaki insan tepki süresine benziyor. Ayrıca daha doğal hissettiren ses üretebiliyor, konuşma hızınız gibi sözel olmayan ipuçlarını algılayabiliyor ve duyguyla yanıt verebiliyor.

Bu yılın başlarında OpenAI, Gelişmiş Ses Modu için kesintileri azaltan ve aksanları iyileştiren küçük bir güncelleme yayınlamıştı. Bugün ise OpenAI, Gelişmiş Ses Modu için sesi daha da doğal ve insan benzeri hale getiren büyük bir yükseltme sundu. Artık yanıtlar daha ince tonlamalara, gerçekçi konuşma akışına—duraksamalar ve vurgular dahil—ve empati ile alaycılık gibi belirli duygular için daha doğru bir ifadeye sahip.

Bu güncelleme aynı zamanda çeviri desteğini de beraberinde getiriyor. ChatGPT kullanıcıları artık Gelişmiş Ses Modu’nu kullanarak diller arasında çeviri yapabiliyor. Tek yapmanız gereken ChatGPT’den çeviriye başlamasını istemek; siz durdurmasını söyleyene kadar konuşma boyunca çeviriye devam edecek. Bu özellik, özel sesli çeviri uygulamalarına olan ihtiyacı fiilen ortadan kaldırıyor.

Şimdilik, güncellenmiş Gelişmiş Ses Modu yalnızca ChatGPT’nin ücretli kullanıcıları için kullanılabilir. OpenAI ayrıca bu son güncellemeyle ilgili bilinen bazı sınırlamaları da not etti.

Bu güncelleme bazen ses kalitesinde küçük düşüşlere yol açabiliyor; özellikle bazı ses seçeneklerinde ton ve perde gibi beklenmedik değişiklikler fark edilebiliyor. OpenAI, zaman içinde ses tutarlılığını artırmayı planlıyor.
Ses Modu’nda nadir de olsa hâlâ halüsinasyonlar oluşabiliyor ve bazen reklam, anlamsız sesler veya arka plan müziği gibi istenmeyen sesler üretebiliyor.
Bazı küçük sınırlamalar sürse de, bu sürekli gelişen özellikler dizisi, insan ile yapay zekâ arasındaki konuşma çizgisinin gelecekte giderek daha da belirsizleşeceğine işaret ediyor.

Geçmiş Makaleler

Galaxy A55 ve A53 için Nisan güncellemesi yayınlandı

Samsung, Galaxy A55 ve A53 modelleri için Nisan 2026 güvenlik yamasını kullanıma sundu. 47 kritik…

18 Nisan 2026

Android 17 Beta 4 yayında: RAM sınırı ve kuantum güvenliği geliyor

Google, Android 17'nin final betasını yayımladı. Yeni güncelleme, cihazları hızlandıracak katı RAM sınırları, yerel ağ…

18 Nisan 2026

Microsoft, Windows 11 Başlat Menüsü’nü yeniden tasarlıyor

Microsoft, Windows 11 Başlat menüsünü WinUI 3 altyapısıyla yeniden inşa ediyor. Performans sorunlarını gidermeyi hedefleyen…

18 Nisan 2026

Gemini ile ‘Kişisel Zeka’ dönemi başlıyor

Gemini’ın "Kişisel Zeka" özelliği, kullanıcıların Google uygulamalarındaki verilerini güvenle entegre ederek, tamamen kişisel bağlama uygun,…

18 Nisan 2026

ASUS ProArt ve NVIDIA Studio, içerik üreticilerini “Creator Connect 2026” etkinliğinde bir araya getirdi

ASUS ProArt ve NVIDIA iş birliğiyle ve "İçerik Oluşturucular İçin Geliştirildi, İlham Vermek İçin Tasarlandı"…

18 Nisan 2026

Anthropic, Claude Design ile yapay zekayı tasarım aracına dönüştürüyor

Anthropic, yeni Claude Design çalışma alanı ile kullanıcıların UI prototiplerini hızla oluşturmasına ve kodlama sürecine…

18 Nisan 2026