
Bugün Google, Gemini uygulamasında Google AI Ultra aboneleri için Gemini 2.5 Deep Think modelinin kullanıma sunulduğunu duyurdu. Bu yeni model, OpenAI’nin o3 ve xAI’nin Grok 4 modellerini birçok kilit benchmark testinde geride bırakıyor.
Mayıs 2025’te düzenlenen Google I/O etkinliğinde Google, ilk olarak Gemini 2.5 Pro Deep Think modunu tanıtmıştı. Bu mod, yanıt vermeden önce birden fazla hipotezi değerlendiren yeni araştırma tekniklerini kullanıyordu. Bugün sunulan Deep Think modeli ise, erken dönemde güvenilir test kullanıcılarından alınan geri bildirimler ve son araştırma atılımlarıyla geliştirilmiş bir versiyon. Google, bu yeni modelin I/O’da tanıtılan sürüme kıyasla önemli ölçüde iyileştirildiğini iddia ediyor.
Google ayrıca, bu yeni Deep Think modelinin, bu yılki Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya standardına ulaşan modelin bir varyasyonu olduğunu açıkladı. Günlük kullanım için daha hızlı hale getirilen model, bu nedenle 2025 IMO benchmark’ında yalnızca bronz seviyesinde performans gösteriyor.
Paylaşılan benchmark sonuçlarına göre, Gemini 2.5 Deep Think; LiveCodeBench V6, Humanity’s Last Exam, IMO 2025 ve AIME 2025 testlerinde yüksek performans sergiliyor.
Google AI Ultra aboneleri, Gemini uygulamasında günlük belirli sayıda sorgu hakkıyla ‘Deep Think’ seçeneğini kullanabiliyor. Bu seçenek, Gemini 2.5 Pro modeli seçildiğinde komut çubuğunda görünüyor. Google, Deep Think’in kod çalıştırma ve Google Arama gibi araçlarla otomatik çalıştığını belirtiyor. Ayrıca, önümüzdeki haftalarda Deep Think’in, araçlı ve araçsız sürümlerinin Gemini API üzerinden seçilmiş geliştiricilere sunulması planlanıyor.
Şimdi büyük soru, yakında çıkacak olan OpenAI GPT-5 modelinin, Gemini 2.5 Deep Think’in kilit benchmark sonuçlarını geçip geçemeyeceği.

İlk yorum yapan olun