HİSSELER
EN
Hisse verileri yükleniyor...
Dil Modelleri

Google TranslateGemma Yayınladı: 55 Dil Desteğiyle Açık Kaynak Çeviri Modeli

Google TranslateGemma Yayınladı: 55 Dil Desteğiyle Açık Kaynak Çeviri Modeli

Google, Gemma 3 mimarisi üzerine inşa edilen yeni açık çeviri modeli ailesini tanıttı. TranslateGemma 55 dil desteğiyle dizüstü bilgisayarlardan akıllı telefonlara kadar geniş bir donanım yelpazesinde çalışabiliyor.

En dikkat çekici bulgu verimlilik konusunda ortaya çıkıyor. 12 milyar parametreli TranslateGemma, iki katı büyüklüğündeki temel modeli geride bırakıyor. Bu durum daha az kaynakla daha yüksek kaliteli çeviri anlamına geliyor.

Üç Farklı Boyut Seçeneği

Google’ın resmi duyurusuna göre TranslateGemma üç boyutta sunuluyor:

4 milyar parametreli model mobil cihazlar için optimize edildi. 12B model tüketici dizüstü bilgisayarları için tasarlandı. 27B model ise tek bir H100 GPU veya TPU üzerinde çalışan bulut sunucularına yönelik.

Google kaliteyi MetricX metriği ile ölçtü. Bu metrik çeviri hatalarını takip ediyor ve düşük puanlar daha az hata anlamına geliyor. 12B TranslateGemma 3,60 puan alarak 27B temel modelin 4,04 puanını geçti.

Kendi 12B temel modeli (4,86) ile karşılaştırıldığında hata oranı yaklaşık yüzde 26 düştü.

Düşük Kaynaklı Dillerde En Büyük Kazanım

İyileştirmeler test edilen 55 dil çiftinin tamamında geçerli. Ancak düşük kaynaklı diller en büyük kazanımları görüyor.

İngilizce-İzlandaca hata oranları yüzde 30’dan fazla düştü. İngilizce-Svahili çevirileri yaklaşık yüzde 25 iyileşti. Bu durum az temsil edilen dillerin önemli avantaj sağladığını gösteriyor.

İki Aşamalı Eğitim Süreci

Performans artışı iki aşamalı eğitim sürecinden kaynaklanıyor. İlk aşamada modeller insan tarafından çevrilmiş ve sentetik olarak üretilmiş paralel veriler üzerinde ince ayarlandı.

ArXiv’de yayınlanan teknik rapora göre ikinci aşamada takviyeli öğrenme çeviri kalitesini optimize etti. Birden fazla otomatik değerlendirme modeli insan referans çevirilerine ihtiyaç duymadan çıktıları kontrol etti.

Ayrı bir model metnin doğal görünüp görünmediğini, anadili İngilizce olan birinin yazmış gibi olup olmadığını değerlendirdi.

Çok Yönlülük Korundu

Modellerin uzmanlaşmasına rağmen çok yönlülüğünü korumak için eğitim karışımı yüzde 30 genel talimat verisi içeriyor. Bu sayede TranslateGemma aynı zamanda chatbot olarak da çalışabiliyor.

Profesyonel çevirmenler tarafından yapılan insan değerlendirmesi otomatik ölçümleri büyük ölçüde doğruladı. Tek istisna Japonca-İngilizce çevirileriydi. Google bu düşüşü özel isimlerle ilgili hatalara bağlıyor.

Multimodal Yetenekler Sağlam

Modeller Gemma 3’ün multimodal yeteneklerini koruyor. Bu görev için özel eğitim almadan bile görüntülerdeki metinleri çevirebiliyorlar.

Vistra benchmark testleri metin çevirisi iyileştirmelerinin görüntü tabanlı çeviriye de aktarıldığını gösteriyor. Bu özellik OCR gerektiren senaryolarda büyük avantaj sağlıyor.

Kullanım ve Lisanslama

En iyi sonuçlar için Google, modeli “kültürel nüansları dikkate alan profesyonel çevirmen” olarak yönlendirmeyi öneriyor. Modeller Kaggle ve Hugging Face üzerinden erişilebilir durumda.

TranslateGemma, Gemma model ailesi için Google’ın lisansı olan Gemma Kullanım Koşullarını kullanıyor. Ticari kullanım, değiştirme ve yeniden dağıtıma izin veriyor ancak koşulların aktarılmasını gerektiriyor.

Lisans ek kısıtlamaları nedeniyle geleneksel açık kaynak lisansı değil. Google bunu “Açık Ağırlıklar” olarak adlandırıyor. Şirket üretilen çeviriler üzerinde hak iddia etmiyor.

Gemma Ailesi Genişliyor

TranslateGemma, Google’ın büyüyen Gemma ailesine en son eklenen model. 2025 baharında tüketici donanımları için güçlü açık ağırlık modeli olarak yayınlanan Gemma 3 üzerine inşa edildi.

O zamandan beri Google farklı kullanım senaryoları için özel varyantlar geliştirdi. MedGemma tıbbi görüntü analizi için, FunctionGemma yerel cihaz kontrolü için, Gemma 3 270M düşük kaynaklı ortamlar için ve Gemma 3n mobil cihazlar için tasarlandı.

Açık Model Rekabeti Kızışıyor

Genişleyen açık model pazarında Google kendini Alibaba (Qwen), Baidu ve DeepSeek gibi Çinli rakiplere karşı konumlandırıyor. Bu şirketler geçen yıl varlıklarını önemli ölçüde artırdı.

Stanford analizine göre Çin 2025’te açık ağırlık AI geliştirmede küresel liderliği ele geçirdi. Bu arada OpenAI (kendi çeviri aracı ChatGPT Translate’i yeni yayınladı) ve Anthropic gibi ABD laboratuvarları kapalı sistemlere odaklanmaya devam ediyor.

TranslateGemma, hedefli eğitimin daha küçük modellerden nasıl daha fazla performans sıkıştırdığını gösteriyor. 12B versiyon iki katı büyüklüğündeki temel modelden daha iyi çeviri yapıyor ve normal bir dizüstü bilgisayarda çalışıyor.

Güncel Kalın

En son haberleri e-posta kutunuza alın.

Gizliliğinize saygı duyuyoruz. İstediğiniz zaman abonelikten çıkabilirsiniz.