Yapay Zeka
Gemma 4'ün hızlanma hilesi: Açık kaynak AI'ı telefonda 3 kat daha çabuk çalıştırıyor
Google, Gemma 4 modellerine Multi-Token Prediction drafter'larını entegre ederek açık kaynak yapay zekanın mobil cihazlarda gerçek zamanlı çalışabilmesinin kapısını açtı. Pixel telefonlarda 3,1 katlık, Apple M4 işlemcilerde 2,5 katlık hız kazancı ölçülürken, hafif draft modelin birden fazla token tahminini ana modelin tek işlemde doğrulaması—hiç kalite kaybı olmadan—bellek sınırlandırmasını etkili biçimde ortadan kaldırdı.