Google's Gemma 4 AI models get 3x speed boost by predicting future tokens

Google Perkenalkan Teknologi Baru untuk Peningkatan Kinerja AI Lokal

Google baru saja meluncurkan model Gemma 4 terbukanya ini musim semi ini, yang menjanjikan peningkatan kinerja dan kekuatan untuk AI lokal. Sekarang, dengan peluncuran Multi-Token Prediction (MTP) untuk Gemma, teknologi AI pinggirannya bisa menjadi lebih cepat lagi.

Bagaimana MTP Bekerja

Menurut Google, model eksperimental ini menggunakan bentuk dekoding spekulatif untuk menebak token masa depan, sehingga dapat mempercepat proses pembuatan konten dibandingkan dengan cara model membuat token sendiri.

Model Gemma terbaru dibangun menggunakan teknologi yang sama dengan Gemini AI dari Google, tetapi dioptimalkan untuk berjalan secara lokal. Gemini sendiri dioptimalkan untuk berjalan pada chip TPU kustom Google, yang beroperasi dalam klaster besar dengan interkoneksi dan memori yang sangat cepat.

Kelebihan Gemma

Gemma memungkinkan pengguna untuk bereksperimen dengan AI pada perangkat keras mereka sendiri, bukan berbagi semua data dengan sistem AI cloud dari Google atau pihak lain. Google juga telah mengubah lisensi Gemma 4 ke Apache 2.0, yang lebih fleksibel dibandingkan dengan lisensi Gemma kustom yang digunakan sebelumnya.

Namun, ada keterbatasan yang inheren pada perangkat keras yang dimiliki kebanyakan orang untuk menjalankan model AI lokal. Itulah sebabnya MTP hadir untuk membantu meningkatkan kinerja AI lokal.

Google's Gemma 4 AI models get 3x speed boost by predicting future tokens

Google Perkenalkan Teknologi Baru untuk Peningkatan Kinerja AI Lokal

Bagaimana MTP Bekerja

Kelebihan Gemma

Surround sound speaker channel numbers explained: Bigger isn't always better

If you pay a hacker’s ransom, chances are that they’ll come back for more

What happens when you try to chop a photon in half?