Gemini Embedding 2 səs, video və şəkilləri eyni anda emal edəcək.

Google süni intellekt strategiyasında önəmli addım olaraq Gemini Embedding 2 modelini önizləməyə açıb. Model həm mətni, həm səsi, həm videonu, həm şəkilləri, həm də sənədləri tək bir platformada işlədə bilir.

“Natively multimodal” adlandırılan sistem fərqli media növlərinin mənalarını bir-biri ilə əlaqələndirir və yüksək kontekst tutumu təmin edir.

Model tək sorğu ilə 6 şəkil, 120 dəqiqəlik video və səs fayllarını emal edə bilir. Matryoshka Təmsili Öyrənmə (MRL) texnikası isə performans və yaddaş xərclərinə nəzarət etməyə imkan verir.

Posted 
Mar 11, 2026
 in 
Texnologiya
 category

Daha çox

Texnologiya

 kateqoriyasından

View All