Gemini Embedding 2 səs, video və şəkilləri eyni anda emal edəcək.
Google süni intellekt strategiyasında önəmli addım olaraq Gemini Embedding 2 modelini önizləməyə açıb. Model həm mətni, həm səsi, həm videonu, həm şəkilləri, həm də sənədləri tək bir platformada işlədə bilir.
“Natively multimodal” adlandırılan sistem fərqli media növlərinin mənalarını bir-biri ilə əlaqələndirir və yüksək kontekst tutumu təmin edir.
Model tək sorğu ilə 6 şəkil, 120 dəqiqəlik video və səs fayllarını emal edə bilir. Matryoshka Təmsili Öyrənmə (MRL) texnikası isə performans və yaddaş xərclərinə nəzarət etməyə imkan verir.
Daha çox
Texnologiya
kateqoriyasından
View All



