A

rtıq Azərbaycanın öz "ChatGPT"si var!

Azərbaycan dili üçün indiyə qədər yaradılmış ən böyük open - source NLP korpusu olan “Azcorpus”yaradılıb! Son zamanlar, “ChatGPT” başda olmaqla NLP həllərinin çox məşhurlaşdığının şahidi oluruq. Ancaq, az resurslu dillər üçün NLP tədqiqatında əhəmiyyətli boşluq vardı ki, Azərbaycan dili də istisna deyildi. Artıq gənclərimiz bu boşluğu aradan qaldırıblar!

Qeyd edək ki, bu korpus müxtəlif NLP layihələrində (text generation, chatbots) istifadə oluna biləcək “Azcorpus” Azərbaycan dilində ümumilikdə 1,9 milyon mətndən və təqribən 18 milyon cümlədən ibarətdir. Mətnlər xəbər saytları, jurnallar, vikipediya məqalələri, kitablar daxil olmaqla müxtəlif mənbələrdən seçilmişdir və siyasət, iqtisadiyyat, elm, mədəniyyət, idman, tarix, cəmiyyət və s. o cümlədən bir sıra digər mövzuları əhatə edən mətnlərlə janr və mövzu üzrə əhatə olunub.

Posted 
Apr 4, 2023
 in 
Startap
 category

Daha çox

Startap

 kateqoriyasından

View All