Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрі Жаслан Мәдиев 16 шілдеде Үкімет отырысында ЖИ тілдік моделінің қазақ тіліндегі бірінші нұсқасын (KazLLM) ұсыну ағымдағы жылы жоспарланып отырғанын хабарлады, деп хабарлайды kaskelen.kz.
Министр ЖИ саласындағы зерттеулерді дамыту үшін екі негізгі бағыт айқындалғанын атап өтті.
“Біріншісі – Назарбаев Университеті мен ҰАТ күштерімен қазақ тілінде үлкен тіл моделін (KazLLM) құру. Бұл модель 100 миллиард таңбалауышқа негізделеді. Модельдің жоғары сапасын қамтамасыз ету үшін қазақ тіліндегі деректердің ең көп санын жинау өте маңызды. Осы мақсатта ұлттық деректер жинау, Hugging Face платформасында деректерді жинау бойынша ауқымды науқан жүргізілетін болады“, – деп толықтырды Жаслан Мәдиев.
Оның айтуынша, қазіргі уақытта ашық көздерден 28 млрд токен және мемлекеттік және квазимемлекеттік органдардан, сондай-ақ мемлекеттік мұрағаттар мен БАҚ-тан 100 терабайтқа жуық деректер жиналды.
“Сонымен қатар KazLLM халықаралық компаниялармен бірлесіп әзірленетін болады. Араб тарапының серіктесі – ҰАТ. Бұл модель ашық көздерден алынған мәліметтер негізінде 30-40 млрд таңбалауышқа негізделетін болады. Бұл жоба өтеусіз негізде іске асырылады. KazLLM-дің алғашқы нұсқасын ағымдағы жылдың желтоқсан айында ұсыну жоспарлануда“, – деді министр.
Ол 2029 жылға қарай ЖИ патенттерінің санын жылына кемінде 20–ға жеткізу жоспарланғанын айтты.
Өз кезегінде премьер–министр Олжас Бектенов KazLLM қазақстандық тіл моделін әзірлеуді жеделдетуді тапсырды.
“ЦДИАӨМ ғылым министрлігімен және Назарбаев Университетімен бірлесіп, ағымдағы жылдың соңына дейін KazLLM үлкен тілдік моделі үшін деректер жинауды аяқтасын. Бірінші модельді оқыту ағымдағы жылдың үшінші тоқсанында жүргізілуі тиіс“, – деп атап өтті Олжас Бектенов.
2024 жылғы 20 маусымда ҚР цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрі Жаслан Мәдиев қазақ СhatGPT құрылуының қай сатысында тұрғанын айтты.