Жасанды интеллект қазақ тілінде генерация жасайды

© Sputnik / Абзал КалиевСөздік
Сөздік - Sputnik Қазақстан, 1920, 03.03.2025
Жазылу
Ұлттық сөздік қорды қалыптастыру жүйені пайдаланушыларға функционалдық және ақпараттық сервистерге қолжетімділік беруді көздейді
АСТАНА, 3 наурыз – Sputnik. Ғылым және жоғары білім министрлігі "Қазақ тілінің ұлттық сөздік қоры" мемлекеттік ақпараттық жүйесін қалыптастыру туралы бұйрықтың жобасын әзірледі, деп хабарлайды Sputnik Қазақстан.
"Ашық НҚА" сайтында жарияланған құжатта ұлттық сөздік қорды жүргізу тәртібі айқындалған.
"Ұлттық сөздік қор академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығы болып табылатын датасет негізінде қалыптастырылады. Қазақ тілінің ұлттық сөздік қоры жалпыға қолжетімді мемлекеттік ақпараттық жүйе болып табылады", - делінген құжатта.
Бұйрық жобасында көрсетілген негізгі ұғымдар:
1.
генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контент (мәтін, сурет, дыбыс) автоматты түрде құру процесі;
2.
жасанды интеллект (ЖИ) модельдері – қазақ тіліндегі деректерді өңдеуге арналған ЖИ технологияларын және алгоритмдерін әртүрлі жүйелерге, қосымшаларға немесе платформаларға енгізу процесі;
3.
табиғи тілдерді өңдеу – компьютерлерге адам тілін түсіндіруге, басқаруға және генерациялауға мүмкіндік беретін машиналық оқыту технологиясы.
Ұлттық сөздік қорды қалыптастыру жүйені пайдаланушыларға функционалдық және ақпараттық сервистерге қолжетімділік беруді көздейді.
Ал оның үздіксіз жұмыс істеуі үшін сенімді және жоғары өнімді бағдарламалармен қамтамасыз етіп, серверлік қуаттылық жеткілікті болуы қажет. Бұдан бөлек, деректердің жоғалу қаупін болдырмау үшін автоматты резервтік көшіру жүйесін енгізу керек.
Ұлттық сөздік қорды құрудың мақсаты:
қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту;
мемлекеттік тіл мәртебесін нығайту;
қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау:
тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу;
өңдеу процестерін автоматтандыру.
Айта кетері, бұған дейін сенат депутаттары қазақ тілінің цифрлық сөздігін құруға арналған заңды мақұлдаған болатын. Заң аясында мемлекеттік тілге қатысты ауқымды шаралар атқарылады.
Виды Алматы - Sputnik Қазақстан, 1920, 31.10.2024
Алматыда қазақ тілі кіріктірілген мультимедиялық жүйелер шығарылады
Жаңалықтар
0