В Україні триває створення Національного корпусу кримськотатарської мови
Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.
Збір друкованих та електронних текстів кримськотатарською мовою для створення Корпусу розпочався з жовтня 2022 року.
За майже 8 місяців до каталогу було внесено більш ніж 800 матеріалів понад 200 авторів. Процедуру розпізнавання та форматування пройшли вже 54% матеріалів. До завантаження на платформу Корпусу підготовлено 25% від запланованого обсягу матеріалів.
Наразі завершується тестування програмних елементів платформи. А також готується інструкція для її майбутніх користувачів.
Зазначимо, що проект Національного корпусу кримськотатарської мови був представлений на 17-й конференції Європейського відділення Асоціації комп’ютерної лінгвістики, яка відбулася цього місяця у Хорватії.
Проект реалізується за підтримки Мінреінтеграції, швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.