Фото: Минреинтеграции

В Украине продолжают создавать Нацкорпус крымскотатарского языка. За почти полгода обработали и внесли в каталог более 700 материалов. Об этом сообщают в Минреинтеграции.

Среди материалов — произведения крымскотатарских авторов, журналы, газеты, учебники, документы международных организаций, субтитры фильмов и т.д.

Национальный корпус крымскотатарского языка (НККМ) — это онлайн-платформа для исследования языка, которая будет работать на данных из текстовых материалов на крымскотатарском.

В частности, за это время был разработан словарь лематизации. Речь идет о создании реестра слов с обозначением их исходной формы и речевых характеристик (часть речи, род, число). Это необходимо для запуска модуля по поиску слов на онлайн-платформе Нацкорпуса. Разработка соответствующего программного обеспечения продолжается.

Проект реализуется при поддержке Минреинтеграции, швейцарско-украинской программы EGAP, выполняемой Фондом Восточная Европа, и Киевского национального университета имени Тараса Шевченко.

Читайте также