В Нацкорпус крымскотатарского языка внесли более 700 материалов
В Украине продолжают создавать Нацкорпус крымскотатарского языка. За почти полгода обработали и внесли в каталог более 700 материалов. Об этом сообщают в Минреинтеграции.
Среди материалов — произведения крымскотатарских авторов, журналы, газеты, учебники, документы международных организаций, субтитры фильмов и т.д.
Национальный корпус крымскотатарского языка (НККМ) — это онлайн-платформа для исследования языка, которая будет работать на данных из текстовых материалов на крымскотатарском.
В частности, за это время был разработан словарь лематизации. Речь идет о создании реестра слов с обозначением их исходной формы и речевых характеристик (часть речи, род, число). Это необходимо для запуска модуля по поиску слов на онлайн-платформе Нацкорпуса. Разработка соответствующего программного обеспечения продолжается.
Проект реализуется при поддержке Минреинтеграции, швейцарско-украинской программы EGAP, выполняемой Фондом Восточная Европа, и Киевского национального университета имени Тараса Шевченко.