Ученые НГЛУ создали помощник для работы с узбекским языком
Нижегородские лингвисты разработали модель программы для работы с узбекским языком. Как сообщает пресс-служба НГЛУ, узбекский язык стал вторым тюркским языком после турецкого, с которым успешно работает программа "Фразеоэкстрактор".
Программа "Фразеоэкстрактор" создана учёными из Научно-образовательного центра НГЛУ и лицея "Центр одарённых детей" в 2022 году. Она помогает составлять словари из словосочетаний на разных языках: русском, английском, немецком, французском, испанском, китайском, корейском, турецком и узбекском.
В настоящее время пользовательский интерфейс программы находится в разработке. Однако студенты Иняза, обучающиеся в ЦОДе, и все желающие могут получить от НГЛУ программные коды и реализовать их в онлайн-редакторе. Это позволит им освоить базовые навыки программирования.
Разработка "Фразеоэкстрактора" включала в себя несколько этапов, уточнили в университете. Сначала был оптимизирован процесс извлечения фраз и созданы отдельные модели для обработки английского языка. Далее были разработаны два метода извлечения: грамматико-семантический и частеречный. Эти методы сейчас тестируются на нескольких европейских и восточных языках. Модель обработки узбекского языка была создана с нуля. Для её корректной работы необходимо собрать большой объём данных. Сначала планируется собрать пять тысяч слов, затем — десятки тысяч и так далее.
По словам исполняющего обязанности ректора НЛГУ Никиты Авралева, в будущем планируется создать пользовательскую версию программы и продолжить внедрять новые языки, исходя из потребностей современного общества.
Ранее сообщалось, что три вуза Нижнего Новгорода вошли в рейтинг лучших университетов мира.