26.03.20

В Сибири создали алгоритм для перевода дореволюционных изданий
В Сибири создали алгоритм для перевода дореволюционных изданий

Реформа орфографии 1918 года так изменила русский язык, что простое чтение дореволюционных книг и газет недоступно обычным гражданам.

Сотрудники новосибирского Института вычислительных технологий (ИВТ) разработали систему, которая почти автоматически позволяет переводить дореволюционные издания в современную русскую орфографию, сообщает издание Сибирского отделения РАН "Наука в Сибири".

«Просто заменить устаревшие буквы на современные и убрать твердые знаки в конце слов недостаточно, есть случаи гораздо сложнее», - объясняют ученые. За основу разработчики взяли «Справочник по старой орфографии русского языка». Он во многом помог им составить правильный алгоритм перевода слов из старого написания в новое.

Алгоритм создан с целью заменить не эксперта, а скорее корректора, для работы с большими объемами текстов. Для ученых-филологов это — новый инструмент для работы с текстами. Пока программа еще не способна правильно анализировать случаи, которых нет в справочниках. В дальнейшем ученые хотят доработать ее так, чтобы были выявлены и решены все случаи. 

Если проект будет востребован массовыми пользователями, то доработка программы, по словам ученых - задача ближайшего будущего.


Мы в Яндекс Дзен
Нашли ошибку в тексте? Выделите её и нажмите [CTRL] + [ENTER], Спасибо.
ЧИТАЙТЕ ТАКЖЕ
27.03.24
Платежный сервис с 3 апреля прекратит работу в стране. Подробнее...
27.03.24
Накануне, 26 марта, «Авангард» одержал победу над ярославским «Локомотивом» в пятом матче второго раунда плей-офф КХЛ со счетом 4:2. Подробнее...

Добавить комментарий

Для того, чтобы оставить свой комментарий, войдите на сайт под своими логином и паролем.
Если у вас их еще нет, зарегистрируйтесь.
В информационных публикациях использованы фотографии Андрея Кудрявцева, Кирилла Бакинского, Сергея Бруна(Шехерева),
Матвея Милютина.