2020-03-26T07:54:30+03:00

Убирает твердые знаки и яти: ученые из Новосибирска сделали программу, которая переводит старинные книги

Программа должна помочь редакторам, которые работают со старыми изданиями
Сибирские ученые разработали алгоритм для перевода старой орфографии из книг в современную. Фото: Александра ФедосееваСибирские ученые разработали алгоритм для перевода старой орфографии из книг в современную. Фото: Александра Федосеева
Изменить размер текста:

В Новосибирске сотрудники Института вычислительных технологий СО РАН разработали алгоритм, который облегчит рутинную работу редакторов. Новая программа переводит орфографию из дореволюционных изданий в современную — почти без участия человека. Об этом рассказало издание «Наука в Сибири».

— Просто заменить устаревшие буквы на современные и убрать твердые знаки в конце слов недостаточно, есть случаи гораздо сложнее, — объясняют ученые. За основу разработчики взяли «Справочник по старой орфографии русского языка». Он во многом помог им составить правильный алгоритм перевода слов из старого написания в новое.

Алгоритм создан с целью заменить не эксперта, а скорее корректора, для работы с большими объемами текстов. А для ученых-филологов это — новый инструмент для работы с текстами. Сегодня программа еще не способна правильно анализировать случаи, которых нет в справочниках. В дальнейшем ученые хотят доработать ее так, чтобы были выявлены и решены все случаи.

— Если наш проект будет востребован массовыми пользователями, например, библиотека с большим объемом дореволюционных фондов, то доработка программы — задача ближайшего будущего», — рассказала инженер-программист ИВТ СО РАН Елизавета Тагирова.

К ЧИТАТЕЛЯМ

Если вы стали очевидцем ЧП или чего-то необычного, сообщите об этом в редакцию:

Редакция: (383) 289-91-00

Viber/WhatsApp: 8-923-145-11-03

Почта: kp.nsk@phkp.ru

ИСТОЧНИК KP.RU

Понравился материал?

Подпишитесь на ежедневную рассылку, чтобы не пропустить интересные материалы:

Нажимая кнопку «подписаться», вы даете свое согласие на обработку, хранение и распространение персональных данных