Лента новостей 1135 Публикация  

Технологии ABBYY помогают Институту востоковедения РАН в лингвистических исследованиях

Российская компания ABBYY – мировой разработчик программного обеспечения и поставщик услуг в области распознавания и ввода документов, лингвистики и перевода.
 

© Издание 12NEWS (ИП Маринин А.Л.) 12news.ru, 2010

С помощью ABBYY FineReader Engine быстро и корректно оцифровываются тексты на японском и китайском языках

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявляет об интеграции инструментария разработчика ABBYY FineReader Engine 9.0 с приложением, разработанным специалистами Института востоковедения РАН для внутренних нужд учреждения. Приложение используется для перевода в электронный вид бумажных документов на японском и китайском языках с целью их последующей лингвистической обработки. Технология ABBYY автоматизировала оцифровку текстов, избавив специалистов ИВ РАН от трудоёмкой работы по ручному вводу, и повысила точность вводимых данных.

Институт востоковедения РАН – академическое научное учреждение, ведущее фундаментальные исследования в области востоковедения. Научные изыскания института охватывают различные отрасли знания: историю, политику, экономику, религию, языки стран Ближнего и Дальнего Востока. Для решения ежедневных исследовательских задач ИВ РАН была необходима удобная встраиваемая технология распознавания, которая бы обеспечила тесную интеграцию процессов распознавания и верификации текстов с оригинальными процедурами лингвистического анализа, разработанными специалистами института. Решение ABBYY FineReader Engine 9.0 было выбрано как наиболее отвечающее потребностям ИВ РАН.

Теперь при обработке текстов на японском и китайском языках специалистам учреждения доступна широкая функциональность технологии ABBYY, в том числе инструменты коррекции отсканированного изображения для более качественного распознавания, функции анализа расположения блоков текста на странице и определения его ориентации. Также с помощью ABBYY FineReader Engineразработчикам ИВ РАН удалось реализовать удобный интерфейс верификации результатов распознавания. В процессе обработки текстов приложение строит гипотезы для неуверенно распознанных символов и предлагает их пользователю в виде контекстно-оптимизированных списков. Эта функция оказалась особенно полезна, учитывая сложность японского и китайского языков, отличающихся большим количеством символов, графической вариативностью, отсутствием чётко выраженных межсловных границ. В результате специалисты ИВ РАН добились заметного повышения точности распознавания текстов, при этом процесс оцифровки документов ускорился в несколько раз.

«Точное воспроизведение исходного документа в электронном виде необходимо для его корректного лингвистического анализа. Это особенно важно при оцифровке текстов, написанных идеографическим письмом, в котором отдельные символы обозначают не звуки, а целые слова или их значимые части. В таких случаях любая ошибка в распознавании может существенно исказить исходный смысл текста. С технологией ABBYYмы смогли перевести процесс оцифровки документов на японском и китайском языках на качественно новый уровень», – говорит Александр Костыркин, специалист Отдела языков и народов Азии ИВ РАН.     


Опубликовано 21.12.10 14:45
Просмотров 866
Разместил xbox
Культурный масштаб: как виртуальные концертные залы меняют жизнь в регионах
Культурный масштаб: как виртуальные концертные залы меняют жизнь в регионах
Услышать и увидеть выступление Юрия Башмета, насладиться музыкой виртуозов Российского национального оркестра или даже взглянуть на очаровательную Эмилию Кларк в спектакле “Чайка” — стало возможным благодаря созданию виртуальных концертных залов в рамках национального проекта “Культура”. Театральные постановки, концерты и мюзиклы могут увидеть жители самых отдаленных уголков нашей страны в специальных современных залах или дома в режиме «онлайн».
«АЛТИУС - Тендер»: подбирает субподрядчиков быстро и обоснованно
«АЛТИУС - Тендер»: подбирает субподрядчиков быстро и обоснованно
Компания «АЛТИУС СОФТ» выпустила специальную программу для строительных компаний «АЛТИУС - Тендер». Она позволяет выбирать субподрядчиков быстро и обоснованно.
Вся правда о нейронных сетях и искусственном интеллекте
Вся правда о нейронных сетях и искусственном интеллекте
Хайп вокруг темы искусственного интеллекта не затихает. В СМИ постоянно появляется информация, что какая-то очередная компания внедрила новую технологию, построенную на искусственном интеллекте. Однако мало кто делится проблемами, которые возникают при внедрении таких технологий. И это понятно: любой инженер, программист или создатель безумно гордится своей разработкой и готов рассказывать о ней только хорошее.