Лента новостей 1135 Публикация  

Технологии ABBYY помогают Институту востоковедения РАН в лингвистических исследованиях

Российская компания ABBYY – мировой разработчик программного обеспечения и поставщик услуг в области распознавания и ввода документов, лингвистики и перевода.
 

© Издание 12NEWS (ИП Маринин А.Л.) 12news.ru, 2010

С помощью ABBYY FineReader Engine быстро и корректно оцифровываются тексты на японском и китайском языках

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявляет об интеграции инструментария разработчика ABBYY FineReader Engine 9.0 с приложением, разработанным специалистами Института востоковедения РАН для внутренних нужд учреждения. Приложение используется для перевода в электронный вид бумажных документов на японском и китайском языках с целью их последующей лингвистической обработки. Технология ABBYY автоматизировала оцифровку текстов, избавив специалистов ИВ РАН от трудоёмкой работы по ручному вводу, и повысила точность вводимых данных.

Институт востоковедения РАН – академическое научное учреждение, ведущее фундаментальные исследования в области востоковедения. Научные изыскания института охватывают различные отрасли знания: историю, политику, экономику, религию, языки стран Ближнего и Дальнего Востока. Для решения ежедневных исследовательских задач ИВ РАН была необходима удобная встраиваемая технология распознавания, которая бы обеспечила тесную интеграцию процессов распознавания и верификации текстов с оригинальными процедурами лингвистического анализа, разработанными специалистами института. Решение ABBYY FineReader Engine 9.0 было выбрано как наиболее отвечающее потребностям ИВ РАН.

Теперь при обработке текстов на японском и китайском языках специалистам учреждения доступна широкая функциональность технологии ABBYY, в том числе инструменты коррекции отсканированного изображения для более качественного распознавания, функции анализа расположения блоков текста на странице и определения его ориентации. Также с помощью ABBYY FineReader Engineразработчикам ИВ РАН удалось реализовать удобный интерфейс верификации результатов распознавания. В процессе обработки текстов приложение строит гипотезы для неуверенно распознанных символов и предлагает их пользователю в виде контекстно-оптимизированных списков. Эта функция оказалась особенно полезна, учитывая сложность японского и китайского языков, отличающихся большим количеством символов, графической вариативностью, отсутствием чётко выраженных межсловных границ. В результате специалисты ИВ РАН добились заметного повышения точности распознавания текстов, при этом процесс оцифровки документов ускорился в несколько раз.

«Точное воспроизведение исходного документа в электронном виде необходимо для его корректного лингвистического анализа. Это особенно важно при оцифровке текстов, написанных идеографическим письмом, в котором отдельные символы обозначают не звуки, а целые слова или их значимые части. В таких случаях любая ошибка в распознавании может существенно исказить исходный смысл текста. С технологией ABBYYмы смогли перевести процесс оцифровки документов на японском и китайском языках на качественно новый уровень», – говорит Александр Костыркин, специалист Отдела языков и народов Азии ИВ РАН.     


Опубликовано 21.12.10 14:45
Просмотров 826
Разместил xbox
Зачем руководителю и сотруднику нужна программа для составления исполнительной документации?
Зачем руководителю и сотруднику нужна программа для составления исполнительной документации?
Что используют инженеры ПТО для подготовки исполнительной документации? Как правило, только Excel. «Культура» профессиональной автоматизации ИД к нам пока не пришла, но уже начинает формироваться. Ясно лишь одно: если бы электронные таблицы были так хороши, то не было бы едких комментариев от реальных специалистов в этой области (достаточно пройтись по социальным сетям, чтобы их увидеть).
ИТ-командами ЗНГО «ТЕХНОВЕК» и ФРОНТСТЕП реализован механизм планирования MRP и APS
ИТ-командами ЗНГО «ТЕХНОВЕК» и ФРОНТСТЕП реализован механизм планирования MRP и APS
ФРОНТСТЕП: ERP система управления ресурсами предприятия с комбинацией MRP и APS планирования на Заводе нефтегазового оборудования «ТЕХНОВЕК». ИТ-командами ЗНГО «ТЕХНОВЕК» и ФРОНТСТЕП реализован механизм планирования двумя методами в ERP CloudSuite Industrial (SyteLine). Решение стало победителем в конкурсе «Проект года» от GlobalCIO.
Система «Монолит: СЭД» успешно переведена на облачную платформу Microsoft Azure
Система «Монолит: СЭД» успешно переведена на облачную платформу Microsoft Azure
Пивоваренная компания «Балтика», часть Carlsberg Group, завершила уникальный проект по переходу на инновационную систему мобильного электронного документооборота (Монолит.СЭД). Внедрение системы уже сократило время принятия решений в компании на 30%. В дальнейшем решение может быть масштабировано и на другие компании Carlsberg Group в регионе Восточная Европа.