Все новости от 27 октября 2005 г. ABBYY обновляет инструментарий OCR
В ноябре в свет выйдет набор инструментальных средств разработки ПО (SDK, Software development kit) — ABBYY FineReader Engine 8.0 для Windows. Он базируется на всех технологиях распознавания, разработанных компанией ABBYY к настоящему времени: распознавание печатных текстов (OCR, Optical character recognition), текстов, написанных от руки (ICR, Intelligent character recognition) и меток (OMR, Optical mark recognition). Кроме того, данный пакет включает технологии обработки одномерных и двумерных штрих-кодов, анализа PDF-файлов и извлечения данных из структурированных форм (FormReader) и неструктурированных документов (FlexiCapture). Все функции, реализующие данные технологии, доступны через единый универсальный интерфейс прикладного программирования (API, Application Programming Interface).
Разработчики утверждают, что приложения, созданные с помощью ABBYY FineReader Engine 8.0, смогут распознать печатный текст, составленный с использованием (в любой комбинации) 189 языков народов мира, а также проанализировать поля, заполненные “рукопечатными” буквами, применяемыми (по технологическим причинам) лишь в 91 языке. В SDK также реализована возможность управления уровнем необходимой точности распознавания. Ведь, как известно, — чем ниже заданная точность распознавания (в рамках одной технологии), тем выше его скорость.
Дина Шелепина: “Технологии распознавания ABBYY используются в ряде уникальных промышленных приложений”
|
Новинка будет поставляться в комплекте с примерами кода, демонстрирующими, как наиболее эффективно использовать данные технологии в различных типовых сценариях работы. Такими сценариями являются, например, преобразование бумажного документа в PDF-файл с возможностью поиска, распознавание на уровне полей, архивирование с сохранением изображений и индексацией, полнотекстовое преобразование в RTF, полнотекстовое преобразование в HTML и др. Каждый пример представляет собой небольшую программу, которую можно скомпилировать, а затем изучить, как она работает. Приведены также описания оптимальных режимов использования пакета и типовые данные по скорости работы и качеству распознавания. Предполагается, что разработчики смогут пользоваться примерами в качестве шаблонов при создании своих собственных программ и решений. Кроме того, в SDK предусмотрена функция диагностики, позволяющая отследить все вызовы функций ABBYY FineReader Engine и измерить скорость их работы.
Руководитель службы продуктового маркетинга “ABBYY Россия” Дина Шелепина отмечает, что встраиваемые технологии распознавания ABBYY применяются во многих отечественных системах электронного архивирования и документооборота, а также в таких достаточно уникальных приложениях, как автоматизированная система коммерческого осмотра поездов и вагонов на железнодорожных объектах (АСКО ПВ), разработанная компанией “Альфа-прибор” и обеспечивающая (с помощью телекамер) контроль габаритности движущегося грузового состава и находящихся на нем грузов и контейнеров с последующим документированием информации (вплоть до автоматически распознанного номера вагона) и передачей ее в автоматизированную систему оперативного управления перевозками.
SDK, о котором шла речь, будет поставляться в виде набора динамически подключаемых библиотек (DLL). Важно также отметить, что используемый в нем интерфейс прикладного программирования поддерживает стандарт COM (Component Object Model) и позволяет создавать приложения в средах разработки Cи/C++, Visual Basic, Visual Studio.Net и любых других, поддерживающих COM-компоненты.
|