05.07.2019

Cognitive OpenOCR - Распознавание текста. Чем OCR CuneiForm отличается от других подобных программ? Ошибка во взаимодействии со сканерами


Программный инструмент для оптического распознавания символов, то есть программа для распознавания текста . Она была первоначально разработана в Cognitive Technologies и, после нескольких лет без развития, выпущен как бесплатное программное обеспечение 12 декабря 2007 года. Ядро системы распознавания было выпущено под открытым исходным кодом лицензии BSD в начале апреля 2008 года. Программа переведена на русский язык.

Особенности

Это Русско-английский двуязычный, Сербский, Словенский, Испанский, Шведский, Турецкий, и украинский текст.

Пользовательский интерфейс

Программу для распознавания можно использовать в качестве автономного приложения из командной строки, или в качестве фонового приложения с другими программами. Она поставляется с собственным графическим интерфейсом. Система распознавания текста может быть также использована в качестве двигателя OCR в OCRFeeder.

История

После того, как лидер программного обеспечения OCR в России, CuneiForm был в конкуренции с ABBYY FineReader.

В 1993 Cognitive Technologies подписала контракт OEM с Corel Corporation, которая позволила библиотеке Cognitive признания быть встроенной в популярный пакет публикации Corel Draw 3.0 (и последующие версии).

В 1996 году, OCR CuneiForm"96 был выпущен, который был первым пакетом OCR включающим адаптивный метод распознавания символов. Этот метод основан на сочетании двух видов печатных алгоритмов распознавания символов: multifont и omnifont. Это система самообучения способна распознавать плохо напечатанные символы, создавая внутренний шрифт, порожденную этими символами, которые были напечатаны достаточно хорошо, чтобы быть признанным. Таким образом, динамическая регулировка (адаптация) для конкретного ввода символов используется.

Вводные источники

Cognitive Technologies запустила программу, чтобы сделать OCR доступным для всех пользователей. Его первый шаг освобождал CuneiForm как бесплатное программное обеспечение.

Cognitive Technologies планирует начать развивать новую версию программного обеспечения как инвестор и координатор проекта. Разработчики выбрали лицензию BSD на выпуск, чтобы принять во внимание все юридические и технические нюансы, но целая программа или ее отдельные модули могут быть опубликованы позже лицензируемые под GPL.

В сентябре 2008 часть Cognitive была выпущена как общедоступное программное обеспечение. Одна из недостающих частей - анализ таблиц, однако Cognitive обещали выпустить этот компонент в будущем.

Название программы : OCR CuneiForm

Версия : 12

Размер : 33,4 Мб

Язык : несколько языков в т.ч. русский

Тип программы : распознавание текста

Лицензия : свободная с открытым кодом

Описание программы

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

OCR CuneiForm это:

  • высокое качество распознавания;
  • высокая скорость работы;
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
  • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
  • полное сохранение топологии страницы;
  • поддержка пакетного режима сканирования и распознавания;
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
  • встроенный текстовый редактор для работы с распознанным текстом;
  • совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Вопросы и ответы по программе

Что такое CuneiForm? CuneiForm - это система оптического распознавания крупнейшего российского разработчика программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах.

Для кого предназначена OCR CuneiForm? Система распознавания текстов CuneiForm предназначена для всех, кому приходится вводить в компьютер факсы, книги, газеты, машинописные страницы, тексты договоров и т.д. Для работы с системой достаточно положить страницу с текстом в сканер, нажать кнопку, и через несколько секунд Вы получите готовый результат в многофункциональном текстовом редакторе.

Какие шрифты распознает OCR CuneiForm, требуется ли обучение? CuneiForm - шрифтонезависимая (OmniFont) система. Алгоритмы, заложенные в CuneiForm, исходят из правил написания букв, из их топологии, и не требуют задания каких-либо эталонов, или обучения.

В системе используется технология интеллектуального самообучения на базе адаптивного распознавания символов.

Распознаются любые печатные шрифты - книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.

Не распознается рукописный текст и декоративные шрифты (готический, стилизованный под рукописный).

В CuneiForm существуют специальные настройки для распознавания текстов с матричного принтера и факсов 200x100 dpi.

Чем OCR CuneiForm отличается от других подобных программ?

  • качеством распознавания;
  • высокой скоростью работы;
  • использованием уникальных технологий, таких как адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и других;
  • простой использования и интуитивным интерфейсом;
  • функциональным наполнением, наличием многих дополнительных возможностей.

Поддерживает ли OCR CuneiForm работу с таблицами? Да. Программа автоматически находит в тексте таблицы различной структуры, в том числе без линий разграфки. Встроенный редактор поддерживает редактирование таблиц (можно уменьшать/увеличивать, удалять/создавать колонки и т.д.)

Как OCR CuneiForm отнесется к картинкам в тексте? Как пожелаете. Может просто проигнорировать их присутствие, а может сохранить в выходном документе в черно-белом, сером или цветном виде, в зависимости от вашего желания.

Ссылки для загрузки

  • Скачать установочную версию с depositfiles.

Информация взята с официального сайта программы

OCR CuneiForm сможет отсканировать и мгновенно распознать бумажную документацию по технологии Optical Character Recognition в редактируемые текстовые и табличные форматы, совместимые с Microsoft Office Word и Excel. Потом материалы лучше сохранить и редактировать в офисных пакетах, текстовых и табличных редакторах, аналогах Microsoft Word и Microsoft Excel. Программа распространяется "как есть", разработчики не несут ответственности в связи с возможными проблемами и могут отменить действие свободной лицензии для следующих версий, поэтому стоит поторопиться и последнюю версию OCR CuneiForm скачать бесплатно для Windows 10, 8.1, 8, 7, Vista, XP, Linux или Mac OS X. Экономить время с КьюниФорм разработчики предлагают по принципу: чем лучше отсканировать и распознать, тем быстрее исправить и получить готовый результат.

Применение в CuneiForm новых технологических достижений

В начале XXI века считалось, что нормально работающей альтернативы ABBYY FineReader не существует. Несмотря на существование различных программ для OCR распознавания текста, ABBYY FineReader прочно оставался в лидерах индустрии сканирования и оцифровки документов. Это продолжалось до тех пор, пока самые продвинутые пользователи не попробовали для полноценного распознавания сфотографированного или сканированного текста скачать OCR CuneiForm 12 бесплатно без регистрации и SMS и протестировать потенциал этой по-настоящему бесплатной проги для Виндовс. При этом оказалось, что возможности OCR CuneiForm не уступают ABBYY FineReader ни в чем.

OCR CuneiForm умеет мгновенно идентифицировать все стандартные символы всевозможных начертаний и шрифтового исполнения. Распознаванию поддаются книги, журналы, листовки, газетки, принт-листы, факсовые рассылки, неудачные ксероксные копии, тексты с древних пишущих машинок и прочее, исключая декоративный шрифт и рукопись. В программном коде CuneiForm применяется ряд уникальных инновационных технологий Optical Character Recognition, таких как: адаптивное распознавание с применением шрифтонезависимых инструкций, нейронно-аналитические сети нормализации, когнитивная аналитика альтернативных вариантов трактовки текста, спецалгоритмы для матричного принтера, некачественных результатов ксерокопирования, факсов и машинописных страниц и прочие. При необходимости использовать все это для дела всегда можно бесплатно скачать CuneiForm для Windows 10, 8.. CuneiForm способен воссоздать абсолютную копию исходника. Сохраняется форматирование и структурирование, отступы, колонтитулы, сноски, индексы, количество и размеры колонок, абзацы, расположение отдельных фрагментов текста, табличных элементов и иллюстраций, стили шрифтов и другие элементы шрифтового оформления.

Интерфейс, языки, словари и функционал ОСР КьюниФорм

OCR CuneiForm отлично узнает и оцифровывает документацию, удобна в работе и не создает проблем начинающим пользователям, поскольку обладает удобным русскоязычным интерфейсом, имеет встроенные советы и всплывающие подсказки. Для закачки и подключения доступны популярные графические интерфейсы для КьюниФорм: YAGF, OCR Feeder, CF-Qt, Puma и прочие. Стандартный графический интерфейс имеет все инструменты, необходимые для полноценного распознания сканированного или сфотографированного текста. Мультиязычный интерфейс на родном языке способствует ускорению понимания оператором принципов работы и расширению спектра используемых возможностей. В настройках доступно конфигурирование под распознавание символов на русском, инглише, русско-английском и еще 20-ти европейских языковых раскладках. Качество мгновенного распознавания повышается при использовании словарей, которые можно расширять, импортируя слова из словарных файлов.

Основные функциональные преимущества программы OCR CuneiForm:

  • достойное OCR распознавание и скорость работы,
  • автоподбор оптимальных настроек сканирования,
  • импорт отсканированных, сфотографированных или принятых иным путем картинок,
  • поворот, переворот, инверсия, очистка и прочее редактирование изображений,
  • несколько вариантов идентификации абзацев текста, таблиц и картинок,
  • в работу идет любой материал, исключая декор и рукопись,
  • словарная поддержка для улучшения качества,
  • сравнительная демонстрация исходников и символьных результатов,
  • OCR-совместимость со свыше двадцати языками, включая русский.

Бесплатность, множество преимуществ, скорость и отсутствие проблем в работе являются весомыми аргументами, чтобы скачать CuneiForm бесплатно на сайте сайт русскую версию. Использование высокотехнологичного гарантирует высококачественные скан и распознавание документации с бумажных носителей или растровых файлов в форматы, подходящие для редактирования в соответствующих редакторах.

Немного исторических фактов

Cognitive Technologies образовалась в 1993 г. на основе главного центра ИИ ИСА Российской Академии Наук. Как итог научно-практических исследований появилась первая CuneiForm. В конце 1993 года был подписан OEM-контракт с Corel Corporation, по которому код КьюниФорм вошел в пакет Corel Draw. В дальнейшем после многих лет перерыва компания освободила проект, перестав продавать и поддерживать программу, но программа КьюниФорм настолько хороша, что сегодня отсканировать и распознать русский текст лучше и дешевле всего получится, если бесплатно скачать OCR CuneiForm русскую версию на свой компьютер.

Вскоре этот программный продукт оказался одним из наиболее востребованных средств оптического распознавания текстов и заслужил позитивные отзывы и комментарии пользователей на официальном сайте cognitiveforms в домене com, тематических сайтах и форумах, а также в социальных сетях. Сегодня CuneiForm выделяется из массы прочего Optical Character Recognition программного обеспечения достойным распознаванием некачественной документации. Среди достоинств КуниФорма отмечены качественный перевод в цифровой вид бумажной документации и растровых файлов с экспортом в мультиформатный текст и таблицы Microsoft Office Word и Excel или их аналоги.

Ошибка во взаимодействии со сканерами

Сканирование на HP, Epson, Mustek, Canon и некоторых других черевато ошибкой. Причина данной проблемы обусловлена нюансами взаимодействия TWAIN-интерфейса с оборудованием. Лечится проблема простым редактированием строки с содержимым TWAIN_TransferMode в файле C:\Windows\face.ini до состояния: TWAIN_TransferMode=memory-native и перезапуском программы. Как правило, сегодня таких проблем не наблюдается, и чтобы получить из бумажного документа редактируемую электронную версию, нужно просто бесплатно скачать CuneiForm на русском языке с этой страницы сайта сайт без регистрации и СМС и использовать ее по прямому назначению. Это сбережет время и освободит от ручного набирания текста в Microsoft Word и таблиц в Microsoft Excel или аналогах этого ПО.

Последнюю версию CuneiForm 12 скачать бесплатно на русском языке

Бесплатные программы скачать бесплатно

Сейчас Вы находитесь на странице с названием "OCR КьюниФорм для полноценного распознавания сфотографированного или сканированного текста" сайта , где каждый имеет возможность легально скачать программы для компьютера с Microsoft Windows. Эта страница создана/существенно обновлена 10.09.2015. Спасибо, что посетили раздел .

Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader иCuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

Существует также системы On-line распознавания текста:Online OCR иABBYY FineReader Online

(http://www.onlineocr.ru , http://finereader.abbyyonline.com)

СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ ФОРМ

При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.

Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

OCR-ПРИЛОЖЕНИЯ

Это приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое распознавание символов

Это программы для перевода

изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш вскорости работы, к тому же делают меньше ошибок.Еще одно достоинство - возможность сохранить

иллюстрации, а они иногда не менее

OCR CUNEIFORM

Это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies.

OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский,

шведский, финский, сербский,Скачать бесплатно программу хорватский, польский, а также сканирования и распознавания распознавание смешанноготекста русско-английского текста.OCR Cuneiform 12 (freeware) с

http://depositfiles.com/files/sj9pt7q6x

ABBYY FINEREADER

Популярная программа распознавания текста российской компании ABBYY

Программа производит распознавание текста с более 180 языков , для38 из них предусмотрена встроенная проверка орфографии. Начиная с версииProfessional , распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числеDjVu – компактный формат для хранения отсканированных документов, книг.

Стоимость программы 3990 рублей

OMNIPAGE

Популярная программа распознавания текста российской компании ABBYY

Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами:латинский,

греческий алфавиты, кириллица, китайский, японский и корейский

языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения "3D Correction".

Стоимость программы 6090 рублей (150 евро)

READIRIS

Программа сканирования и распознавания текста

компании I.R.I.S.

Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки -

арабский, иврит, фарси (в версии Middle-East) и

японский, китайский, корейский (в версии Asian). Есть версия Readiris для

Macintosh.

Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и

DjVu.

MICROSOFT OFFICE DOCUMENT

Программа распознавания текста компании Microsoft

Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакетMultilingual User Interface (MUI).OCR

настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.

Стоимость программы входит в стоимость пакета MS Office.

Дата добавления обзора: 05.07.2009 г.

Информация об OCR CuneiForm:

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

OCR CuneiForm это:

  • высокое качество распознавания;
  • высокая скорость работы;
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
  • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
  • полное сохранение топологии страницы;
  • поддержка пакетного режима сканирования и распознавания;
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
  • встроенный текстовый редактор для работы с распознанным текстом;
  • совмещенный показ изображений и результатов распознавания.

Основные возможности OCR CuneiForm

1. ИНТЕРФЕЙС

Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.

2. СКАНИРОВАНИЕ

  • Автоматический подбор оптимальных параметров сканирования.
  • Возможность импортирования отсканированных или полученных через факс-модем графических файлов во многих форматах.
  • Обработка изображений: печать образа, инвертирование, поворот.

3. ФРАГМЕНТАЦИЯ

  • Автоматический и полуавтоматический режимы поиска блоков текста, таблиц и графики, который обеспечивает большую гибкость при работе с многоколоночными текстами и текстами сложной структуры и с графическими элементами.
  • Режим ручной фрагментации для работы с текстами особо сложной структуры.

4. РАСПОЗНАВАНИЕ

  • CuneiForm распознает любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, печатной машинки, плохих ксерокопий и факсов.
  • Самообучающиеся адаптивные алгоритмы распознавания повышают вероятность распознавания низкокачественных документов.

5. ЯЗЫКОВАЯ ПОДДЕРЖКА

Система распознает русский, английский, смешанный русско-английский, украинский, немецкий, французский, испанский, португальский, итальянский, голландский, датский, шведский, финский, сербский, хорватский, польский, казахский, узбекский и другие языки.

6. СЛОВАРНЫЙ КОНТРОЛЬ

  • Словарь общеупотребительной лексики каждого поддерживаемого языка для контекстной проверки и повышения качества результатов распознавания.
  • Возможность создания и пополнения пользовательского словаря, а также возможность экспорта/импорта словаря в/из текстовых файлов.

7. РЕАЛИЗАЦИЯ ПРИНЦИПА "What You Scan Is What You Get" ("Что Вы сканируете, то и получаете").

CuneiForm позволяет получить полную копию вводимого документа, включая:

  • Шрифтовое оформление и форматирование.
  • Расположение текста, иллюстраций и таблиц.
  • Колонки, абзацы, отступы, стили и размеры шрифтов.
  • Черно-белые, 256-градационные серые и цветные 24-битные иллюстрации в выходном RTF-файле.

8. РАБОТА С ТАБЛИЦАМИ

  • Распознавание таблиц различной структуры, в том числе и без линий разграфки.
  • Редактирование таблиц (уменьшение/увеличение, удаление/создание колонок и т.д.)
  • Сохранение результатов в распространенных табличных форматах.

9. РЕДАКТИРОВАНИЕ

В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.

  • Одновременная подсветка распознанного текста и исходного изображения, снабженная функцией "следующий/предыдущий сомнительно распознанный".
  • Поддержка иллюстраций, таблиц, колонок, колонтитулов, сложного форматирования и различных шрифтов.
  • Возможность редактирования текстовых документов популярных форматов.

10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ

Опции командной строки и поддержка Drag&Drop для вызова из внешних приложений, сканирования, распознавания и сохранения результатов в автоматическом режиме.

Скачать программу OCR CuneiForm (.zip-файл, 33,3 Мб.) Обратите внимание на вес файла!!!


© 2024
reaestate.ru - Недвижимость - юридический справочник