Оптическое распознавание символов для LibreOffice

2

У меня есть бумажный документ. Есть больше страниц, содержащих таблицу с тремя столбцами (текущий номер, имя и класс).

Я просмотрел его и получил 16 jpeg-документов. Каждая jpeg - это отсканированная страница.

Теперь мне нужно OCR для преобразования каждого jpeg в текст, чтобы вставить эту таблицу в документ excel.

Я использую LibreOffice и Ubuntu 12.04.     

задан Mihaita 03.07.2013 в 16:14
источник

2 ответа

4

Страница Сканирование и OCR на веб-сайте Ubuntu Apps нам несколько альтернатив, из которых я предлагаю вам использовать программу сканирования изображений XSane или Простая проверка (обычно предварительно установленная в 12.04 и, возможно, более ранние версии) и / или < href="https://apps.ubuntu.com/cat/applications/precise/gscan2pdf/"> gscan2pdf , чтобы проверить ваши документы.

Мой любимый gscan2pdf , который позволяет без проблем отслеживать процесс сканирования / распознавания в том же графическом интерфейсе.

Обратите внимание, что я пытаюсь запустить OCR на скриншот.

Вы просто сканируете или импортируете документы / изображения и переходите в меню «Инструменты», выбираете опцию «OCR», и вас попросят создать OCR Engine, просто выберите тот, который дает наилучшие результаты для вас, и нажмите «Начать распознавание» ».

Вы найдете вывод OCR на вкладке с тем же названием, что и на следующем скриншоте.

Обратите внимание, что даже с изображениями хорошего качества OCR может не интерпретировать определенные символы, что может привести к ошибкам или просто египетским иероглифам. Процесс OCR большого набора документов может затянуться на некоторое время.

Вот ссылка на всеобъемлющее видео, которое объясняет процесс сканирования и распознавания в GScan2PDF: Ссылка

Удачи!

    
ответ дан Geppettvs D'Constanzo 03.07.2013 в 20:51
2

Немного поздно ответить на этот вопрос.

Но для других, которые приходят на эту страницу для поиска решения OCR для LibreOffice, я недавно разработал LibreOCR, плагин OCR для LibreOffice.

Это часть проекта Indic-OCR .

Теперь расширение можно найти на странице LibreOffice Extensions

    
ответ дан RKVS Raman 12.12.2016 в 10:04