Вопросы с тегом 'ocr'

Вопросы, связанные с оптическим распознаванием символов (ocr)
7
ответов

Какое лучшее, самое простое решение для распознавания текста?

Я бы хотел отсканировать большое количество бумаг, которые я лежал, с наименьшими возможными хлопотами. Я хотел бы преобразовать их в образы с помощью простого сканирования, а затем преобразовать их в текст с помощью OCR. Есть ли хорошее приложе...
задан 05.12.2010 в 11:32
2
ответа

Как можно мгновенно извлечь текст из области экрана с помощью инструментов OCR?

В Ubuntu 12.10, если я набираю gnome-screenshot -a | tesseract output он возвращает: ** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11. Как я могу выбрать текст с экрана и преобразовать...
задан 12.04.2013 в 00:11
2
ответа

Как извлечь текст из изображений?

Как извлечь текст из изображений? Я не говорю о отсканированных файлах, а о садовых изображениях, например, когда вы снимаете высокоуровневую фотографию классной доски в классе, и это красиво написано; или когда вы фотографируете страницу из...
задан 31.08.2011 в 10:33
5
ответов

Добавление информации OCR в PDF-файл

У меня есть качественное сканирование документа; такое сканирование в формате pdf. Как добавить дополнительную информацию в pdf, чтобы она стала доступной для поиска? Под поиском я имею в виду, что цель заключается в том, что при просмотре pd...
задан 07.06.2012 в 10:56
4
ответа

Как превратить PDF в текстовый файл с возможностью поиска?

У меня есть несколько отсканированных документов в формате pdf, и я хочу, чтобы их можно было искать. Как я могу это сделать? По сути, мне нужно OCR pdf, а затем добавить извлеченный текст обратно в новый pdf. Я безуспешно пробовал ряд различ...
задан 29.05.2014 в 11:37
1
ответ

Как установить новый языковой пакет для Tesseract на 16.04

Просто установлен gscan2pdf v1.3.9, а также Tesseract. Что касается последнего, сначала он появился в нижней части моего списка Установленного программного обеспечения, но теперь он, кажется, исчез, хотя и работает (я думаю). В любом случае,...
задан 01.07.2016 в 18:37
2
ответа

управление документами частными пользователями

Я ищу систему управления документами, которая поддерживает: может распечатывать документы для сканирования документов автоматическое распознавание отсканированных документов хранилище данных на моем локальном HD / внешнем сервере по моем...
задан 19.03.2013 в 01:15
1
ответ

Как создать многостраничный сэндвич-файл pdf с hocr2pdf?

Я использовал tesseract для создания специального html для использования с hocr2pdf, начиная с мути-страницы tif. Я попытался использовать hoc2pdf для создания «сэндвич-файла PDF» (изображение + скрытый текстовый слой). Hocr2pdf создает од...
задан 22.03.2013 в 16:50
0
ответов

Как добавить текст OCRed в оригинальный pdf в gscan2pdf? [закрыто]

Я новичок в gscan2pdf 0.9.31 и просто использовал его для OCR отсканированного pdf. После сохранения pdf текст OCRed сохраняется в верхнем левом углу. Тем не менее, я хочу, чтобы каждый символ OCRed был добавлен точно, где он был OCRed, чтобы сд...
задан 10.05.2011 в 03:56
0
ответов

Конверсионные изображения pdf в текст

У меня есть 500-страничная версия PDF-книги 15-го века. Я хочу преобразовать его в один файл txt любого формата, чтобы иметь возможность работать с ним и / или экспортировать его в epub. Калибр не может обработать его. Я попытался его разу...
задан 18.05.2017 в 14:08