Есть ли Pdf-ридер с регулярным выражением

10

Когда я хочу найти snipet, например searchPart1, какой-то неизвестный текст searchPart2 в текстовом файле, я использую searchPart1.*searchPart2 . Но это невозможно в любом PDF-читателе, который я использую. В настоящее время я конвертирую pdf в текстовый файл и открываю его с помощью less или geany , а затем использую регулярное выражение, доступное на нем.

Есть ли считыватель Pdf с поиском регулярных выражений, отличным от командной строки pdfgrep

    
задан totti 26.02.2013 в 09:04
источник

1 ответ

8

pdfgrep , в репозиториях, это не совсем читатель и требует использования терминала, но он устраняет необходимость сначала преобразовать PDF-файл в текстовый файл, а затем открыть его в способный текстовый редактор:

В дополнение к функциям, перечисленным в Synaptic, вы можете искать несколько файлов и рекурсивно. Одно большое отличие от обычного grep состоит в том, что pdfgrep не содержит номера строк, а номера страниц. man pdfgrep имеет детали.

Простой пример:

pdfgrep -in PATTERN FILENAME

Здесь i для нечувствительности к регистру, а n дает номер страницы, не номер строки.

Пример вывода выглядит так:

Существует короткое видео YouTube, Pdfgrep - поиск текста внутри файлов PDF - Linux CLI .     

ответ дан user25656 26.02.2013 в 14:20