Переименование файла PDF в соответствии с метаданными?

7

Есть ли что-то, что я могу использовать для переименования файлов PDF в соответствии с их содержанием? В основном эквивалент Ссылка в Ubuntu.

    
задан user13107 12.03.2013 в 08:54
источник

4 ответа

4

Если вам удобно с python , вы можете использовать скрипт на Ссылка . Я только что протестировал сценарии, которые он предоставляет (для начала, вы можете pip install pdfminer ), и они работают хорошо. Результат, который они дают, - это что-то вроде:

[{'ModDate': "D:20050422142709+02'00'", 'CreationDate': "D:20050422142709+02'00'", 'Producer': 'Mac OS X 10.3.8 Quartz PDFContext', 'Creator': 'Word'}]

Этот вывод можно использовать для переименования ваших файлов.

    
ответ дан don.joey 12.03.2013 в 09:11
источник
3

Есть еще одна альтернатива. Вы можете sudo apt-get install pdftk . С помощью этой библиотеки вы можете запустить команду, например pdftk myfile.pdf dump_data , которая приводит к чему-то в наборе info и value :

InfoKey: Creator
InfoValue: Word
InfoKey: Producer
InfoValue: Mac OS X 10.3.8 Quartz PDFContext
InfoKey: ModDate
InfoValue: D:20050422142709+02'00'
InfoKey: CreationDate
InfoValue: D:20050422142709+02'00'
PdfID0: d7af25c8df737276d8d6b5de49d94d92
PdfID1: d7af25c8df737276d8d6b5de49d94d92
NumberOfPages: 58

Снова вы можете использовать эту информацию в сценарии переименования. Если вы чувствуете, что последнее лучше всего настроено, потому что это зависит от того, хотите ли вы просто заголовок, автор-автор или что-то еще.

Источник

    
ответ дан don.joey 12.03.2013 в 09:45
3

Этого очень легко достичь с помощью exiftool .

Например, следующая команда переименовала бы все файлы в текущем каталоге в <title>.extension :

exiftool '-filename<$title.%e' .

Вы можете установить exiftool на Ubuntu с помощью:

sudo apt-get install libimage-exiftool-perl

Для получения дополнительной информации обратитесь к официальной документации:

Ссылка

    
ответ дан Glutanimate 13.08.2014 в 22:57
0

Если вы ищете готовое решение и ваши PDF-файлы носят академический характер, вы можете попробовать Zotero , плагин Firefox.

К сожалению, это требует нескольких шагов, каждый из которых может быть немного медленным, если вы пытаетесь работать с большим количеством файлов PDF одновременно:

  1. Перетащите ваши PDF-файлы в Zotero.
  2. Щелкните правой кнопкой мыши их для извлечения метаданных (и автоматически загрузите библиографическую информацию).
  3. Если файлы были распознаны правильно, щелкните их правой кнопкой мыши, чтобы автоматически переименовать.
  4. Экспортируйте или переместите переименованные файлы там, где они вам нужны.

Ответ на аналогичный вопрос о суперпользователях показывает, как сделать то же самое, используя Mendeley . В Zotero этот процесс можно дополнительно автоматизировать с помощью Zotfile . Наконец, вот обширный список потенциально полезных инструментов в этом направлении.     

ответ дан Brian Z 09.03.2015 в 09:00