Observação: quando dizemos para digitar algo neste artigo e há citações ao redor do texto, não digite aspas, a menos que especifique o contrário.
A ferramenta “pdfimages” faz parte do pacote poppler-utils. Você pode verificar se está instalado no seu sistema e instalá-lo, se necessário, usando as etapas descritas neste artigo.
Para extrair imagens de um arquivo PDF usando pdfimages, pressione "Ctrl + Alt + T" para abrir uma janela do Terminal. Digite o seguinte comando no prompt.
pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image
Observação: para todos os comandos mostrados neste artigo, substitua o primeiro caminho no comando e o nome do arquivo PDF para o caminho e o nome do arquivo para o arquivo PDF original. O segundo caminho deve ser o caminho para a pasta raiz na qual você deseja salvar as imagens extraídas. A palavra "imagem" no final do segundo caminho representa o que você deseja introduzir seu nome de arquivo. Os nomes dos arquivos das imagens são numerados automaticamente (000, 001, 002, 003, etc.). Se você quiser adicionar texto ao início de cada imagem, insira esse texto no final do segundo caminho. Em nosso exemplo, cada nome de arquivo de imagem começará com “imagem”, como image-001.ppm, image-002.ppm, etc. Um traço é adicionado entre o texto especificado e o número.
NOTA: Você pode obter dois arquivos de imagem para cada imagem em seu arquivo PDF. A segunda imagem de cada imagem está em branco. Assim, você saberá quais imagens contêm as imagens do arquivo pela miniatura do arquivo no Gerenciador de arquivos.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image
NOTA: Você também pode alterar a saída padrão para PNG usando a opção “-png” ou TIFF usando a opção “-tiff”.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image
NOTA: Combinamos a opção “-j” com a opção “-f” para obtermos imagens.jpg e fizemos o mesmo com a opção “-l” mencionada abaixo também.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image
NOTA: Você pode usar as opções “-f” e “-l” para converter imagens em um intervalo de páginas específico no meio do documento.
NOTA: Certifique-se de que há aspas simples em torno de sua senha no comando.
pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image