Como extrair e salvar imagens de um arquivo PDF no Linux

Vídeo: Como extrair e salvar imagens de um arquivo PDF no Linux

Vídeo: Como Usar o QuickTime Player  - O Guia Completo! - YouTube 2024, Maio

2024 Autor: Geoffrey Carr | [email protected]. Última modificação: 2024-01-12 05:17

Você pode facilmente converter arquivos PDF em texto editável no Linux usando a ferramenta de linha de comando “pdftotext”. No entanto, se houver imagens no arquivo PDF original, elas não serão extraídas. Para extrair imagens de um arquivo PDF, você pode usar outra ferramenta de linha de comando chamada “pdfimages”.

Observação: quando dizemos para digitar algo neste artigo e há citações ao redor do texto, não digite aspas, a menos que especifique o contrário.

A ferramenta “pdfimages” faz parte do pacote poppler-utils. Você pode verificar se está instalado no seu sistema e instalá-lo, se necessário, usando as etapas descritas neste artigo.

Para extrair imagens de um arquivo PDF usando pdfimages, pressione "Ctrl + Alt + T" para abrir uma janela do Terminal. Digite o seguinte comando no prompt.


pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Observação: para todos os comandos mostrados neste artigo, substitua o primeiro caminho no comando e o nome do arquivo PDF para o caminho e o nome do arquivo para o arquivo PDF original. O segundo caminho deve ser o caminho para a pasta raiz na qual você deseja salvar as imagens extraídas. A palavra "imagem" no final do segundo caminho representa o que você deseja introduzir seu nome de arquivo. Os nomes dos arquivos das imagens são numerados automaticamente (000, 001, 002, 003, etc.). Se você quiser adicionar texto ao início de cada imagem, insira esse texto no final do segundo caminho. Em nosso exemplo, cada nome de arquivo de imagem começará com “imagem”, como image-001.ppm, image-002.ppm, etc. Um traço é adicionado entre o texto especificado e o número.

O formato de imagem padrão é PPM (portable pixmap) para imagens não monocromáticas ou PBM (bitmap portátil) para imagens monocromáticas. Esses formatos são projetados para serem facilmente trocados entre plataformas.

NOTA: Você pode obter dois arquivos de imagem para cada imagem em seu arquivo PDF. A segunda imagem de cada imagem está em branco. Assim, você saberá quais imagens contêm as imagens do arquivo pela miniatura do arquivo no Gerenciador de arquivos.

Para criar arquivos de imagem.jpg, adicione a opção “-j” ao comando, conforme mostrado abaixo.


pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

NOTA: Você também pode alterar a saída padrão para PNG usando a opção “-png” ou TIFF usando a opção “-tiff”.

O arquivo de imagem principal de cada imagem é salvo como um arquivo.jpg. A segunda imagem em branco ainda é um arquivo.ppm ou.pbm.

Se você quiser converter apenas imagens em e após uma determinada página, use a opção “-f” com um número para indicar a primeira página a ser convertida, conforme mostrado no exemplo abaixo.


pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

NOTA: Combinamos a opção “-j” com a opção “-f” para obtermos imagens.jpg e fizemos o mesmo com a opção “-l” mencionada abaixo também.

Para converter todas as imagens antes e em uma determinada página, use a opção “-l” (um minúscula “L”, não o número “1”) com um número para indicar a última página a ser convertida, como mostrado abaixo.


pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

NOTA: Você pode usar as opções “-f” e “-l” para converter imagens em um intervalo de páginas específico no meio do documento.

Se houver uma senha de proprietário no arquivo PDF, use a opção "-opw" e a senha entre aspas simples, conforme mostrado abaixo. Se a senha no arquivo PDF for uma senha de usuário, use a opção “-upw” em vez da senha.

NOTA: Certifique-se de que há aspas simples em torno de sua senha no comando.


pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Como extrair e salvar imagens de um arquivo PDF no Linux

Vídeo: Como extrair e salvar imagens de um arquivo PDF no Linux

Recomendado:

Como usar a impressora do OneNote para extrair texto de imagens e PDFs

Freeware para extrair imagens de arquivos PDF

Adicione a opção Salvar como PDF ao seu site; Salvar arquivos htm como arquivos pdf

Como salvar e marcar várias imagens na Pesquisa de imagens do Google

Como salvar página da Web como arquivo PDF no navegador de borda no Windows 10

Onde está a chave de aplicativos localizada em um teclado padrão da Microsoft?

Como compartilhar seu smartphone, computador ou tablet com segurança com um visitante

Como estender a vida útil da bateria do seu tablet Android quando você não estiver usando

Como converter rapidamente uma lista de imagens em um arquivo PDF

Como limpar sua página de leitura mais distante no Kindle

Remova o ícone Java da bandeja do sistema

Shell Geek: renomear vários arquivos de uma só vez

Windows Home Server

Economize 1-4% Mais vida útil da bateria com o Windows Vista Battery Saver

Use o Controle dos Pais para filtrar sites no Windows Vista

Alterar Xbox Gamertag via aplicativo do Xbox no Windows 10

Remova o Crapware & Exorcize o novo PC Windows OEM antes de usá-lo

Arquivos indesejados no Windows 10: O que você pode excluir com segurança?

Como verificar a versão do PowerShell no Windows 10

Diminuir o tempo de carregamento dos aplicativos da área de trabalho do Windows