Dica: Extrair tabelas de página web com Table Capture (extensão de navegador)

Edit [08.10.2020]: Na data de hoje, descobri que o autor da extensão está cobrando-a pelo seu uso (que pode ser feita de forma gratuita por alguns dias, mas depois é cobrado). Para utilizá-la de forma gratuita (sem ser Pro), pode instalar uma versão anterior a 30.07.2020 que pode ser encontrada neste site

Pessoal, uma dica rápida nesta semana para quem sofre com o problema de alguns sites não disponibilizarem um download fácil de tabelas e apenas mostrarem direto na página Web, em HTML.

Veja a seguinte página Web:

É possível ver que estamos deparados com uma tabela que, infelizmente, não possui disponibilidade de download em formato .xls ou .xlsx.

Como consumir informação desta página e utilizá-la no PowerBI, por exemplo?

Uma das maneiras mais fáceis de fazer isso, é utilizando um plugin chamado Table Capture (disponível para Edge, Chrome e Firefox)

Neste tutorial estarei utilizando a versão para Edge.

Após a instalação super simples, acesse a tabela que você quer ler (mas primeiro veja se a extensão está carregada).

Quando a extensão identificar uma tabela na página, o ícone ficará vermelho. Caso não encontre, estará preto.

Mas calma, não clique nele ainda. Vá na página Web e clique com o botão direito em algum lugar onde esteja a tabela. Depois clique em Table Capture -> Launch Workshop

A extensão irá tentar identificar a tabela e mostrar no formato a seguir:

A versão gratuita permite apenas copiar para a área de transferência ou exportar para o Google Sheets. Vamos utilizar esta última opção. Irá abrir uma nova página e apenas faça o que se pede: Dê Ctrl+V na primeira célula para colar as informações.

Prontinho, basta baixar em formato .xlsx (ou .csv) e importar o arquivo gerado para o seu projeto no PowerBI.

É claro que este não é o formato ideal de alimentação de um relatório por conta de ser um processo totalmente manual, entretanto já deve dar uma boa ajuda para quem deseja extrair informações destes sites em um primeiro momento. Para algo mais automatizado, recomendo ir um pouco além com o Selenium, mas isso é assunto para um outro post.

Abraços!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *