Skip to main content

Excluir URLs

por Jaime Iniesta

Saudações!

Temos o prazer de anunciar uma nova funcionalidade para o Rocket Validator que acreditamos que tornará os seus relatórios de validação de site mais precisos.

Como sabe, o nosso scraper encontra e inclui automaticamente páginas web internas seguindo links. No entanto, se preferir ter mais controlo sobre os URLs incluídos nos seus relatórios, pode usar um sitemap XML ou TXT com URLs específicos ou desativar o crawling profundo para restringir o âmbito.

Por vezes, no entanto, pode querer excluir determinados URLs dos seus relatórios, mas criar um sitemap de links pode não ser viável. É por isso que introduzimos exclusões de caminho de URL. Agora pode definir caminhos que pretende excluir dos seus relatórios com facilidade.

Digamos que quer executar um relatório de validação de site no Github Blog, mas deseja excluir todos os URLs de “author” e “category” desse relatório específico. É uma tarefa simples. Tudo o que precisa de fazer é incluir esses caminhos no formulário New Report conforme mostrado abaixo:

github.blog/author/
github.blog/category/

As exclusões de caminho podem ser tão simples como uma substring, tal como “author” para o primeiro URL e “category” para o segundo. No entanto, para evitar falsos positivos, recomendamos que inclua também o domínio.

Screenshot do formulário New Report com exclusões definidas

Uma vez que defina as exclusões e execute o relatório, o scraper irá automaticamente ignorar os URLs correspondentes e excluí-los do relatório.

Screenshot da lista de páginas web onde alguns URLs foram excluídos.

Pode ver os URLs excluídos clicando no ícone do ponto de interrogação no aviso apresentado sobre a lista de páginas web.

Screenshot do modal com URLs excluídos

Pode definir exclusões em Schedules e também geri-las através da API. As exclusões também estão incluídas quando você descarrega relatórios como ficheiros Excel.

Esperamos que esta funcionalidade lhe seja útil e melhore a sua experiência com o Rocket Validator!

Pronto para validar os seus sites?
Comece o seu teste gratuito hoje.