¡Saludos!
Nos emociona anunciar una nueva funcionalidad para Rocket Validator que creemos hará que tus informes de validación de sitios sean más precisos.
Como sabes, nuestro scraper encuentra e incluye automáticamente páginas web internas siguiendo enlaces. Sin embargo, si prefieres tener más control sobre las URLs incluidas en tus informes, puedes usar un sitemap XML o TXT con URLs específicas o desactivar el rastreo profundo para restringir el alcance.
A veces, sin embargo, puedes querer excluir ciertas URLs de tus informes, pero crear un sitemap de enlaces puede no ser factible. Por eso hemos introducido las exclusiones de rutas de URL. Ahora puedes definir rutas que quieras excluir de tus informes con facilidad.
Digamos que quieres ejecutar un informe de validación de sitio en el Github Blog, pero deseas excluir todas las URLs de “author” y “category” de ese informe específico. Es una tarea simple. Todo lo que necesitas hacer es incluir esas rutas en el formulario de Nuevo Informe como se muestra a continuación:
github.blog/author/
github.blog/category/
Las exclusiones de rutas pueden ser tan simples como una subcadena, como “author” para la primera URL y “category” para la segunda. Sin embargo, para evitar falsos positivos, recomendamos que incluyas el dominio también.
Una vez que defines las exclusiones y ejecutas el informe, el scraper omitirá automáticamente las URLs coincidentes y las excluirá del informe.
Puedes ver las URLs excluidas haciendo clic en el icono de signo de interrogación en el aviso mostrado sobre la lista de páginas web.
Puedes definir exclusiones en Schedules y también gestionarlas a través de la API. Las exclusiones también se incluyen cuando descargas informes como archivos de Excel.
¡Esperamos que esta funcionalidad te resulte útil y mejore tu experiencia con Rocket Validator!