Consulta cuales son las páginas que Google incluye de tu sitio en su índice y los posibles problemas que se pueden detectar.
Podemos desgranar este informe en 4 grandes estados:
- Error: la página no está indexada.
- Error del servidor (5xx): tu servidor ha devuelto un error 5xx cuando se ha solicitado la página.
- Error de redirección: Se ha experimentado algún error de redirección, una cadena de redirección que era demasiado larga, un bucle de redirección, una URL de redirección que superaba la longitud máxima de URL, o bien una URL incorrecta o vacía en la cadena de redirección.
- El archivo robots.txt ha bloqueado la URL enviada: Si bien Google no rastrea ni indexa el contenido que se haya bloqueado con un archivo robots.txt, puede que encuentre e indexe URLs bloqueadas si hay enlaces a ellas en otros sitios de la Web.
- No se ha podido encontrar la URL enviada (404): has enviado una URL que no existe para indexarla.
- La URL enviada devuelve un soft 404: has enviado una página para indexarla, pero el servidor ha devuelto lo que parece ser un error soft 404.
- La URL enviada devuelve una solicitud no autorizada (401): has enviado una página para indexarla, pero Google ha obtenido una respuesta 401 (no autorizada).
- La URL enviada devuelve el error 403: se necesita tener autorización para acceder a la URL enviada, pero Google no tiene credenciales suficientes.
- La URL enviada se ha bloqueado debido a otro problema de tipo 4xx: cuando se ha intentado acceder a la URL enviada, el servidor ha devuelto un código de respuesta 4xx que no está cubierto por ninguno de los problemas anteriores.
- Advertencia: la página está indexada, pero tiene algún problema que debes tener en cuenta.
- Se ha indexado, pero un archivo robots.txt la ha bloqueado: la página se ha incluido en el índice aun estando bloqueada por el archivo robots.txt de tu sitio web.
- La página se ha indexado sin contenido: esta página aparece en el índice de Google, pero Google no ha podido leer su contenido.
- Excluidas: la página no está indexada, pero Google cree que esa es la intención. Por ejemplo, es posible que hayas excluido intencionadamente con una directiva noindex o que sea un duplicado de una página canónica de tu sitio que ya se ha indexado.
- Excluida por una etiqueta «noindex». Al intentar indexar la página, Google ha encontrado una directiva «noindex» y, por lo tanto, no la ha incluido en su índice.
- Bloqueada por una herramienta para eliminar páginas. La página está bloqueada por una solicitud para eliminar la URL.
- Bloqueada por robots.txt. Se ha impedido que el robot de Google acceda a la página con un archivo robots.txt.
- Bloqueada por una solicitud no autorizada (401). El robot de Google no ha podido acceder a la página debido a una solicitud de autorización 401.
- Rastreada: actualmente sin indexar. Google ha rastreado la página, pero no la ha indexado.
- Descubierta: actualmente sin indexar. Google ha encontrado la página, pero todavía no la ha rastreado.
- Página alternativa con etiqueta canónica adecuada. La página es un duplicado de otra que Google considera canónica y, además, redirige correctamente a esa página. No tienes que hacer nada.
- Duplicada: el usuario no ha indicado ninguna versión canónica. La página tiene duplicados, pero ninguno se ha marcado como canónico. Google cree que esa página no es la canónica.
- Duplicada: Google ha elegido una versión canónica diferente a la del usuario. Se ha indicado que esa página es la canónica de un conjunto de páginas, pero Google considera que debería serlo otra URL. Google no ha indexado esa página, sino la que considera canónica.
- No se ha encontrado (404). La página ha devuelto un error 404 al solicitarse. Google no ha descubierto esa URL mediante ninguna solicitud explícita ni ningún sitemap.
- Página con redirección. La URL es una redirección, por lo que no se ha añadido al índice.
- Soft 404. Cuando se solicita la página, se devuelve lo que Google considera que es una respuesta soft 404.
- Duplicada: la URL enviada no se ha seleccionado como canónica. La URL forma parte de un conjunto de URL duplicadas en la que no hay ninguna que se haya marcado como canónica.
- Se ha bloqueado debido a que el acceso no está permitido (403). No se le ha dado acceso a Google.
- Se ha bloqueado debido a otro problema de tipo 4xx. El servidor ha detectado un error 4xx que no está incluido dentro de los anteriores problemas.
- Válidas: la página está indexada.
- Enviada e indexada: Se ha enviado la URL para indexar y se ha incluido en el índice.
- Indexada, no enviada en sitemap: Google ha descubierto la URL y la ha indexado.
Con todos estos datos y las tipologías de los mismos podemos saber cuales son las acciones necesarias que tenemos que tomar para mejorar el SEO de nuestro sitio.
¿Todavía no miras el informe de cobertura de tu sitio en Search Console? A que está esperando.