Indexacion desde Google

Google ha indexado correctamente mi sitio

Muchas veces tras estar horas y horas trabajando en nuestro site podemos encontranos con el inconveniente de no saber si google está indexando correctamente nuestro Site. El saber si está indexado o no es complejo. Deja que desde Alemarsoft podamos ayudarte.

La manera más sencilla de saber si google está indexando  correctamente nuestro Site es comprobar qué información tiene en la Cache Google de tu página para ello basta con que indiquemos lo siguiente en la barra de búsqueda:

cache: www.TU-dominio.com

Con ello mostrará información como la siguiente

Información que vuelca google de la cache que tiene almacenada del site

 

Información importante que aparece en esta página:

  • fecha en la que ha sido indexada la página
  • podemos ver la página en solo texto para entender que puede ver google

Además nos interesaría saber también el número de páginas que tiene el site ¿Es este número correcto? Para ello basta con que ejecutemos lo siguiente:

Site:www.TU-dominio.com

Esto nos mostrará un número como el siguiente:

 

Información del numero de paginas que tiene google de nuestro Site

¿Son correctas el número de páginas del Site? A partir de este número tenemos que trabajar en tres posibles escenarios:

 

  • Google nos presenta más o menos el mismo número de páginas que tenemos controladas. Todo está correcto y no tenemos que preocuparnos por ello.
  • Google indica menos páginas de las que nosotros tenemos controladas
  • Google confirma más páginas de las que nosotros tenemos controladas

 

Google indica menos páginas de las que nosotros tenemos controladas

En el caso de que google presente menos número de páginas de las que tendría que haber seguramente es porque existe algún tipo de bloqueo. Puede existir un problema con ficheros como robots.txt u otro tipo de problemas. Si consideras necesario que podamos ayudarte no dudes en contactar con Alemarsof par que podamos ayudarte.

No obstante una forma sencilla de indicar en el fichero de robot.txt que no indexe las páginas de la zona privada (por ejemplo las de administración de Wodpress) seria mediante el siguiente comentario dentro del fichero.

 

User-agent:*
Disallow: /wp-admin

 

Deberíamos comprobar previamente que no hemos ejecutado alguna anotación previa en el fichero que esta imposibilitando el acceso a todo el Site. para ello revisa si por ejemplo,hay algo similar a esto en tu fichero robots.txt. Si es así ya has detectado la fuente del problema.

User-agent: *
Disallow: /

 

Este fichero robots.txt también puede sernos útil para indicar dónde se encuentra nuestro sitemap añadiendo en la última línea del documento.

En el caso  de WordPress se vería así:

User-agent: *
Disallow: /wp-admin
Sitemap: http://www.TU-dominio.com/sitemap.xml

 

Google confirma más páginas de las que nosotros tenemos controladas

Seguramente estarás ante un problema de contenido duplicado. Es muy posible que ciertas paginas se están indexando con más de una URL. Esto es un problema importante ya que esto seguramente estará o empezará  a penalizar sobre tu PageRank. También puede deberse a que haya cierto contenido de paginas privadas que Google está indexando de tu Site. Esto como se comento anteriormente se solventaría con la solución de Robots.txt.

Hay tres principales motivos de contenido duplicado en un Site:

  • “Canonicalización” de la página
  • Parámetros en la URL
  • Paginación

“Canonicalización” de la página

Esto se presenta cuando nuestra página tiene mas de una entrada.  En concreto puede aparecer cuando tenemos por ejemplo sobre la misma entrada:

  • TU-dominio.com
  • www.TU-dominio.com
  • TU-dominio.com/index.html
  • www.TU-dominio.com/index.html

Dado que tenemos cuatro posibles alternativas hay que indicar a google cual es la pagina que tiene que posicionar , primero para ayudarle y segundo porque quizá no sepa cual posicionar correctamente y este posicionando la que no sea correcta.

Para ello existen a priori tres posibles fuentes de problema

  • Ejecutar una redirección en el servidor para podernos asegurar que sólo existe una página que se muestre a los usuarios
  • Definir qué subdominio queremos que sea el principal (“www” o “no-www”).
  • Añadir la etiqueta “rel=canonical” en cada versión antes señaladas que apunte a las que se considera la correcta.

Parámetros en la URL

Dentro de las URLs sobre todo de ecommerce existen un montón de parámetros que google interpreta como paginas distintas pero que lo unico que sirven es para hacer ordenaciones o filtros de la misma página.

www.TU-dominio.com/camisetas?color=negro&precio-desde=10&precio-hasta=20&talla=XXL.html

Como solución quizá lo mas razonable es incluir referencias “rel=canonical” hacia la página principal, de esta forma google no las interpretará como páginas duplicadas.

 

Paginación

Cuando tenemos contenido como pueden ser las catagorias de un ecommerce, listado de productos, ,entradas en un blog que ocupan de mas de una página esto también se puede considerar contenido duplicado. Para ello lo mejor es utilizar las etiquetas de “rel=next” y “rel=prev”  de esta forma google está indexando todas las paginas como un todo. Para ello lo que ha que hacer es:

 

  • Arrancar incluyendo la etiqueta “rel=next” en la primera página
  • Incluir las otras dos etiquetas “rel=prev” y “rel=next” en todas las páginas intermedias
  • Finalizar incluyendo  la etiqueta “rel=prev” en la ultima página

 


Si tienes interés por ampliar mas información al respecto o necesitas que te echemos una mano en tu proyecto, no dudes en contactarnos mediante nuestro formulario de contacto de Digital – Grupo Alemarsof.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *