Contenido duplicado y Google

Adam Lasnik (otro Matt Cutts) explica en el weblog oficial para webmasters de Google algunas cuestiones y consejos referidos al contenido duplicado en Google.
(Si no te fías de mi traducción chapucera, puedes leer la fuente original)

Qué es el contenido duplicado ?
El contenido duplicado se refiere a bloques de contenido significativo, dentro o entre dominios, que son completamente idénticos o muy similares. La mayoría de las veces no es intencionado o al menos no tiene un fin malicioso: foros o blogs con versiones para móviles, productos de tienda online con múltiples distintas urls… En algunos casos el contenido es duplicado entre dominios con la intención de manipular los resultados de búsqueda o aumentar el tráfico vía búsquedas populares o búsquedas residuales (long tail).

Qué no es contenido duplicado ?
Por ejemplo no consideramos contenido duplicado un mismo artículo escrito en inglés y español. Tampoco es considerado contenido duplicado pequeños fragmentos, referencias textuales de textos ajenos y similares.

Porqué Google se preocupa por el contenido duplicado?
Nuestros usuarios quieren ver contenido diverso cuando realizan una búsqueda. En contraste, es entendible que se molesten cuando encuentran el mismo contenido en diferentes páginas dentro de una misma búsqueda. También, los webmasters se preocupan cuando mostramos una url compleja (example.com/contentredir?value=shorty-george?=en) en vez de una url «más bonita» (example.com/en/shorty-george.htm).

Qué hace Google respecto a este tema?
Durante el rastreo y cuando servimos resultados de búsqueda, intentamos indexar y mostrar páginas con información única.
El filtro significa, por ejemplo, que si tu web tiene artículos en «formato estandar» y en versión para impresión y ninguna de ellas está bloqueada desde el robots.txt o vía el meta tag noindex, nosotros elegiremos una versión para ser listada.
En los casos raros en los cuales notamos que el contenido duplicado está siendo utilizado con la intención de manipular los rankings o engañar a los usuarios, también realizaremos los ajustes necesarios en el index y en el ranking de las webs implicadas. Sin embargo, preferimos centrarnos en filtrar más que en ajustes en el ranking…. por tanto, en la inmensa mayoría de ocasiones, lo peor que puede ocurrirle a un webmaster es que elijamos la «versión menos deseada» de una página en nuestro index.

Cómo puede un webmaster evitar problemas por contenido duplicado?
Bloquear apropiadamente: Ayuda a google a elegir la mejor versión de tus documentos. Bloquea las versiones duplicadas.
Utiliza 301s: Si reestructuras tu web, utiliza redirecciones 301 («Redirección permanente») en tu archivo .htaccess para redireccionar elegantemente a tus usuarios, a googlebot y a otras arañas.
Se consecuente: Utiliza siempre la misma versión de url para tus enlaces internos; no uses /pagina/ , /pagina y /pagina/index.html. En online.com.es explican una posible solución.
Utiliza TLDs: Para ayudarnos a elegir la mejor versión de un documento, utiliza dominios de primer nivel cuando sea posible para organizar el contenido para diferentes países. Un dominio .de nos sugiere que está enfocado a usuarios alemanes, mientras que un /de o de.ejemplo.com no nos ofrece tantas pistas (Lasnik puntualiza en wmw que si ya tienes un .com posicionado Google ya se encargará de averiguar la lengua de los documentos)
Sindica con cuidado: Si sindicas tus contenidos en otras webs, cerciórate de que incluyen un link a la versión original de cada artículo sindicado. Incluso con eso, ten en cuenta que elegiremos la versión más apropiada a los usuarios para cada búsqueda, lo que significa que para determinadas búsquedas podría aparecer la copia sindicada.
Utiliza la opción de dominio preferido en las herramientas para webmasters: Si otras webs enlazan con la versión www y la versión no-www de tu dominio, puedes hacernos saber cual de las dos versiones prefieres que indexemos.
Minimiza las repeticiones de texto: Por ejemplo, en vez de incluir un largo texto de copyright en la parte baja de cada documento, incluye un breve resumen y enlaza a una página con más detalles.
Evita páginas sin contenido: A los usuarios no les gusta encontrarse con páginas vacias, por tanto evita páginas que solo contienen la plantilla de tu web. Esto significa no publicar (o por lo menos bloquear) páginas sin reseñas, sin listados de pisos en venta para cierta zona, etc…
Entiende como funciona tu CMS: Comprende como se muestra el contenido de tu web, particularmente si éste incluye un blog, foro, o sistemas similares que muchas veces muestran el mismo contenido bajo diferentes formatos.
Dont worry be happy: No te ofusques demasiado con webs (planetas y similares) que duplican tu contenido. Siendo algo molesto, es difícil que estos sitios impacten negativamente el posicionamiento de tu web en google (aunque también podéis hacer caso a especialistas en posicionamiento). Si encuentras algún caso especialmente frustrante, puedes rellenar una petición DMCA para reclamar la autoría de cierto contenido.

Registra tus dominios con Google

Según comenta AP Google se unirá a las miles de webs que ofrecen servicios de registro de dominios. El servicio lo ofrecerán mediante un acuerdo con GoDaddy y eNom. Google cobrará 10$ de cuota anual por cada dominio registrado (únicamente .com, .net, .biz y .info). Las webs que registren sus dominios vía Google estarán configuradas para poder trabajar con Gmail y otros productos de Google.

Google ya era registrador oficial de dominios. Lo que ahora parece es que lo pondrá en práctica…. veremos.

via TW

Actualizado:
Comunicado de prensa de Google (vía)

Buscador de patentes de Google (USA)

Google anuncia el lanzamiento del buscador Google Patents, que permite buscar las patentes estadounidenses del 1790 hasta mediados del 2006 (unas 7 millones de patentes). Google no ha inventado nada con esto, puesto que hasta ahora la oficina de Patentes y Marcar de EEUU ya contaba con un servicio similar (patentes aún no concedidas) o este otro servicio con 60 millones de patentes de 76 países (+servicios de búsqueda de patentes).
Google ha utilizado la tecnología de escaneo utilizado en Google Books para obtener una base de datos con el contenido completo de todas las patentes (desde 1976). Por ejemplo este traje contra tiburones.

via SEL

Queremos un Matías Cortés

Esta semana veo a Matt Cutts por todos lados (está solo en casa) respondiendo a dudas, preguntas y cuestiones relacionadas con Google. Y no solo él, están también el Lasnik, la Fox y otros cuantos googlers regalando cortesía entre bloggers anglos. Y ahí estamos nosotros, la comunidad seo hispana, dejados de la mano de dios. Nadie desde Google nos responde, y no solo a dudas sobre el buscador, encontrar una respuesta sobre Adsense o Adwords también suele ser un camino de espinas con su bonito 301 desde torre picaso a irlanda.

Es lógico que tengan una mayor atención que el resto de lenguas, es una empresa yanki y la mayoría no conoce el idioma de Cervantes, pero hasta cierto punto. Seguro que hay decenas de hispanos en Googlelandia capacitados para atender a la comunidad hispana.

Yo me conformo con contar con algún interlocutor online, aunque sea desde las oficinas españolas. Me da igual que no dominen del todo el tema, pero por lo menos podría estar en contacto con Matt y compañía para resolver dudas. Por ejemplo con MSN (live) podemos hablar con Ismael Elqudsi, al que podemos consultar cualquier duda y seguro que el la puede trasladar (en caso de desconocerla) a sus colegas de msnlandia.

Tanto cuesta esto ? Hey Matt, we want our Matías Cortés for de hispanic seo community.
(si lo enlazamos unos 100 quizás se de por enterado)

SpamReport Plugin para Firefox

Si eres un spamreporter compulsivo, este plugin te vendrá de perlas. Una vez instalado, aparece un icono junto a la barra de direcciones que puedes pulsar cuando veas en las serps de google alguna web de la competencia que esté haciendo algo que «no debería». Rellenas el formulario y listo, eliminas el spam (Site Positioned Above Mine) haces un favor a la comunidad y mejoras el gran buscador.
Si no toman en serio tu spam report en google, tampoco lo tomes como tiempo perdido, según el último informe de la Escuela Superior de Psicólogos SEO de Massachusetts los spam reports ayudan a la estabilidad psicológica del trabajador SEO.

La navidad llega a Google.es

Comentabamos hace un par de días que ya se estaba hablando de una posible actualización en Google para estas fechas navideñas. Decíamos también que «los regalos navideños» aún no habían llegado a hispania.
Hoy ya podemos decir que algo se está moviendo en las serps hispanas. Hablar de una gran actualización es complicado, pero está claro que muchas webs están saliendo del sandbox o mejorando muchas posiciones de repente.

Como siempre ocurre, a muchos les beneficiará bastante esta actualización y a otros muchos les perjudicará algo, al llegar más competencia. Veremos como evoluciona esto en días sucesivos…

También lo comentan en com.es

Actualización de navidad en google

Como el año pasado, llegadas estas fechas se empieza a especular sobre la famosa actualización que por navidad nos suele obsequiar Google.

– Se habla en SER , en TW y en WMW

Si cualquiera de vuestras webs (o de clientes) bajan posiciones, ya teneis excusa….

Actualización:
Parece que tampoco quieren porno por navidad….
Esto no parece haber llegado a hispania, pero todo se andará… aunque al no prestar demasiada atención a googles regionales igual se salvan los pornomasters hispanos.