Los anchor títulos de páginas excluídas

Google ha modificado el trato que da a los títulos de las páginas que no puede/debe visitar su bot pero que añade a las serps (ej. resultados de algún buscador). Siempre ha habido esta polémica de porqué lista unas páginas que los webmasters excluyen mediante el robots.txt. No las visita con su bot, no las cachea, pero si tienen enlaces hasta ahora las listaba añadiendo como título la url.

Desde hace algunos días, el título de este típo de páginas viene dado por el anchor de los enlaces que apuntan a ellas. De este modo podemos manipular los títulos de otras páginas mediante enlaces.

Por ejemplo, hace poco, en este post puse un enlace a los resultados de Google Trends. Este tipo de urls están marcadas como disallow en el robots.txt de Google. Vemos como en las serps el título de la página es el anchor que le puse.

Podemos ver por ejemplo:
Páginas de resultados de google en google
Páginas de resultados de live en google

Si tenemos un enlace a una página incluída en algún robots.txt, no hay problema. Pero, cuando hay más de un enlace apuntando a una de estas urls, cual prevalece?

Vamos a verlo con un ejemplo:
En esta búsqueda aparece primera una página excluída de un robots.txt. Vemos en Live que la enlazan varias webs.
Porqué se eligió como título el anchor de esta página y no otro? , qui lo sa…

Ale, tarea para el fin de semana. Encontrar una de estas páginas con anchor-títulos, que tenga varios enlaces y demostrar alguna teoría.

Relacionado con este tema, Tomy Lorsch hace varios días comentó que sucedía algo similar en Yahoo para cuando todas las páginas tienen el mismo título. (aunque no puso ningún ejemplo)

vía Lenssen.

Google compra JotSpot

Sergey salió a pasear con su visa. Tenía que regalarle algo a su amigo Larry. Estuvo como dos horas buscando algo en el mercadillo 2.0 de Silicon Valley que el caprichoso Larry aún no tuviera y dio con una especie de wiki 2.0 (valga la resonancia). Sacó la visa y tras pagarlo se fue a casita con uno de esos regalos que no sabes muy bien lo que es, ni lo que hará tu amigo con él, pero que para salir del paso no está mal.

vía blogoscoped.

Parámetros en páginas dinámicas y Google

En el weblog oficial para webmasters de Google comentan que han eliminado una importante linea de su guidelines, en concreto la referida a la no utilización del «parámetro» id :

Don’t use «&id=» as a parameter in your URLs, as we don’t include these pages in our index.

Esto no quiere decir que Google vaya a indexar tu web dinámica con este tipo de parámetros, ni todo lo contrario. Lo único que quiere decir es que Google va mejorando la indexación de este tipo de páginas y que con uno o dos parámetros (según Matt Cutts) no debería haber problemas (ya de tres en adelante…). De todos modos, para curarse en salud, recomiendan para estos casos usar la reescritura de las urls (mod_rewrite).

vía ser

También en ser veo que regalan cupones de 50$ en Adwords. Puedes probar por si suena la flauta.

Actualización:
A mi me sonó la flauta:

Thank you for your interest in Google AdWordsâ„¢. This email
contains your free 35.00 USD AdWords credit, and instructions
for redeeming that credit through the Google AdWords website.

Vaya, me llegó otro cupón. Me da vergüenza pedir otro.

Google español

No se si es un error o quieren eliminar todos los «googles internacionales de habla hispana». Si entrais ahora mismo en google.es , .com.ar , .cl y similares vereis que Google se ha hecho un lio y sobre el logo con la palabra «español» está sobreimpresionado el nombre del país. Seguro que es un pequeño error y en breves días (no es el .com) seguramente se darán cuenta y lo arreglarán.

De todos modos, como veis, el gif de Google Español existe, luego…. en algo estarán trabajando.


Actualización:
Ya arreglaron el problemilla.

La frescura de Yahoo

En el weblog oficial de Yahoo comentan que anoche actualizaron su index y que habrá algunos cambios en las serps.
En la imagen veis como últimamente el bot de Yahoo está trabajando bastante, ahora mismo quizás le esté quitando a MSN el título del buscador más fresco. Por ejemplo el post que publiqué ayer ya está en Yahoo, no así en msn o google.
Al hilo de este «weather report» de Yahoo, Matt Cutts también quiere dar el suyo sobre Google. No dice nada nuevo, la única novedad es que los típicos cambios que pega Google en la época navideña este año no se producirán, o igual si. Muy interesante.

Volar con los 34 datos de Google

Una pareja española llega al aeropuerto de Houston. Esta es la traducción de la conversación de la pareja con uno de los responsables de «seguridad» del aeropuerto:

manolo: Buenas
segurata: Ya veremos si son tan buenas… abra por favor su maleta.
manolo: Esta maleta ya ha sido revisada en 4 ocasiones en este vuelo.
segurata: Y será revisada otras 500 veces si hace falta.
maria (susurrando a manolo): Tranquilo manolo, tranquilo, respira profundo…
segurata: Es usted Manuel Gutierrez de Barrutia?
manolo: Así es.
segurata (leyendo informe): estudios superiores en la upna, ingresos anuales tales, viene por primera vez, con su novia, su móvil es este, su dirección actual es esta, visitarán estos lugares… Van a Arizona?
manolo: Si, vamos a coger un vuelo a Phoenix.
segurata: Lo se, lo se. Tener cuidado con el calor y las serpientes en Phoenix.
maria: Serpientes?
segurata: Si, creo que su novio ya sabe de que hablo.
manolo: No tenía ni idea.
segurata: Señor Gutierrez, vamos a llevarnos bien, así que sea claro conmigo. Se que usted conoce el tema, y se ha informado sobre los peligros del desierto en Arizona.
manolo: Cómo conoce usted esos datos ?
segurata: Lo importante no es el como, lo importante es que usted está mintiendo a un agente federal. Dónde tiene el cuchillo que compró la semana pasada en ebay ?
manolo: En España.
segurata: Me está usted diciendo que el cuchillo Snake Silver Action se le olvidó en España?
Un momento (…segurata consultando la base de datos…)
manolo a maria: ufff menos mal que por GTalk te dije que no lo trajesemos.
segurata: ok, confirmado. Pueden continuar su viaje.

Gmail, Google Personalizado, Gtalk, GCalendar… Todos tus datos en sus manos con un click. Hoy son 34 datos los que dicen tener, mañana serán otros 34 de Google.

Tus datos están seguros en Google

Estaba yo viendo un reportaje sobre Google en etb2. Marissa Mayer (una de las jefazas) hablaba de que los datos de los usuarios les son muy necesarios para mejorar sus servicios, que necesitaban mantenerlos más de 30 días y bla bla bla. Luego aparecía una persona de alguna organización sobre privacidad en la red y dejaba claro que el no se fiaba nada de google (ni del gobierno eeuu).

Justamente leo ahora que parece que a google les han colado, por enésima vez, un post falso en su weblog. Cómo fiarse de Google si no es capaz ni de mantener la seguridad de su propia web?

El post en cuestión (ya eliminado) aún está en bloglines:

Gmail, Google personalizado….. úsalos si no te importa nada tu privacidad 😉

Más info en blogoscoped.

Actualización:
Post relacionado : Volar con los 34 datos de Google

Actualización II:
Desde Google confirman que se la metieron doblada. Tranquilos, seguro que los datos de sus usuarios los guardan mejor que su propio weblog… jur jur jur.
Casualidades de la vida, o no, en el post que precedía al fake goole presentaba su nueva página sobre seguridad.

Penalización de 30 posiciones en Google

En el foro xeoweb una persona comenta una circunstancia extraña con su web en Google. Hace unos días me fijé y efectivamente, para esta búsqueda en la que debería aparecer en primeras posiciones aparece en el número 31. Lo curioso es que aparece con los sitelinks que solo aparecen para el #1 de ciertas búsquedas.
En su momento pensé que sería un error o bug pasajero de Google. Pero viendo la respuesta de Fran en el hilo, que existen más casos similares y ver que sigue sin moverse de las serps para esa búsqueda (con lo que se mueven las serps), se podría concluir que podemos estar ante una curiosa penalización.

Cuando una web baja posiciones de golpe, resulta dificil determinar la causa exacta. Se puede pensar en una posible penalización, pero probarlo resulta dificil. En este caso en cambio tenemos la oportunidad de sacar conclusiones por el tema de los sitelinks.

Está bastante claro que esa web, en condiciones normales, debería estar primera para esa búsqueda, de hecho lo estaba, de ahí (se puede deducir) que pese a estar retrasada mantenga los sitelinks. De modo que el que se mantenga invariable en el puesto 31 podría suponer que tiene una penalización de -30 posiciones en las serps.

Actualización:
El problema de las 30 posiciones parece confirmarse con este comentario y con todos los ejemplos que siguen saliendo en el interesante hilo del foro xeoweb.

Offtopic:
Ah, y tuve problemas con el server. No soy un moroso eh! 😛