Hace años que Google dejó de ser un simple buscador que posiciona los resultados en base al número de enlaces que tenga una web o las veces que se repita su palabra clave en un contenido. Cientos, si no miles, son ahora mismo los factores que Google utiliza para mostrar un resultado por encima de otro.
El SEO ha cambiado una barbaridad en los últimos tiempos –y más que cambiará tras la crisis del COVID-19. El contenido sigue siendo el rey dentro de muchas categorías (medios de información, turismo, recomendaciones de compras, etcétera), algo de lo que Google es muy consciente y por ello lleva años perfeccionando los algoritmos que leen los contenidos que se indexan en su buscador.
Suscríbete a mi newsletter sobre posicionamiento en Google, visibilidad en internet y analítica web
Haz clic aquí si no ves el formulario
Durante muchos años, la labor de leer el contenido que por ejemplo un blog publica cada día estuvo sujeta a unas normas muy básicas (y por tanto, fácilmente manipulables): negritas en las palabras clave; H1, H2 y H3 con la palabra clave principal; keywords a diestra y siniestra por toda la web; y un largo etcétera de técnicas que hoy en día, incluso sin necesidad de una revisión manual por parte de alguna de las subcontratas de Google, llevan (o deberían llevar) directamente a la penalización por sobreoptimización en el contenido.
En 2020, Google está en otro nivel. Los contenidos que cada día se indexan en el buscador ya no pasan por el filtro básico de keywords, negritas y similares, sino que son sometidos al escrutinio de la inteligencia artificial.
La inteligencia artificial en Google
De inteligencia artificial se lleva hablando años, aunque cabe tener en mente que este término ya se utilizaba incluso en la década de los años setenta. En cualquier caso, ha sido especialmente en los últimos años cuando los gigantes tecnológicos han comenzado a apostar de lleno por esta tecnología: me atrevería a decir que fue en en 2016 cuando de verdad comenzó la carrera por sacar el mayor rédito posible a la IA.
La inteligencia artificial en Google hoy en día abarca tantos campos diferentes que daría para escribir un reportaje. Por ello, no me enredaré demasiado en este aspecto y si tenéis interés por ampliar información os remitiré a una página que, precisamente, habla a fondo de ello: la web oficial de IA en Google.
Lo que nos interesa en este caso es la inteligencia artificial de Google aplicada al SEO. No sé vosotros, pero navegando por su buscador yo más de una vez me he hecho preguntas como:
- En un artículo que habla de Washington, ¿cómo sabe Google que el contenido se refiere a la capital de Estados Unidos y no a un nombre relativamente popular en Latinoamérica?
- En la misma línea del ejemplo anterior, en un artículo que habla de Obama, ¿cómo sabe Google que se refiere al 44º presidente de Estados Unidos, y no cualquiera de las otras personas relevantes que comparten el mismo apellido?
- El español es un idioma con muchas peculiaridades, ¿de qué forma es capaz Google de separar elementos comunes como los demostrativos respecto al resto del texto? ¿Cómo es que la búsqueda de “ese” en Google no devuelve los miles de artículos que se han publicado en castellano en la última hora, sino que muestra en primera posición la definición de dicho adjetivo demostrativo?
La respuesta se resume en una palabra: entidades.
Las entidades en Google
Se empezó a hablar de ello allá por el año 2013, cuando Google comenzó a virar su algoritmo de búsqueda de los resultados basados en palabras clave (buscas “aspiradoras” y te muestro todos los contenidos que contienen esa keyword) a resultados basados en entidades (buscas “presidente Estados Unidos” y te muestro resultados de Donald Trump).
Las entidades inicialmente podían ser personas, lugares o cosas, aunque la realidad es que hoy en día cualquier nombre propio, palabra o cifra puede ser una entidad en sí misma. La ciudad en la que vives es una entidad, la marca de tu móvil es otra entidad, Emilio Botín también es una entidad… todas ellas entidades que, a su vez, se pueden relacionar con otras entidades como una fecha de cumpleaños, el nombre de una empresa o un precio.
Un ejemplo de cómo entiende Google las entidades relacionadas con Arnold Schwarzenegger.
De este tema hablaré en profundidad en futuros artículos si el tiempo me lo permite. Es un aspecto apasionante del posicionamiento de contenidos en Google, y cuanto más leo sobre ello más convencido estoy de que me encuentro, con suerte, en el 1% del total de conocimientos que se pueden tener al respecto (y cada día hay cosas nuevas).
Vamos al meollo: así puedes saber qué entidades extrae Google de tu artículo
El artículo que voy a utilizar de ejemplo para la demostración de la API Natural Language de Google.
Tras encontrarme con un hilo publicado en Twitter por Carlos Ortega, SEO Manager en la agencia SEOCOM, recordé que toda esta cuestión de las entidades está al alcance de cualquiera en la propia web de Google.
Google no oculta la forma que tiene de extraer las entidades de un contenido de texto –otra cosa es que luego se guarde el secreto de cómo ordena esa información su algoritmo de búsqueda, ?–, para muestra de ello veamos las entidades que extrae su inteligencia artificial de este artículo de Expansión.com (incluyendo cabecera y elementos hasta el final del body): Los Amodio se convierten en los mayores accionistas de OHL con la compra de un 16% por 50 millones.
Así identifica Google las entidades de este artículo:
Y estas son las entidades que, en base a la importancia que Google considera que cada entidad tiene dentro del contenido (lo llaman “Salience”), considera que resultan más relevantes:
Podemos ver que la inteligencia artificial de Google ha decidido que en ese artículo, por orden de relevancia, las entidades más importantes son Los Amodio, títulos, accionistas, mexicanos y Bolsa. ¿Nada mal para un artículo que habla de cómo Los Amodio (hermanos mexicanos) se han convertido en los mayores accionistas de OHL (es decir, tienen títulos de la empresa) con la compra de un 16% de sus acciones (Bolsa), verdad?
Pero ahí no termina el asunto. Si jugáis un poco más con la herramienta de Demostración de la API Natural Language, veréis que también es capaz de algo no menos sorprendente como determinar el sentimiento (triste, enfadado, contento…) que transmite cada párrafo, así como también el texto entero:
Por supuesto, el análisis sintáctico que tantos dolores de cabeza sigue dando en las escuelas resulta ser pan comido para Google:
¿Le damos un aprobado, verdad?
Fantastica explicacion. Gracias por compartir
¡Gracias!