-   - 

Cocitación, semántica y Link Building – Caso de análisis de cocitación de autores (ACA)

Otorgar relevancia, estructurar y categorizar la información disponible en internet para mostrarla a los usuarios se complica a medida que el volumen de información disponible se acrecenta.

¿Qué es cocitación? –dices mientras clavas
en mi pupila tu pupila azul.
¿Qué es cocitación? ¿Y tú me lo preguntas?
Cocitación… eres tú.
Repetir otra vez ;)

Introducción

El artículo es un poco denso pero si queremos entender bien el futuro del SEO, de link building o de la Web en general, debemos tener en cuenta que las cosas cambian y adaptarnos y evolucionar con ellas es parte de nuestro trabajo. Tener una visión más amplia sobre los motores de búsqueda y los  usuarios también es fundamental; no se desarrolla una tecnología y por otro lado sin nada que ver otra, muchas cosas van de la mano y este artículo es un ejemplo.  Es por ello, que se buscan nuevos patrones de arquitectura de la información para ofrecer resultados óptimos a las necesidades de los usuarios. Entre ellos la cocitación.

 

¿Qué es el análisis de cocitación de autores (ACA) y la frecuencia?

Tipos de cocitación hay varios (clases, categorías, etc.) pero todos se sustentan sobre los mismos pilares: un mismo documento que cita a otros dos. En nuestro caso, un autor que cita a otros dos autores en su obra. Cuanto mayor sea el número de cocitas, es decir, cuantos más autores citen en su obra a otros dos (los mismos), se entiende que la relación entre ése par de autores citados es más estrecha. El número de cocitas se denomina “frecuencia” y cuanto mayor sea ésta, mayor será su relevancia en lo referente a una temática. Autores de un campo específico, suelen citar autores de su mismo campo por lo que se podrán categorizar los campos (categorías, sub-categorías, etc.) en función de los autores cocitados.

En resumen, con la cocitación se busca determinar qué autores, en función de las cocitas de los demás, representan de una manera más relevante una determinada disciplina, hasta el punto en el que ésos autores pueden ser sustitutivos de las ideas que representan.

En mi caso, que trato mucho la temática “link building” se crearía una relación intrínseca por cocitación entre el “link building” y yo, es decir, mi nombre como “autor” sería un sustituto de la sub-temática que represento. Del mismo modo, si yo cito a dos autores en un artículo, se entiende que han de tener relación con el “link building” pues es la temática de la que yo hablo. Este concepto se denomina “constructo”. Un autor es en sí mismo una “idea”: un constructo con valor intrínseco en determinados temas.

Una vez se determina el constructo que representa determinado autor, podemos ver la relación de este con otros autores o los constructos (ideas) que los otros representan generando así un mapa de tópicos para determinada búsqueda.

Y es que esto sigue… si focalizamos las diferentes autorías temáticas podremos generar, los denominados “clusters” o “nodos” de información y detectar los vínculos en común entre los diferentes campos de estudio, su evolución en el tiempo o incluso los temas más trascendentes en función del periodo de tiempo del que hablemos ya que el mecanismo de cocitas es dinámico (pueden variar en el tiempo).

 

Camino a la semántica

Hasta la fecha las similitudes entre textos, autores, etc. se basaban en el valor nominativo de las palabras y las estructuras gramaticales (sintaxis). Relaciones y similitudes entre títulos, descripciones o palabras clave, se usaban para obtener el nivel de similitud entre ambos y a partir de ahí enmarcarlos en una temática. La cocitación permite ir mucho más allá ¿A dónde? Efectivamente: la semántica. Se otorga valor a un autor (dado por otros autores), a un texto… a la información. Y además esta se puede estructurar de mayor a menor o viceversa y también de manera horizontal (hiperónimos e hipónimos). Estableciendo la “denotación” de un concepto y facilitando la “connotación” (semántica pura y dura) de éste. En definitiva, se puede estructurar la información de una manera mucho más efectiva que lo que la sintaxis aportaba.

 

Ejemplos basados en patentes de Google sobre enlazamiento y cocitación

Ejemplo I: Significado gráfico de cocitación general

Patente Google cocitación

Patente de Google US 8516357 B1: Link based clustering of hyperlinked documents

La figura anterior muestra varios ejemplo de cocitación (en este caso no se trata de un análisis de cocitación de autores pero es un buen ejemplo para entender la idea de cocitación y constructo). Vemos cómo para una query con una keyword en común “Saturn” encontramos dos temáticas diferentes (coches y planetas). El sitio web (página, texto…) 205 cocita a los sitios web 201 y 203 del mismo modo que lo hace el sitio web 207 estableciéndose una relación de temáticas fácilmente reconocible “coches”. El sitio web 215 hace una cocitación de los sitios 209 y 211 y el sitio web 217 cocita al sitio web 211 y 213. En el caso particular de los sitios 209 y 213 no existe cocitación por lo que se entiende que temáticamente no están muy próximamente relacionados.

Ejemplo 2: Caso específico de Análisis de Cocitación de Autores (ACA) y valor de enlaces

Análisis cocitación SEO
Patente de Google US 8825645 B1:  Determining quality of linked documents”

La figura 1 representa una estructura de enlazado entre autores. Encontramos tres autores (“A”, “B” y “C”) y seis documentos (101, 102, 103, 104, 105 y 110). El autor “A” se cita tres veces con los documentos 101, 102 y 103 al documento 110. El valor de estos enlaces para el artículo 110 se supone menor que el que aportan el autor “B” con su artículo 104 y el autor “C” con el 105. Se asume una calidad similar entre los artículos del mismo autor mientras que los enlaces recibidos de los otros dos autores aportan un “valor añadido” al documento 110.

 

¿Para qué vale el análisis de cocitación de autores?

Ya hemos visto que lo que aporta la cocitación al valor semántico en la web y como este se distribuye mediante enlaces. Hace ya casi dos año hablé sobre la idea del rel=author y lo que representaba a modo de autoridad para otorgar valor a otras web mediante enlaces salientes. Las posibilidades de manipulación eran muy grandes en lo que a link building se refiería y no lo veía claro y parece que entre otros motivos (CTR, etc.) le ha llevado a su desaparición. Sin embargo el Author Rank o la idea de mismo se mantiene y una manera de dotar autoridad a un autor mediante cocitas es mucho más compleja de manipular y además genera estructuras de contenidos diferenciadas.

 

Un apunte final

No cabe duda que la complejidad de la cocitación es elevada sobre todo cuando si se realiza un análisis más en profundidad de las misma. Hay que tener en cuenta que para obtener los datos numéricos exactos se utilizan matrices, análisis estadísticos, mapas de grafos, enlaces de varios niveles, etc. y que a día de hoy no existe unanimidad a la hora de aplicar unos sistemas y otros o incluso unos patrones de corrección u otros. Supongo que al final, en lo que al SEO se refiere, Google decidirá por sí mismo y arrastrará a los demás. En cualquier caso, aquí seguiremos hablando de cocitación porque el futuro está aquí (ya sea en esta forma u otra) y si no lo crees recuerda que el dibujo del primer ejemplo es de una patente publicada en 2013 y la otra en 2014. Y si no te he quedado claro, Google ya lleva tiempo toqueteando (en el ámbito académico y gracias a la bibliometría se lleva utilizando la cocitación muchos años). Para muestra, un botón:

Ejemplo de cocitación en SERP GoogleFuente: : Análisis de cocitación de autor en el modelo de aceptación tecnológico, 2005-2010

Espero que os haya resultado interesante ya que el tema dará que hablar, desde aquí lo seguiremos haciendo.

@eCesarAparicio

Suscríbete al blog de Cráneo Previlegiado