Cráneo Previlegiado » Blog SEO de Cráneo Previlegiado » El «nuevo» marketing online -Estudio de correlación y regresión lineal: Tráfico versus Links-
En mi soledad he visto cosas muy claras, que no son verdad.
El marketing online como lo conocemos hasta ahora se he desenvuelto en un ámbito de mercado poco maduro. A medida que éste se asienta y evoluciona, nos encontramos con empresas de mayor dimensión con las que trabajar. Así mismo, la madurez del ámbito online y el constante incremento del volumen de datos a nuestra disposición requiere de un tratamiento de los mismos cada día más técnico y complejo. Esta situación poco a poco irá desplazando a las técnicas de marketing online «tradicionales» basadas en experimentos «poco» empíricos, hasta que el análisis estadístico y masivo de datos sea necesario para cualquier tipo de decisión corporativa. Estos cambios atañen al SEO, al PPC, al CRO o cualquier otra disciplina actual de marketing. Hoy veremos un ejemplo simple de análisis de correlación entre dos variables basado en el método estadístico de regresión lineal.
Quizá a muchos les suenen a chino las técnicas estadística pero son métodos que se llevan aplicando años en muchos ámbitos donde el volumen de datos para el estudio es considerable. Internet, es un claro ejemplo y el tan comentado, algoritmo que, por ejemplo, Google usa para sus rankings en las SERPs, es uno de ellos.
Otro buen ejemplo del uso de la estadística y los algoritmos matemáticos, es el usado en lo que se denomina «trading de alta frecuencia», es decir,negociaciones masivas de valores financieros en muy poco tiempo gracias al uso de sistemas automáticos. Pongo este otro ejemplo de manejo de grandes volúmenes de datos gracias al uso de tecnología porque son actualmente muy usados y de difícil control por parte de la administración para evitar «malas prácticas» en sus uso, pues los responsables gubernamentales, en muchas ocasiones, no pueden hacer frente a tanto desarrollo tecnológico en sus investigaciones (por quedarse obsoletos, por la complejidad, etc.). Entonces ¿Cómo esperamos nosotros resolver cuestiones técnicas con marketing online «tradicional» en un entorno cada vez más complejo?. Si nos «enfrentamos» a Google y ellos usan las matemáticas, sólo nos queda usarlas nosotros también y aun así la pelea tampoco estará equilibrada, aunque sí un poco más.
Se habla mucho de correlación en las variables que se usan para los rankings en los motores de búsqueda pero casi nadie trabaja estas cuestiones. Este artículo a modo didáctico y con un simple ejercicio estadístico pretende poner un ejemplo de qué supone la correlación y cómo usarla para anticipar, por ejemplo, posibilidades para entrar en un nicho nuevo, inversiones necesarias, etc.
El artículo consta de dos partes:
1.- ¿Existe correlación entre el tráfico que recibe un sitio web y el número de backlinks que recibe?
2.- ¿Qué número de backlinks necesito para alcanzar un tráfico de 2 millones de visitas en función de la estimación realizada?
He seleccionado 12 periódicos, los más destacados por tráfico, que tienen ediciones online. Para este ejercicio simple, he usado dos variables: datos de tráfico de cada sitio sacados de SEMrush (quizá no sean muy fidedignos pero sí son representativos) y número de backlinks entrantes al dominio raíz de cada sitio obtenidos con MajesticSEO.
A partir de los datos anteriores, he calculado la recta de regresión lineal correspondiente:
Y el coeficiente de correlación. r=0,893370342
Para estos cálculos he usado una tabla (en excel para que sea más ilustrativo) que me ha servido para hacer los cálculos necesario. Copio la tabla por si queréis realizar el mismo ejemplo:
Para calcular la correlación necesitamos las medias de x e y así como sus varianzas, desviaciones típicas (raíz de la varianza) y covarianza. Las pongo por si alguien no las conoce y tiene curiosidad por hacer los cálculos:
MEDIAS | |
Xmedia= | 5,9415 |
Ymedia= | 7,605833333 |
VARIANZAS | |
S^2x= | 37,55742825 |
s^2Y= | 302,8469193 |
DESVIACIONES TÍPICAS | |
Sx= | 6,12841156 |
Sy= | 17,4024975 |
COVARIANZA | |
Sxy= | 52,63954208 |
COEFICIENTE DE CORRELACIÓN | |
r= | 0,893370342 |
Resultado I. ¿Existe correlación?
Sí. El valor del coeficiente de correlación (r=0,893370342) está muy próximo a uno por lo que la vinculación es muy fuerte. Al aumentar una aumenta la otra.
He calculado la recta de regresión de Y sobre X que se puede ver en la gráfica de correlación lineal y he sustituído los datos obtenidos en los cálculos anteriores. Para quien tenga curiosidad, es la siguiente:
El resultado II. Número de backlinks necesario para llegar a un tráfico de 2 millones.
Serían necesaríos 2,0904 millones de backlinks para conseguir un tráfico de 2 millones.
He calculado un modelo de regresión lineal simple (y simplificado) usando dos variables para que sea más ilustrativo. En este tipo de estudios se suelen emplear más variables pero nos enfrentaríamos a un número mayor de problemas (heterocedasticidad, homocedasticidad, etc.) que tendríamos que resolver. Estoy trabajando en uno mucho más complejo, multivariable y que además incluya cuestiones del tipo financiero y análisis de nodos pero implica mucho trabajo. Si lo quieres ver, será en el SEonthebeach de este año pero para ello me tenéis que hacer retuit a este precioso regalo que me hicieron para nominarme:
Montaje (tela) de regalo: podéis votarme al @seonthebeach haciendo RT http://t.co/v4GjEtanhF o expulsarme de internet pic.twitter.com/CXharlGuIH
— Cesar Aparicio (@eCesarAparicio) marzo 11, 2015
Hoy has visto una pequeña introducción al futuro del marketing online eficiente y efectivo, tenlo presente.
¿Quieres estar al día de lo último en Cráneo Previlegiado?
¡Suscríbete gratis!