Fuga de factores de clasificación de búsqueda de Yandex: información

La comunidad de marketing de búsqueda está tratando de dar sentido al repositorio de Yandex filtrado que contiene archivos que enumeran lo que parecen ser factores de clasificación de búsqueda.

Algunos pueden estar buscando pistas de SEO procesables, pero probablemente ese no sea el valor real.

El acuerdo general es que será útil para obtener una comprensión general de cómo funcionan los motores de búsqueda.

Hay mucho que aprender

ryan jones (@RyanJones) cree que esta filtración es un gran problema.

el ya esta cargó algunos de los modelos de aprendizaje automático de Yandex en su propia máquina para realizar pruebas.

Ryan está convencido de que hay mucho que aprender, pero que se necesitará mucho más que simplemente examinar una lista de factores de clasificación.

Ryan explica:

“Si bien Yandex no es Google, podemos aprender mucho de esto en términos de similitud.

Yandex utiliza mucha tecnología inventada por Google. Hacen referencia a PageRank por su nombre, usan Map Reduce y BERT y muchas otras cosas también.

Obviamente, los factores variarán y las ponderaciones que se les apliquen también variarán, pero los métodos informáticos de cómo analizan la relevancia del texto y vinculan el texto y realizan los cálculos serán muy similares en todos los motores de búsqueda.

Creo que podemos obtener mucha información de los factores de clasificación, pero solo mirar la lista filtrada no es suficiente.

Cuando observa los pesos predeterminados aplicados (antes de ML), hay pesos negativos que los SEO asumirían que son positivos o viceversa.

También hay MUCHOS más factores de clasificación calculados en el código que los que se enumeran en las listas de factores de clasificación que flotan.

Esa lista parece ser solo factores estáticos y no tiene en cuenta cómo calculan la relevancia de la consulta o muchos factores dinámicos que se relacionan con el conjunto de resultados de esa consulta».

Más de 200 factores de clasificación

Se repite comúnmente, según la filtración, que Yandex utiliza 1.923 factores de clasificación (algunos dicen que menos).

Christoph Cemper (Perfil de Linkedin), fundador de Link Research Tools, dice que sus amigos le han dicho que hay muchos más factores de clasificación.

Christoph compartió:

“Los amigos han visto:

  • 275 factores de personalización
  • 220 factores de “frescura web”
  • 3186 factores de búsqueda de imágenes
  • 2,314 factores de búsqueda de videos

Hay mucho más por mapear.

Probablemente lo más sorprendente para muchos es que Yandex tiene cientos de factores para los enlaces”.

El punto es que es mucho más que los más de 200 factores de clasificación que Google solía reclamar.

E incluso John Mueller de Google dijo que Google se ha alejado de los más de 200 factores de clasificación.

Entonces, tal vez eso ayude a la industria de búsqueda a dejar de pensar en el algoritmo de Google en esos términos.

¿Nadie conoce el algoritmo completo de Google?

Lo sorprendente de la fuga de datos es que los factores de clasificación se recopilaron y organizaron de una manera tan simple.

La filtración cuestiona la idea de que el algoritmo de Google está muy protegido y que nadie, ni siquiera en Google, conoce el algoritmo completo.

¿Es posible que haya una hoja de cálculo en Google con más de mil factores de clasificación?

Christoph Cemper cuestiona la idea de que nadie conoce el algoritmo de Google.

Christoph comentó en Search Engine Journal:

“Alguien dijo en LinkedIn que no podía imaginarse a Google “documentando” los factores de clasificación así como así.

Pero así es como se debe construir un sistema complejo como ese. Esta filtración proviene de un informante muy autorizado.

Google tiene un código que también podría filtrarse.

La afirmación repetida a menudo de que ni siquiera los empleados de Google conocen los factores de clasificación siempre pareció absurda para una persona tecnológica como yo.

El número de personas que tienen todos los detalles será muy pequeño.

Pero debe estar allí en el código, porque el código es lo que hace funcionar el motor de búsqueda”.

¿Qué partes de Yandex son similares a Google?

Los archivos de Yandex filtrados dan una idea de cómo funcionan los motores de búsqueda.

Los datos no muestran cómo funciona Google. Pero ofrece la oportunidad de ver parte de cómo un motor de búsqueda (Yandex) clasifica los resultados de búsqueda.

Lo que está en los datos no debe confundirse con lo que Google podría usar.

Sin embargo, existen similitudes interesantes entre los dos motores de búsqueda.

MatrixNet no es RankBrain

Una de las ideas interesantes que algunos están desenterrando está relacionada con la red neuronal de Yandex llamada MatrixNet.

MatrixNet es una tecnología más antigua introducida en 2009 (archive.org enlace al anuncio).

Al contrario de lo que algunos afirman, MatrixNet no es la versión de Yandex de RankBrain de Google.

Google RankBrain es un algoritmo limitado enfocado en comprender el 15% de las consultas de búsqueda que Google no ha visto antes.

Un artículo en Bloomberg reveló RankBrain en 2015. El artículo afirma que RankBrain se agregó al algoritmo de Google ese año, seis años después de la introducción de Yandex MatrixNet (Instantánea de Archive.org del artículo).

El artículo de Bloomberg describe el propósito limitado de RankBrain:

“Si RankBrain ve una palabra o frase con la que no está familiarizado, la máquina puede adivinar qué palabras o frases podrían tener un significado similar y filtrar el resultado en consecuencia, lo que lo hace más eficaz en el manejo de búsquedas nunca antes vistas. consultas.”

MatrixNet, por otro lado, es un algoritmo de aprendizaje automático que hace muchas cosas.

Una de las cosas que hace es clasificar una consulta de búsqueda y luego aplicar los algoritmos de clasificación apropiados a esa consulta.

Esto es parte de lo que dice el anuncio en inglés de 2016 del algoritmo de 2009:

“MatrixNet permite generar una fórmula de clasificación muy larga y compleja, que considera una multitud de diversos factores y sus combinaciones.

Otra característica importante de MatrixNet es que permite personalizar una fórmula de clasificación para una clase específica de consultas de búsqueda.

Por cierto, ajustar el algoritmo de clasificación para, por ejemplo, búsquedas de música, no socavará la calidad de la clasificación para otros tipos de consultas.

Un algoritmo de clasificación es como una maquinaria compleja con docenas de botones, interruptores, palancas y medidores. Por lo general, cualquier giro de cualquier interruptor en un mecanismo dará como resultado un cambio global en toda la máquina.

MatrixNet, sin embargo, permite ajustar parámetros específicos para clases específicas de consultas sin provocar una revisión importante de todo el sistema.

Además, MatrixNet puede elegir automáticamente la sensibilidad para rangos específicos de factores de clasificación”.

MatrixNet hace mucho más que RankBrain, claramente no son lo mismo.

Pero lo bueno de MatrixNet es cómo los factores de clasificación son dinámicos en el sentido de que clasifica las consultas de búsqueda y les aplica diferentes factores.

Se hace referencia a MatrixNet en algunos de los documentos de factores de clasificación, por lo que es importante colocar a MatrixNet en el contexto correcto para que los factores de clasificación se vean bajo la luz correcta y tengan más sentido.

Puede ser útil leer más sobre el algoritmo de Yandex para ayudar a entender la fuga de Yandex.

Leer: Algoritmos de inteligencia artificial y aprendizaje automático de Yandex

Algunos factores de Yandex coinciden con las prácticas de SEO

Dominic Woodman (@dom_woodman) tiene algunas observaciones interesantes sobre la fuga.

Algunos de los factores de clasificación filtrados coinciden con ciertas prácticas de SEO, como variar el texto de anclaje:

Alex Buraks (@alex_buraks) ha publicado un mega hilo de Twitter sobre el tema que tiene ecos de las prácticas de SEO.

Uno de esos factores que destaca Alex se relaciona con la optimización de los enlaces internos para minimizar la profundidad de rastreo de las páginas importantes.

John Mueller de Google ha alentado durante mucho tiempo a los editores a asegurarse de que las páginas importantes estén vinculadas de manera destacada.

Mueller desaconseja enterrar páginas importantes en lo profundo de la arquitectura del sitio.

John Mueller compartió en 2020:

“Entonces, lo que sucederá es que veremos que la página de inicio es realmente importante, las cosas vinculadas desde la página de inicio generalmente también son bastante importantes.

Y luego… a medida que se aleja de la página de inicio, pensaremos que probablemente esto sea menos crítico».

Es importante mantener las páginas importantes cerca de las páginas principales a través de las cuales ingresan los visitantes del sitio.

Entonces, si los enlaces apuntan a la página de inicio, las páginas que están vinculadas desde la página de inicio se consideran más importantes.

John Mueller no dijo que la profundidad de rastreo es un factor de clasificación. Simplemente dijo que le indica a Google qué páginas son importantes.

La regla de Yandex citada por Alex utiliza la profundidad de rastreo desde la página de inicio como regla de clasificación.

Tiene sentido considerar la página de inicio como el punto de partida de importancia y luego calcular menos importancia cuanto más lejos se hace clic en el sitio.

También hay trabajos de investigación de Google que tienen ideas similares (Modelo de surfista razonableel Modelo de Navegador Aleatorio), que calculó la probabilidad de que un navegante aleatorio pueda terminar en una página web determinada simplemente siguiendo los enlaces.

Alex encontró un factor que prioriza las páginas principales importantes:

La regla general para SEO ha sido durante mucho tiempo mantener el contenido importante a no más de unos pocos clics de distancia de la página de inicio (o de las páginas internas que atraen enlaces entrantes).

Actualización de Yandex Vega… ¿Relacionado con la experiencia y la autoridad?

Yandex actualizó su motor de búsqueda en 2019 con una actualización llamada Vega.

La actualización de Yandex Vega presentó redes neuronales que fueron entrenadas con expertos en el tema.

Esta actualización de 2019 tenía el objetivo de introducir resultados de búsqueda con páginas expertas y autorizadas.

Pero los especialistas en marketing de búsqueda que examinan detenidamente los documentos aún no han encontrado nada que se correlacione con cosas como las biografías de los autores, que algunos creen que están relacionadas con la experiencia y la autoridad que busca Google.

Ryan Jones tuiteó:

Aprende, Aprende, Aprende

Estamos en los primeros días de la filtración y sospecho que conducirá a una mayor comprensión de cómo funcionan los motores de búsqueda en general.


Imagen destacada: Shutterstock/san4ezz



#Fuga #factores #clasificación #búsqueda #Yandex #información