SEO

Utilizar vectores de palabras y aplicarlos en SEO

Google ha ido bien pasado palabras clave y su frecuencia a mirar el significado impartido por las palabras y cómo se relacionan con la consulta en la mano.

De hecho, durante años, el término común utilizado para trabajar con texto y lenguaje en posicionamiento web SEO había sido el procesamiento del lenguaje natural (PNL). El nuevo enfoque, sin embargo, es la comprensión del lenguaje natural (NLU). En los párrafos siguientes, queremos presentarle un producto de aprendizaje automático que ha sido muy útil para cuantificar y mejorar la relevancia del contenido.

A principios de este año, comenzamos a entrenar modelos basados en una base de código llamada Char-rnn de Andrej Karpathy. Lo realmente interesante de esta base de código era que después de un entrenamiento podías terminar con un modelo que generaría contenido basado en lo que aprendió de los documentos de capacitación. No sólo repetiría el contenido, sino que generaría un nuevo contenido legible (aunque sin sentido).

Funciona mediante el uso de una red neuronal para aprender qué carácter a adivinar a continuación. Si usted tiene el tiempo, Karpathy’s write-up es una lectura fascinante que le ayudará a entender un poco más sobre cómo funciona esto.

Al probar varias bases de código, nos encontramos con una que, en lugar de predecir los personajes, intentó predecir qué palabras vendrían a continuación. La parte más interesante de esto fue que utilizó algo llamado GloVe embeddings que eran básicamente palabras convertidas en números de tal manera que la trama de las coordenadas de número impartió relaciones semánticas entre las palabras. Lo sé, fue un bocado.Word Vectors and SEO

¿Por qué son importantes los vectores GloVe?
Los vectores globales son importantes porque pueden ayudarnos a comprender y medir la relevancia. Usando Word2Vec, puedes hacer cosas como medir la similitud entre palabras o documentos, encontrar la mayoría de las palabras similares a una palabra o frase, agregar y restar palabras entre sí para encontrar resultados interesantes y también visualizar la relación entre palabras en un documento.

Semejanza

Si usted tiene una comprensión de Python, Gensim es una excelente herramienta para ejecutar análisis de similitud en palabras y documentos. Actualizamos un convertidor en Github para facilitar la conversión de los vectores GloVe a un formato que Gensim puede usar aquí.

Para mostrar el poder de los vectores GloVe para producir semánticamente palabras similares a una palabra semilla o frase, echa un vistazo a la siguiente imagen. Esto fue el resultado de encontrar las palabras más parecidas a “dui lawyer” usando la biblioteca Gensim y los vectores GloVe (los términos geográficos fueron eliminados).

Observe cómo éstas no son variaciones de la palabra o sinónimos, sino conceptos que usted esperaría encontrar al tratar con un abogado en este área de práctica.

Sumar y restar vectores

A continuación se muestra uno de los ejemplos más frecuentemente usados de la potencia de estos vectores. Dado que las palabras se convierten en vectores numéricos, y hay relaciones semánticas en la posición de los vectores, esto significa que puede utilizar aritmética simple en los vectores para encontrar significado adicional. En este ejemplo, las palabras “Rey”, “Hombre” y “Mujer” se convierten en vectores GloVe antes de sumar y restar, y “Reina” está muy cerca del vector resultante.

Tag: posicionamiento seo

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *