Una patente presentada recientemente por Google describe cómo un asistente de IA puede usar al menos cinco señales contextuales del mundo real, incluida la identificación de intentos relacionados, para influir en las respuestas y generar un diálogo natural. Es un ejemplo de cómo la búsqueda asistida modifica las respuestas para involucrar a los usuarios con preguntas y diálogo contextualmente relevantes, expandiéndose más allá de los sistemas basados ​​en palabras clave.

La patente describe un sistema que genera diálogo y respuestas relevantes utilizando señales como contexto ambiental, intención de diálogo, datos de usuarios e historial de conversación. Estos factores van más allá del uso de los datos semánticos en la consulta del usuario y muestran cómo la búsqueda asistida se está moviendo hacia interacciones más naturales y humanas.

En general, el propósito de presentar una patente es obtener protección legal y exclusividad para una invención y el acto de presentación no indica que Google realmente la esté usando.

La patente utiliza ejemplos de diálogo hablado, pero también establece que la invención no se limita a la entrada de audio:

“En particular, durante una sesión de diálogo dada, un usuario puede interactuar con el asistente automatizado utilizando diversas modalidades de entrada, incluidas, entre otros, la entrada hablada, la entrada tipada y/o la entrada táctil”.

El nombre de la patente es, Uso de modelos de idiomas grandes en la generación de la (s) respuesta (s) de asistente automatizado (s). La patente se aplica a una amplia gama de asistentes de IA que reciben insumos a través del contexto de escrito, tacto y habla.

Hay cinco factores que influyen en las respuestas modificadas de LLM:

  1. Tiempo, ubicación y contexto ambiental
  2. Contexto específico del usuario
  3. Intención de diálogo e interacciones anteriores
  4. Entradas (texto, tacto y habla)
  5. Contexto del sistema y dispositivo

Los primeros cuatro factores influyen en las respuestas que proporciona el asistente automatizado y el quinto determina si apagar la parte asistida por LLM y volver a las respuestas estándar de IA.

Tiempo, ubicación y medio ambiente

Hay tres factores contextuales: tiempo, ubicación y medio ambiente que proporcionan contextos que no existen en las palabras clave e influyen en cómo responde el asistente de IA. Si bien estos factores contextuales, como se describe en la patente, no están estrictamente relacionados con las descripciones de IA o el modo de IA, muestran cómo las interacciones asistidas con AI-AI pueden cambiar los datos.

La patente usa el ejemplo de una persona que le dice a su asistente que está haciendo surf. Una respuesta estándar de IA sería un comentario calderoso para divertirse o disfrutar del día. La respuesta asistida por LLM descrita en la patente generaría una respuesta basada en la ubicación geográfica y el tiempo para generar un comentario sobre el clima como el potencial de la lluvia. Estos se denominan salidas de asistente modificadas.

La patente lo describe así:

“…the assistant outputs included in the set of modified assistant outputs include assistant outputs that do drive the dialog session in manner that further engages the user of the client device in the dialog session by asking contextually relevant questions (eg, “how long have you been surfing?”), that provide contextually relevant information (eg, “but if you’re going to Example Beach again, be prepared for some light showers”), and/or that otherwise resonate with the user of the client device within the context of the dialog sesión.”

Contexto específico del usuario

La patente describe múltiples contextos específicos del usuario que el LLM puede usar para generar una salida modificada:

  • Datos de perfil de usuario, como preferencias (como alimentos o tipos de actividad).
  • Datos de aplicaciones de software (como aplicaciones actualmente o recientemente en uso).
  • Historial de diálogo de las sesiones de asistente en curso y/o anteriores.

Aquí hay un fragmento que habla sobre varias señales contextuales relacionadas con el perfil de usuario:

“Además, el contexto de la sesión de diálogo se puede determinar en función de una o más señales contextuales que incluyen, por ejemplo, el ruido ambiental detectado en un entorno del dispositivo del cliente, datos de perfil de usuario, datos de aplicaciones de software, … Historial de dialog de la sesión de diálogo entre el usuario y el asistente automatizado, y/u otras señales contextuales”.

Intentos relacionados

Una parte interesante de la patente describe cómo se puede utilizar la preferencia de alimentos de un usuario para determinar una intención relacionada para una consulta.

“Por ejemplo, … uno o más de los LLM pueden determinar una intención asociada con la consulta del asistente dada … Además, la una o más de los LLM puede identificar, en función de la intención asociada con la consulta del asistente dada, al menos una intención relacionada que está relacionada relacionada con la intención asociada con la consulta de asistente dada … además, una o más de los LLMS puede generar la consulta del asistente adicional basada en el al menos una intención relacionada.

La patente ilustra esto con el ejemplo de un usuario que dice que tiene hambre. El LLM identificará contextos relacionados como qué tipo de cocina disfruta el usuario y el itent de comer en un restaurante.

La patente explica:

“En este ejemplo, la consulta de asistente adicional puede corresponder, por ejemplo,” ¿qué tipos de cocina han indicado que el usuario indica que prefiere? ” (Por ejemplo, que refleja una intención de tipo de cocina relacionada asociada con la intención de que el usuario indique que le gustaría comer), “¿Qué restaurantes están abiertos?” (Por ejemplo, que refleja una intención de búsqueda de restaurantes relacionada asociada con la intención de que el usuario indique que le gustaría comer) … En estas implementaciones, se puede determinar la producción adicional del asistente en base a procesar la consulta de asistente adicional “.

Contexto del sistema y dispositivo

El contexto del sistema y el dispositivo parte de la patente es interesante porque permite que la IA detecte si el contexto del dispositivo es que tiene poca batería, y de ser así, apagará las respuestas modificadas por LLM. Hay otros factores, como si el usuario se está alejando del dispositivo, los costos computacionales, etc.

Comida para llevar

  • Respuestas de consultas de IA Use señales contextuales
    La patente de Google describe cómo los asistentes automatizados pueden usar el contexto del mundo real para generar respuestas y diálogo más relevantes y humanos.
  • Los factores contextuales influyen en las respuestas
    Estos incluyen tiempo/ubicación/entorno, datos específicos del usuario, historial de diálogo e intención, condiciones del sistema/dispositivo y tipo de entrada (texto, habla o tacto).
  • Las respuestas modificadas por LLM mejoran el compromiso
    Los modelos de idiomas grandes (LLM) usan estos contextos para crear respuestas personalizadas o preguntas de seguimiento, como hacer referencia al clima o las interacciones pasadas.
  • Los ejemplos muestran un impacto práctico
    Los escenarios como recomendar alimentos basados ​​en las preferencias de los usuarios o comentar sobre el clima local durante los planes al aire libre demuestran cómo los contextos del mundo real pueden influir en cómo responde la IA a las consultas de los usuarios.

Esta patente es importante porque millones de personas se comprometen cada vez más con los asistentes de IA, por lo tanto, es relevante para los editores, tiendas de comercio electrónico, empresas locales y SEO.

Describe cómo los sistemas asistidos por AI-AI de Google pueden generar respuestas personalizadas y conscientes del contexto mediante el uso de señales del mundo real. Esto permite a los asistentes ir más allá de las respuestas basadas en palabras clave y responder con información relevante o preguntas de seguimiento, como sugerir a los restaurantes que un usuario puede gustar o comentar sobre las condiciones climáticas antes de una actividad planificada.

Lea la patente aquí:

Uso de grandes modelos de lenguaje para generar respuesta (s) de asistente automatizado.

Imagen destacada por Shutterstock/Unidad Visual

Con información de Search Engine Journal.

Leer la nota Completa > Google patente sobre el uso de señales contextuales más allá de la semántica de consultas

LEAVE A REPLY

Please enter your comment!
Please enter your name here