¿Cómo es?
Este enfoque es útil cuando no podemos utilizar el Enfoque de proporcionar imágenes al inicio de un Agente de Visión porque no hay posibilidad de tener imagenes previamente (en una BD por ejemplo). Se trata de recuperar dinámicamente imágenes e información de fuentes externas, como navegar por la web para obtener detalles. Por tanto, las imágenes se agregan dinámicamente a la memoria del agente durante la ejecución.
Este enfoque estructurado permite a los agentes incorporar información visual de manera dinámica y responder de forma adaptativa a tareas en evolución.