¿Qué es?
Es una técnica de Prompting simple que concatena“Razonamiento” (Think) con “Actuar” (Act). Con esta se añade “Pensemos paso a paso” antes de permitir que el LLM decodifique los siguientes tokens. De hecho, indicar al modelo que piense “paso a paso” fomenta el proceso de decodificación hacia los siguientes tokens que generan un plan, en lugar de una solución final, ya que se anima al modelo a descomponer el problema en sub-tareas. Esto permite que el modelo considere los sub-pasos con más detalle, lo que en general conduce a menos errores que intentar generar la solución final directamente.
El (d) es un ejemplo del enfoque Re-Act donde indicamos “Pensemos paso a paso”
Es más, el impacto de esta forma de actuar por parte de un LLM está siendo explotada incluso en la fase de afinamiento para incluir siempre secciones específicas de pensamiento (encerradas entre tokens especiales <think>
y </think>
). Esto no es solo una técnica de prompting como ReAct, sino un método de entrenamiento donde el modelo aprende a generar estas secciones después de analizar miles de ejemplos que muestran lo que esperamos que haga.