¿Qué es? La optimización de la inferencia significa hacer que los modelos sean más rápidos y más baratos.