¿Qué es AutoML?

AutoML significa Aprendizaje Automático Automatizado y se refiere al proceso mediante el cual se construyen sistemas de inteligencia artificial con intervención humana limitada.

La forma tradicional de crear software de IA es hacer que un científico de datos preparare manualmente un conjunto de datos, seleccione un tipo de modelo y una arquitectura, y ajuste sus hiperparámetros (aquellos parámetros que el modelo no puede aprender por sí solo) antes de entrenarlo. Este proceso suele ser lento, propenso a errores y puede conducir a resultados subóptimos debido a la complejidad, las limitaciones de tiempo y a la intervención manual. Sin embargo, con AutoML, un sistema automatizado se encarga de seleccionar y parametrizar el algoritmo, mejorando la productividad de data scientists y logrando mejores resultados.

¿Cómo pueden beneficiarse las empresas de AutoML?

El uso de plataformas AutoML se considera necesario actualmente tanto en la industria como en el ámbito académico. En la industria, las empresas usan AutoML para mejorar la confiabilidad, la escalabilidad y la rentabilidad de sus soluciones para gestionar los modelos de inteligencia artificial en producción.

Sin AutoML, las empresas deben invertir recursos significativos para lograr la mejor precisión de predicción para sus modelos de inteligencia artificial. Mantener tal precisión también requiere monitorización y esfuerzo constante, ya que los modelos de machine learning se degradan con el tiempo (un efecto llamado data drifting). AutoML automatiza estas tareas, asegurando que las empresas alcanzan y mantienen los mejores resultados de forma efectiva en coste.

Adicionalmente, en el ámbito académico AutoML se utiliza para comparar arquitecturas y metodologías de nuevos modelos con baselines que han sido optimizados.

Sin AutoML, la pregunta "¿Podría haber obtenido mejores resultados?" persiste en la mente de todos

¿Cómo funciona AutoML?

Hay varios pasos que se deben seguir para generar inferencias fiables a partir de datos. Estos pasos se pueden resumir de la siguiente manera (con variaciones en términos y orden):

autoML-diagram.png

  1. Preparación de datos: Alinear y unir conjuntos de datos relacionados. Imputar valores faltantes si es necesario.
  2. Análisis del conjunto de datos: Obtener estadísticas descriptivas del conjunto de datos. Estas cifras pueden utilizarse para proponer modelos candidato.
  3. Propuestas de modelos: Identificar los modelos candidato que mejor se adapten a las propiedades del conjunto de datos.
  4. Ingeniería de características: Enriquecer y codificar el conjunto de datos. Esto facilita que un modelo aprenda relaciones relevantes y permite que el algoritmo procese los datos.
  5. Ajuste de candidatos: Optimizar los hiperparámetros de los modelos candidato.
  6. Validación de candidatos: Probar los modelos candidato con segmentos de datos que no se han utilizado para el entrenamiento.
  7. Implementar modelo: Seleccionar el mejor modelo y usarlo para generar predicciones.

¿Cómo se compara AutoML con MLOps?

MLOps se refiere al conjunto de prácticas requeridas para implementar y mantener modelos de aprendizaje automático en producción. Como tal, se ocupa principalmente de servir y monitorizar los modelos. AutoML, por el contrario, es un sistema automatizado para generar un modelo de machine learning de alto rendimiento a partir de los datos sin procesar.

La mayoría de plataformas AutoML también siguen las mejores prácticas en MLOps, automatizando tanto la creación del modelo de inteligencia artificial como su implementación en un entorno de producción.