Features Analítica Avanzada — Optimiza la generación de modelos analíticos
Sitio: | STRATIO Training & Certification |
Curso: | Novedades Actualización Stratio 4.8 |
Libro: | Features Analítica Avanzada — Optimiza la generación de modelos analíticos |
Imprimido por: | Invitado |
Día: | miércoles, 22 de octubre de 2025, 20:16 |
Tabla de contenidos
- 1. Optimiza la generación de modelos analíticos
- 2. Mejora: Analiza, explora y elige el mejor modelo con Insights
- 3. Mejora: Aumenta tus capacidades de monitorizar y mejorar tus modelos (MLflow UI)
- 4. ¡Nuevo! Acelera tus procesos: gestión de entornos y dependencias
- 5. Mejora: Nuevos componentes para habilitar IA Generativa en Stratio Rocket
1. Optimiza la generación de modelos analíticos
Optimiza la generación de modelos analíticos
Descripción de la funcionalidad
MLProject es el asset principal en la productivización de un modelo de machine learning. Se ha modificado este asset añadiendo dos funcionalidades clave para aumentar su capacidad de ejecución: ejecutar varios entrenamientos de la misma versión del modelo de forma simultánea (multiRun) y, cuando se requiera, almacenar más de un modelo por entrenamiento (multiModel). El objetivo es eficientar el trabajo de los data scientists mejorando el throughput del ciclo MLOps.
Mejoras
- multiRun: Permite crear varios runs de MLflow en una misma ejecución de un MLProject.
- multiModel: Registro de varios modelos en una misma ejecución de un MLProject, pudiendo registrar varios modelos en el mismo run o en runs diferentes.
- Tagging de modelos: Soporte para registrar tags y parámetros en los runs de una ejecución para clasificar e identificar de forma ágil los modelos.
- Comparador de ejecuciones: La pantalla de resultados de una ejecución permite realizar comparaciones en una tabla configurable o mediante gráficas personalizadas (ver Insights).
Imagen 1: Artefacto de tipo MLProject para la generación de modelos.
Imagen 2:Comparación de modelos.
2. Mejora: Analiza, explora y elige el mejor modelo con Insights
Mejora: Analiza, explora y elige el mejor modelo con Insights
Descripción
Insights permite comparar runs de MLflow, evaluaciones y ejecuciones con métricas, artefactos y análisis de datos asociados, y construir dashboards de comparación.
Mejoras destacadas
- Selección de métricas mediante navegación por árbol de proyecto.
- Comparación gráfica de métricas entre assets.
- Visualización de artefactos y resúmenes.
- Análisis exploratorio de datos (EDAs) comparables.
Imagen: Interfaz Insight - comparación de ML Entities
3. Mejora: Aumenta tus capacidades de monitorizar y mejorar tus modelos (MLflow UI)
Mejora: Aumenta tus capacidades de monitorizar y mejorar tus modelos (MLflow UI)
Descripción
Intelligence ahora incluye un icono para desplegar MLflow UI y registrar experimentos, facilitando seguimiento y comparación.
Mejoras
- Acceso directo a MLflow UI desde Intelligence.
- Comparación gráfica de métricas y navegación por proyectos.
Imagen 1: Pantalla inicio Intelligence con icono MLflow UI
Imagen 2: Vista MLflow UI (Experiments, Models, Runs)
4. ¡Nuevo! Acelera tus procesos: gestión de entornos y dependencias
¡Nuevo! Acelera tus procesos: gestión de entornos y dependencias
¿Qué es?
Mejoras para reutilizar funciones y librerías empaquetadas como extensiones. Soporte para fijar dependencias y persistir entornos para reducir latencia y evitar conflictos de versiones.
¿Qué podemos conseguir?
- Generación de entornos virtuales a partir de un fichero .yaml (Conda).
- Congelar tu entorno: generar la lista completa de dependencias y subdependencias.
Imagen: Add extension / Generate from conda.yaml
Imagen: Entornos congelados
5. Mejora: Nuevos componentes para habilitar IA Generativa en Stratio Rocket
Mejora: Nuevos componentes para habilitar IA Generativa en Stratio Rocket
¿Qué es?
Nuevos componentes en flujos batch, híbridos y streaming para acelerar desarrollo de RAGs y generación de embeddings a partir de información no estructurada.
Componentes
- LoadDocument: extrae texto y metadatos de documentos.
- Modo 'documento': acceder a cada archivo detectado como tabla con metadatos como ubicación y fecha de modificación.
- TextSplitter y TextEmbeddings: fragmentado de texto y conversión a embeddings.
- Opensearch: salida hacia OpenSearch para almacenar embeddings.
Imagen: Nuevos componentes LoadDocument → TextSplitter → TextEmbeddings → Opensearch
Imagen: Configuración OpenSearch