Salta al contenido principal

Features Analítica Avanzada — Optimiza la generación de modelos analíticos

Sitio: STRATIO Training & Certification
Curso: Novedades Actualización Stratio 4.8
Libro: Features Analítica Avanzada — Optimiza la generación de modelos analíticos
Imprimido por: Invitado
Día: miércoles, 22 de octubre de 2025, 20:16

1. Optimiza la generación de modelos analíticos

Optimiza la generación de modelos analíticos

Descripción de la funcionalidad

MLProject es el asset principal en la productivización de un modelo de machine learning. Se ha modificado este asset añadiendo dos funcionalidades clave para aumentar su capacidad de ejecución: ejecutar varios entrenamientos de la misma versión del modelo de forma simultánea (multiRun) y, cuando se requiera, almacenar más de un modelo por entrenamiento (multiModel). El objetivo es eficientar el trabajo de los data scientists mejorando el throughput del ciclo MLOps.

Mejoras

  1. multiRun: Permite crear varios runs de MLflow en una misma ejecución de un MLProject.
  2. multiModel: Registro de varios modelos en una misma ejecución de un MLProject, pudiendo registrar varios modelos en el mismo run o en runs diferentes.
  3. Tagging de modelos: Soporte para registrar tags y parámetros en los runs de una ejecución para clasificar e identificar de forma ágil los modelos.
  4. Comparador de ejecuciones: La pantalla de resultados de una ejecución permite realizar comparaciones en una tabla configurable o mediante gráficas personalizadas (ver Insights).

Imagen 1: Artefacto de tipo MLProject para la generación de modelos.

Imagen 2:Comparación de modelos.

2. Mejora: Analiza, explora y elige el mejor modelo con Insights

Mejora: Analiza, explora y elige el mejor modelo con Insights

Descripción

Insights permite comparar runs de MLflow, evaluaciones y ejecuciones con métricas, artefactos y análisis de datos asociados, y construir dashboards de comparación.

Mejoras destacadas

  • Selección de métricas mediante navegación por árbol de proyecto.
  • Comparación gráfica de métricas entre assets.
  • Visualización de artefactos y resúmenes.
  • Análisis exploratorio de datos (EDAs) comparables.

Imagen: Interfaz Insight - comparación de ML Entities

3. Mejora: Aumenta tus capacidades de monitorizar y mejorar tus modelos (MLflow UI)

Mejora: Aumenta tus capacidades de monitorizar y mejorar tus modelos (MLflow UI)

Descripción

Intelligence ahora incluye un icono para desplegar MLflow UI y registrar experimentos, facilitando seguimiento y comparación.

Mejoras

  • Acceso directo a MLflow UI desde Intelligence.
  • Comparación gráfica de métricas y navegación por proyectos.

Imagen 1: Pantalla inicio Intelligence con icono MLflow UI

Imagen 2: Vista MLflow UI (Experiments, Models, Runs)

4. ¡Nuevo! Acelera tus procesos: gestión de entornos y dependencias

¡Nuevo! Acelera tus procesos: gestión de entornos y dependencias

¿Qué es?

Mejoras para reutilizar funciones y librerías empaquetadas como extensiones. Soporte para fijar dependencias y persistir entornos para reducir latencia y evitar conflictos de versiones.

¿Qué podemos conseguir?

  1. Generación de entornos virtuales a partir de un fichero .yaml (Conda).
  2. Congelar tu entorno: generar la lista completa de dependencias y subdependencias.

Imagen: Add extension / Generate from conda.yaml

Imagen: Entornos congelados

5. Mejora: Nuevos componentes para habilitar IA Generativa en Stratio Rocket

Mejora: Nuevos componentes para habilitar IA Generativa en Stratio Rocket

¿Qué es?

Nuevos componentes en flujos batch, híbridos y streaming para acelerar desarrollo de RAGs y generación de embeddings a partir de información no estructurada.

Componentes

  1. LoadDocument: extrae texto y metadatos de documentos.
  2. Modo 'documento': acceder a cada archivo detectado como tabla con metadatos como ubicación y fecha de modificación.
  3. TextSplitter y TextEmbeddings: fragmentado de texto y conversión a embeddings.
  4. Opensearch: salida hacia OpenSearch para almacenar embeddings.

Imagen: Nuevos componentes LoadDocument → TextSplitter → TextEmbeddings → Opensearch

Imagen: Configuración OpenSearch