Salta al contenido principal

Mejorando el workflow

3. Uso de DataAnalysis

Uso de DataAnalysis

En esta ocasión en vez de utilizar Discovery para ver el informe de datos vamos a utilizar una transformación llamada DataAnalysis que se encuentra en el apartado de AI:

Añadimos dicha transformación y la conectamos a la Union de los datos de todas las cajas de DataWrangler que hicimos en el paso anterior. Para ver los datos finales de este análisis conectamos nuestro paso a una salida de tipo Crossdata para almacenarlos en nuestro virtualizador quedándonos una estructura de la siguiente manera:

Procedemos a configurar nuestra transformación DataAnalysis. Para ello indicamos que queremos utilizar la columna Riesgo como objeto de nuestro análisis y que el tipo de análisis es "ML exploratory analysis" dejando todo el resto de parámetros por defecto:

Recordar configurar el apartado Writer para poner nombre a la tabla donde queremos almacenar los datos del análisis (por ejemplo analisis_datos_USERNAME). Si abrimos la consola de debug:

Seleccionando la transformación DataAnalysis vemos los resultados de este paso aplicados a una muestra de los datos:

Finalmente ejecutamos nuestro workflow y mediante el catálogo de Rocket en nuestro proyecto realizamos una consulta para ver el resultado final:

SELECT * FROM default.analisis_datos_USERNAME

Veremos en el resultado unos datos del tipo:

{"frequencies":[X,Y,Z],"values":["amarillo","rojo","verde"]}

Comparamos los valores X, Y y Z obtenidos aquí con los mostrados en el gráfico de Discovery del punto anterior que realizamos en esta práctica e incluimos en la documentación a entregar los valores obtenidos de X,Y y Z.