Mejorando el workflow
3. Uso de DataAnalysis
Uso de DataAnalysis
En esta ocasión en vez de utilizar Discovery para ver el informe de datos vamos a utilizar una transformación llamada DataAnalysis que se encuentra en el apartado de AI:
Añadimos dicha transformación y la conectamos a la Union de los datos de todas las cajas de DataWrangler que hicimos en el paso anterior. Para ver los datos finales de este análisis conectamos nuestro paso a una salida de tipo Crossdata para almacenarlos en nuestro virtualizador quedándonos una estructura de la siguiente manera:
Procedemos a configurar nuestra transformación DataAnalysis. Para ello indicamos que queremos utilizar la columna Riesgo como objeto de nuestro análisis y que el tipo de análisis es "ML exploratory analysis" dejando todo el resto de parámetros por defecto:
Recordar configurar el apartado Writer para poner nombre a la tabla donde queremos almacenar los datos del análisis (por ejemplo analisis_datos_USERNAME). Si abrimos la consola de debug:
Seleccionando la transformación DataAnalysis vemos los resultados de este paso aplicados a una muestra de los datos:
Finalmente ejecutamos nuestro workflow y mediante el catálogo de Rocket en nuestro proyecto realizamos una consulta para ver el resultado final:
SELECT * FROM default.analisis_datos_USERNAME
Veremos en el resultado unos datos del tipo:
{"frequencies":[X,Y,Z],"values":["amarillo","rojo","verde"]}
Comparamos los valores X, Y y Z obtenidos aquí con los mostrados en el gráfico de Discovery del punto anterior que realizamos en esta práctica e incluimos en la documentación a entregar los valores obtenidos de X,Y y Z.