2. Simplificando los filtros y la adición de columnas
Simplificando los filtros y la adición de columnas
En esta parte vamos a simplificar la parte donde aplicamos filtros y añadimos las columnas con los valores "verde, rojo, amarillo":
Podemos eliminar los pasos de Filter y AddColumns antes de proceder a añadir las nuevas cajas o eliminarlas a posteriori como prefiramos.
La idea es sustituir cada conjunto de transformación Filter+AddColumn por un solo paso de tipo Datawrangler.
Para ello añadimos un nuevo paso DataWrangler y lo conectamos por la izquierda con el paso JoinDB del que llegaban los datos al primer filtro y por la derecha al paso Union. Le ponemos a esta caja el nombre de RiesgoRojo.
En este paso de transformación vamos a añadir primero el filtro y luego la adición de la columna que incluye la etiqueta "Rojo". En este caso queremos aplicar estas dos transformaciones al conjunto completo de datos y por lo tanto no seleccionamos ninguna columna. DataWrangler nos permite realizar algunas acciones sin realizar esta selección entre ellas Filter (el icono del embudo en la parte superior) y AddColumn (el icono +):
Primero añadimos el filtro apareciéndonos un formulario para configurarlo:
Como vemos tenemos que incluir una condición para el filtro. en nuestro caso la condición para los de la etiqueta "Rojo" era:
LegalCase = 1 OR PoliceReport = 1
Por lo tanto la usamos en nuestra configuración:
Al aplicarla ya podemos ver en nuestra tabla de datos como se han seleccionado aquellas filas que cumplen dicha condición (tendremos que buscar las columnas desplazándonos en la tabla a la derecha):
El siguiente paso es añadir la columna con la etiqueta "Rojo", para ello hacemos click en el icono + para añadir una columna apareciéndonos de nuevo un formulario a rellenar:
Como vemos nos pide una Expresión (en nuestro caso el valor de la columna 'rojo') y un alias (el nombre de la columna en nuestro caso Riesgo):
Una vez aplicamos podremos ver en la tabla como se ha añadido la columna (a la derecha del todo de la tabla):
recordar que en el menu lateral derecho podemos borrar y editar todas estas transformaciones que añadimos:
Lo siguiente que deberemos hacer es añadir otras dos transformaciones DataWrangler para configurarlas de forma similar para la etiqueta Amarillo y la Etiqueta Verde. Para facilitar las condiciones reescritas para cada caso serían:
Amarillo:
(LegalCase=0 AND PoliceReport=0) AND (ContactAudit = 1 OR FraudSuspicion = 1)
(LegalCase=0 AND PoliceReport=0 AND ContactAudit = 0 AND FraudSuspicion = 0) AND Credit_amount <= 4000
Una vez hecho esto deberíamos tener la estructura de la siguiente manera:
Y con todo funcionando correctamente como antes de realizar todos estos cambios.