Salta al contenido principal
4 / 9
Requisitos de finalización
Ver

2. Simplificando los filtros y la adición de columnas

Simplificando los filtros y la adición de columnas

En esta parte vamos a simplificar la parte donde aplicamos filtros y añadimos las columnas con los valores "verde, rojo, amarillo":

Podemos eliminar los pasos de Filter y AddColumns antes de proceder a añadir las nuevas cajas o eliminarlas a posteriori como prefiramos.

La idea es sustituir cada conjunto de transformación Filter+AddColumn por un solo paso de tipo Datawrangler.

Para ello añadimos un nuevo paso DataWrangler y lo conectamos por la izquierda con el paso JoinDB del que llegaban los datos al primer filtro y por la derecha al paso Union. Le ponemos a esta caja el nombre de RiesgoRojo.

En este paso de transformación vamos a añadir primero el filtro y luego la adición de la columna que incluye la etiqueta "Rojo". En este caso queremos aplicar estas dos transformaciones al conjunto completo de datos y por lo tanto no seleccionamos ninguna columna. DataWrangler nos permite realizar algunas acciones sin realizar esta selección entre ellas Filter (el icono del embudo en la parte superior) y AddColumn (el icono +):

Primero añadimos el filtro apareciéndonos un formulario para configurarlo:

Como vemos tenemos que incluir una condición para el filtro. en nuestro caso la condición para los de la etiqueta "Rojo" era:

LegalCase = 1 OR PoliceReport = 1

Por lo tanto la usamos en nuestra configuración:

Al aplicarla ya podemos ver en nuestra tabla de datos como se han seleccionado aquellas filas que cumplen dicha condición (tendremos que buscar las columnas desplazándonos en la tabla a la derecha):

El siguiente paso es añadir la columna con la etiqueta "Rojo", para ello hacemos click en el icono + para añadir una columna apareciéndonos de nuevo un formulario a rellenar:

Como vemos nos pide una Expresión (en nuestro caso el valor de la columna 'rojo') y un alias (el nombre de la columna en nuestro caso Riesgo):

Una vez aplicamos podremos ver en la tabla como se ha añadido la columna (a la derecha del todo de la tabla):

recordar que en el menu lateral derecho podemos borrar y editar todas estas transformaciones que añadimos:

Lo siguiente que deberemos hacer es añadir otras dos transformaciones DataWrangler para configurarlas de forma similar para la etiqueta Amarillo y la Etiqueta Verde. Para facilitar las condiciones reescritas para cada caso serían:

Amarillo: 

(LegalCase=0 AND PoliceReport=0) AND (ContactAudit = 1 OR FraudSuspicion = 1)

(LegalCase=0 AND PoliceReport=0 AND ContactAudit = 0 AND FraudSuspicion = 0) AND Credit_amount <= 4000

Una vez hecho esto deberíamos tener la estructura de la siguiente manera:

Y con todo funcionando correctamente como antes de realizar todos estos cambios.