Parte 1: Creación de procesos de transformación de datos con lenguaje natural
Sitio: | STRATIO Training & Certification |
Curso: | Práctica Generative AI Data Processing (14.6) |
Libro: | Parte 1: Creación de procesos de transformación de datos con lenguaje natural |
Imprimido por: | Invitado |
Día: | jueves, 17 de julio de 2025, 23:43 |
1. Creación del proyecto
Creación del proyecto
Crear un proyecto en Rocket de tipo Hybrid con la nomenclatura: Practica_cert_44_nombreusuario
.
Crear un asset de tipo Hybrid con el nombre: Practice_cert_44_rocket
.
Acceder al workflow haciendo clic en su nombre.
2. 2. Creación y edición del input SQL
2. Creación y edición del input SQL
Crear un input SQL.
Editarlo y generar una consulta para el dominio c_ad_practice utilizando el asistente de GenAI.
Ingresar la siguiente pregunta: "Dame el listado de productos vendidos incluyendo el tipo de envío y el territorio".
Aplicar la consulta y revisar la explicación proporcionada en "AI Explanation".
Habilitar el modo Debug para visualizar un ejemplo del resultado.
Explorar los campos generados.
Capturar una pantalla del gráfico de la variable categórica territory name y otra variable relevante.
3. Aplicación de filtros
Aplicación de filtros
Agregar un filtro de tipo "Trigger" para seleccionar productos con tipo de envío CARGO TRANSPORT 5.
Depurar y revisar los datos obtenidos.
Agregar otro filtro de tipo "Trigger" para filtrar por el territorio Canada.
Depurar y revisar los resultados.
Incorporar una transformación de tipo PySpark para filtrar productos con nombre AWC Logo Cap.
Aplicar el código y depurar los datos resultantes.
Modificar el nombre de la caja PySpark.
4. Configuración del destino
Configuración del destino
Añadir un destino de tipo Delta.
Modificar la ruta de destino a /certification/students/username/, reemplazando username por el usuario del ambiente.
Depurar el workflow y capturar una pantalla con los datos generados en el output.
Guardar el workflow.
Ejecutar el resultado y adjuntar una captura de pantalla del fichero generado.
Acceder al File Browser para verificar la existencia del fichero de salida.