Salta al contenido principal

Práctica Opcional (Gen-AI)

Sitio: STRATIO Training & Certification
Curso: Práctica Stratio Generative AI Artificial Intelligence (14.6)
Libro: Práctica Opcional (Gen-AI)
Imprimido por: Invitado
Día: jueves, 17 de julio de 2025, 03:33

Descripción



1. Crea un notebook

Crea un notebook

Con un nombre parecido a este “practice_cert_44_notebook” del tipo "pyspark":

Abre el notebook, si no tienes acceso solicitalo a certification@stratio.com

Una vez abierto debes tener algo parecido a esto

2. Instanciamos una session del virtualizador

Instanciamos una session del virtualizador

Lo primero instanciamos una session del virtualizador con este código


from pystratio.xd.xdsession import XDSession
xd_session = XDSession(sc)

3. Asistente incorporado en el notebook con “%ai sql”

Asistente incorporado en el notebook con “%ai sql”

Después vamos a usar lo primero el asistente incorporado en el notebook con “%ai sql” y deberíamos tener una pantalla parecida a la siguiente

Aquí consultaremos la colección semantic_c_ad_practice y podemos elegir el idioma “es”, vamos a preguntar “Dame el listado de productos vendidos incluyendo el tipo de envío y el territorio”, deberíamos obtener un resultado parecido al siguiente:

Aplicamos la sql y esto nos da el código pyspark para hacer la consulta la ejecutamos obteniendo el siguiente resultado.

4. Usando el api

Usando el api

Ahora vamos a probar como hacer lo mismo usando el api que se ha añadido al código.

Escribimos lo siguiente


sql_builder = xd_session.genai.sql_builder(database="semantic_c_ad_practice")
response, sql_query = sql_builder.ask("Dame el listado de productos vendidos incluyendo el tipo de envío y el territorio")
df = sql_builder.apply_query()
df.show(10)
df.explain()

Obtenemos una pantalla similar a esta

5. Generar una transformación de un dataframe

Generar una transformación de un dataframe

Ahora vamos a generar una transformación de un dataframe, en pyspark con lenguaje natural.

Introducimos este código


df_formed, code = df.genai.basic_transform_with_code(
instruction = "Cuantos productos se han vendido por region y sácame una gráfica en pandas",
verbose = True,
generate_new_cell = True)

y vemos que debería generar algo parecido a esto

Que podemos ejecutar

6. Como añadir conocimiento

Como añadir conocimiento

Vamos a probar ahora como añadir conocimiento tando de columnas como general:

Para ello vamos a introducir este código


df = df \
.genai.add_column_description(
	col_name="TerritoryName",
	description="Nombre del Territorio "
)\
.genai.add_column_description(
	col_name="TerritoryName",
	description="'Europa' = ['France','Germany']"
)\
.genai.add_knowledge("Ventas no fiables: las ventas no fiables son todas aquellas realizadas con el tipo de envío 'CARGO TRANSPORT 5'")

y haremos estas dos preguntas


transformed_df, code = df.genai.basic_transform_with_code("Dame los productos vendidos en 'Europa'")

lo cual nos debería dar este resultado

Y esta otra pregunta


 transformed_df, code = df.genai.basic_transform_with_code("Damde la lista de Ventas No fiables")

Y debería dar este resultado

Ambos los podemos ejecutar y ver el resultado de la ejecución, revisaremos si hay algún campo que no está en el dataframe para eliminarlo y poder ejecutar el código.