Salta al contenido principal

Documentación: Análisis y soluciones en el mercado

Sitio: STRATIO Training & Certification
Curso: Stratio Generative AI Data Fabric Basic Business 14.6
Libro: Documentación: Análisis y soluciones en el mercado
Imprimido por: Invitado
Día: sábado, 10 de mayo de 2025, 11:59

1. El futuro de las plataformas de datos

Tanto Forrester como Gartner llegaron a la conclusión de que había una mejor manera de obtener valor de los datos: "Data Fabric" y que si queremos aplicar Inteligencia Artificial Generativa para generar aún más valor a nuestra empresa lo tenemos que hacer a partir de tener nuestros datos gestionados con un Data Fabric.


El objetivo de Stratio es ser lider de Data Fabric a nivel mundial. Igual que hace 10 años el lider de BigData era Cloudera en la era del Data Fabric queremos ser el lider mundial.


2. Forrester y Gartner

¿Quienes son Forrester y Gartner?

Gartner y Forrester son dos de las principales empresas de investigación y consultoría tecnológica a nivel mundial. Ambas empresas ofrecen servicios de asesoramiento y análisis de tecnologías de la información y el mercado de la tecnología.


_______________________________________________________________________________________________________________________________________
_______________________________________________________________________________________________________________________________________


Gartner es una empresa estadounidense fundada en 1979, que se especializa en el análisis y la investigación de tecnologías de la información. Gartner es conocida por su famoso "Cuadrante Mágico", una herramienta de análisis que clasifica a los proveedores de tecnología en función de su capacidad de ejecución y su visión estratégica.




El Gartner's Magic Quadrant (Cuadrante Mágico de Gartner) es una herramienta de análisis de mercado que evalúa a los proveedores de tecnología en función de su capacidad de ejecución y su visión estratégica en un mercado determinado. Esta herramienta es muy utilizada por las empresas para evaluar y comparar a los proveedores de tecnología y para tomar decisiones informadas de compra.

El Gartner's Magic Quadrant se representa gráficamente como un cuadrante dividido en cuatro cuadrantes, en los que se evalúan a los proveedores de tecnología en función de dos criterios: la "complejidad" (ability to execute) y la "visión" (completeness of vision). Los proveedores que se sitúan en el cuadrante superior derecho se consideran líderes en el mercado, mientras que los que se sitúan en el cuadrante inferior izquierdo se consideran proveedores menos destacados.

El Gartner también ha creado una herramienta llamada "Gartner's Magic Quadrant for Emerging Technologies" (Cuadrante Mágico de Gartner para Tecnologías Emergentes), que se enfoca en evaluar las tecnologías emergentes que tienen el potencial de transformar la industria en el futuro cercano. Esta herramienta se actualiza anualmente y proporciona información valiosa para las empresas que desean conocer las tendencias tecnológicas emergentes y estar preparadas para el futuro.



______________________________________________________________________________________________________________________
______________________________________________________________________________________________________________________






Forrester es otra empresa estadounidense fundada en 1983, que se especializa en la investigación y el análisis de tecnologías de la información y el mercado de la tecnología. Forrester es conocida por su "Wave", una herramienta de evaluación que clasifica a los proveedores de tecnología en función de su capacidad actual y su estrategia de futuro.



Forrester Wave es una herramienta de evaluación de proveedores de tecnología que Forrester utiliza para evaluar la capacidad actual y la estrategia de futuro de los proveedores en un mercado determinado. Esta herramienta se utiliza para ayudar a las empresas a tomar decisiones informadas al evaluar y comparar a los proveedores de tecnología en un mercado determinado.

El Wave de Forrester evalúa a los proveedores de tecnología en función de tres criterios principales: oferta actual, estrategia y presencia en el mercado. Para cada criterio, se evalúan a los proveedores de tecnología en función de varios subcriterios. En total, se utilizan alrededor de 10 a 15 subcriterios para evaluar a los proveedores de tecnología en cada mercado.

El resultado de la evaluación se representa gráficamente como un gráfico de ondas, donde los proveedores se sitúan en diferentes categorías, como líderes, fuertes contendientes, contendientes y otros.

El Wave de Forrester se actualiza periódicamente para reflejar los cambios en el mercado y en las capacidades de los proveedores de tecnología. Esta herramienta es muy utilizada por las empresas para evaluar a los proveedores de tecnología en un mercado determinado y para tomar decisiones informadas al seleccionar un proveedor de tecnología.




______________________________________________________________________________________________________________________
______________________________________________________________________________________________________________________

El Gartner's Magic Quadrant y el Forrester Wave son dos herramientas clave utilizadas por las empresas para evaluar y comparar a los proveedores de tecnología en un mercado específico. Ambas proporcionan una visión valiosa de la capacidad actual y la estrategia de futuro de los proveedores, lo que ayuda a las empresas a tomar decisiones informadas de compra y a mantenerse al tanto de las tendencias tecnológicas emergentes.


2.1. Definición de Data Fabric según Forrester y Gartner


  • Forrester define el Data Fabric como una arquitectura unificada que permite la gestión y el acceso a los datos de manera ágil y coherente en toda la organización. Según Forrester, la Data Fabric se compone de tres elementos clave:
  1. Integración de datos: permite la conexión y la integración de datos de diversas fuentes, independientemente de su ubicación o formato.

  2. Calidad de datos: garantiza la calidad y la consistencia de los datos mediante la aplicación de políticas y procesos de limpieza, validación y normalización.

  3. Acceso a datos: proporciona un acceso seguro y controlado a los datos para los usuarios y aplicaciones autorizados, mediante un catálogo de datos centralizado y una capa de seguridad que protege los datos sensibles.

En resumen, la Data Fabric se trata de una arquitectura de datos flexible, escalable y unificada que permite a las organizaciones aprovechar el valor de sus datos de manera más efectiva.


_______________________________________________________________________________________________________________________________________
_______________________________________________________________________________________________________________________________________

  • Gartner define la Data Fabric como una arquitectura de datos flexible y unificada que permite la gestión y el acceso a los datos de forma rápida, ágil y coherente en cualquier entorno de datos, ya sea on-premise o en la nube.

Según Gartner, la Data Fabric se compone de cuatro características clave:

  1. Integración de datos: permite la conexión y la integración de datos de diversas fuentes, independientemente de su ubicación o formato.

  2. Movilidad de datos: permite la transferencia de datos entre diferentes entornos de datos, lo que facilita la movilidad de los datos de forma segura y eficiente.

  3. Calidad de datos: garantiza la calidad y la consistencia de los datos mediante la aplicación de políticas y procesos de limpieza, validación y normalización.

  4. Acceso a datos: proporciona un acceso seguro y controlado a los datos para los usuarios y aplicaciones autorizados, mediante un catálogo de datos centralizado y una capa de seguridad que protege los datos sensibles.


Gartner indica que hay que enriquecer con metadatos, knowledge graphs, semántica y ontologías.

En resumen, la Data Fabric se trata de una arquitectura de datos unificada y flexible que permite a las organizaciones gestionar y acceder a sus datos de forma eficiente y segura en cualquier entorno de datos.


_______________________________________________________________________________________________________________________________________
_______________________________________________________________________________________________________________________________________


Si un cliente le hace una consulta a Gartner y a Forester no recomienda implantar un lago de bigdata y en general tanto Forester y Gartner recomiendan ir al concepto de Data Fabric.

2.2. Stratio Cool Vendor

Somos uno de los Cool vendor de Data Fabric a nivel mundial,  que es la antesala al Imagine Cuadrant, que hemos mencionado en el punto anterior.



https://blog.stratio.com/stratio-is-named-gartner-cool-vendors-2021-in-data-management/


Stratio es reconocido como Cool Vendor por Gartner por nuestra innovadora plataforma de estructura de datos aumentada que entrega datos con significado semántico a todos los posibles consumidores de una empresa (usuarios comerciales, procesos de IA, aplicaciones, informes, flujos de trabajo de datos, herramientas de BI externas…).

Stratio aumenta la comprensión de los datos para los usuarios empresariales. Al mapear los datos de las empresas en su capa de datos comerciales (BDL), impulsa el consumo de datos y, al mismo tiempo, mejora la productividad de los usuarios comerciales al automatizar la mayoría de las tareas.

El BDL (Business Data Layer) de Stratio permite a las empresas utilizar ontologías estándar de la industria para representar sus datos en un gráfico de conocimiento. A medida que se descubren nuevos activos comerciales y nuevas relaciones, el gráfico correspondiente y los esquemas semánticos se establecen automáticamente dentro de la BDL.






El informe Cool Vendor publicado el 21 de octubre de 2021 establece que "Para 2024, las organizaciones que utilizan metadatos activos para enriquecer y entregar una estructura de datos dinámica reducirán el tiempo de entrega de datos integrados en un 50 % y mejorarán la productividad de los equipos de datos en un 20 %".

Continúa diciendo que “las organizaciones luchan por crear diseños de estructura de datos. Actualmente, los equipos de ingeniería de datos realizan un esfuerzo significativo para acceder, integrar, modelar y enriquecer los datos. Las organizaciones ven el valor de crear una estructura de datos, pero a menudo no saben cómo empezar”.

Stratio, con su plataforma de Data Fabric lista para usar, resuelve este problema y permite a las empresas iniciar rápidamente su viaje de Data Fabric.


2.3. Stratio Magic Quadrant

StratioBD ha sido reconocida con una Mención Honorífica en el informe de este año del Cuadrante Mágico de Herramientas de Integración de Datos.

El Cuadrante Mágico de Gartner para Herramientas de Integración de Datos es el estándar de oro de la industria para evaluar a las principales empresas de datos y es comunmente utilizado por líderes empresariales para tomar decisiones informadas al seleccionar soluciones de integración de datos adecuadas para sus requisitos individuales.

Gartner reconoció el producto Stratio Generative AI Data Fabric, que simplifica la comprensión de los datos para los usuarios de negocio al mapear los datos empresariales en una capa unificada de datos comerciales. Esto permite analíticas avanzadas y generativeAI para empresas.


+info: https://www.stratio.com/blog/stratio-bd-included-in-gartners-2023-data-integration-tools-magic-quadrant-and-emerging-tech-impact-radar/?utm_source=linkedin&utm_medium=social&utm_campaign=stratioweb&utm_term=ww&utm_content=gartner_honourable_mention


3. Data Fabric


Data Fabric consiste en lograr crear una capa de datos unificada  a partir de esos silos de datos, con dos diferencias fundamentales:

  • Capa de datos unificada de manera AUTOMÁTICA. En el data fabric se automatizan las cosas desde el gobierno del dato. Los datos deben estar GOBERNADOS.


  • Esa capa unificada debe ser CONFIABLE, tiene que tener el dato CALIDAD y SEGURIDAD. Y dirigida al AUTOCONSUMO.





¡OJO! En azure o cualquier public cloud se mueven los datos con ETLs con programas, etc. y desde ahí se transforman, exactamente lo mismo que hacíamos con los datawarehouses desde hace 20 años. esto NO ES DATAFABRIC.






3.1. Valor del Data Fabric

¿Cuál es entonces el valor o beneficio inmediato del Data Fabric?


El data fabric es capaz de generar 4 veces más eficiencia en obtener valor del dato, reduciendo el coste humano a la mitad.



Cualquier caso de uso que cualquier cliente quiera hacer somos capaces con el datafabric de hacerlo mucho más rápido y con menos coste.


Por esto el mercado está transicionando al Data Fabric a toda velocidad.


3.2. Data Fabric en el mercado

Según Gartner, el data fabric en el mercado está todavía poco madurado.

 Stratio tiene sistemas críticos en alguna de las empresas mayores del mundo con todas las capas del data fabric. Quiere decir que estamos completamente maduros, estamos 2, 3, 4 años por encima del mercado.



4. Data Mesh

Data Mesh es un enfoque sociotécnico descentralizado para compartir, acceder y gestionar datos analíticos en un entorno complejo y a gran escala dentro o entre las organizaciones.

Consiste en cambiar los propietarios de los datos y cambiar el enfoque de cómo son consumidos y usados en la arquitectura de datos.


Consiste en trabajar y manejar los datos con tecnologías distribuidas en dominios de datos desacoplados (clientes, ventas, España, México, etc), con un gobierno del dato federado, para que los datos estén sincronizados y en los que se construyen Data Products (casos de uso) en cada dominio, autoconsumibles por los usuarios.


Ej. Santander está yendo hacia DataMesh a toda velocidad, Unicredit, CeMeX.


Es uno de los grandes conceptos de datos.


_________________________________________________________________________________________________________

NOTA: Si el cliente no va a necesitar las funcionalidades que ofrece DataMesh, no es necesario entrar en esta parte.


4.1. Desarrollo del Data Mesh en Stratio

Integrar y construir un DataMesh con todas las tecnologías y componentes necesarios es una tarea extremadamente desafiante

Requiere una amplia gama de habilidades y conocimientos, desde tecnologías de contenedores y orquestación como Kubernetes hasta la gestión del gobierno del dato, la implementación de algoritmos y la utilización de servicios de nube pública, entre otros.

Es por eso que muchas empresas buscan la ayuda de proveedores y expertos en tecnología, como Stratio, para implementar con éxito un enfoque de Data Mesh en sus operaciones. Estos expertos pueden proporcionar la experiencia necesaria y las soluciones listas para usar que facilitan la construcción de un DataMesh de manera efectiva.

¿Hasta que punto hemos desarrollado este concepto en Stratio?

El desarrollo de Data Mesh en Stratio implica la implementación de tecnologías distribuidas y un enfoque descentralizado para compartir, acceder y gestionar datos en un entorno complejo y a gran escala. Esto se logra al trabajar con dominios de datos desacoplados, donde cada dominio representa una unidad independiente (por ejemplo, clientes, ventas, regiones geográficas) con su propio gobierno del dato federado.

En estos dominios, se construyen Data Products (casos de uso específicos) que son autoconsumibles por los usuarios, lo que significa que los datos se utilizan de manera más eficiente y con mayor autonomía dentro de cada dominio

Este enfoque permite a Stratio aprovechar la flexibilidad y escalabilidad de Data Mesh  para abordar las necesidades de sus clientes de manera más rápida y eficaz, lo que les permite aprovechar al máximo sus activos de datos y acelerar el desarrollo de soluciones de datos personalizadas para abordar sus necesidades comerciales específicas.

En resumen, Stratio está implementando Data Mesh como un enfoque clave para la gestión de datos que permite a sus clientes


__________________________________________________________________________________________________________________________________

El objetivo final del DataMesh es hacer en dominios de datos, DataProducts autoconsumibles para los usuarios.

Para ayudar a esto hemos desarrollado productos que simplifican la creación de un DataMesh.

Creamos desde gobierno del dato, un producto que se llama Data Product Market Place en el que eres capaz de publicar cualquier Data Product que construyes en el que los usuarios de esa unidad de negocio o país solicitan el acceso a un report, algoritmo o a una aplicación inteligente o colección de datos, y si el data owner da acceso, se genera un Data Contract en el que el usuario tienen responsabilidad de qué van a hacer con ese producto y se audita y se controla y se tiene absoluta seguridad de qué está haciendo cada usuario con cada Data Product.







5. Generative AI

La IA Generativa está empezando a desempeñar un papel crucial en la gestión de datos en las organizaciones.

La IA Generativa se utiliza para crear datos sintéticos realistas, completar información faltante, generar contenido, entre otros usos. En el contexto de la gestión de datos, la IA Generativa puede:

1. Generar Datos Sintéticos: La IA Generativa puede crear datos de prueba o simulados que se asemejan a los datos reales. Esto es útil para el desarrollo y pruebas de aplicaciones sin exponer datos sensibles.

2. Completar Datos Faltantes:
Puede utilizarse para llenar lagunas en conjuntos de datos, mejorando su integridad y utilidad.

3. Generar Informes y Documentación:  La IA Generativa puede ser empleada para crear informes, resúmenes y documentación basada en datos de manera más rápida y eficiente.

4. Automatizar la Análisis de Datos:
Puede ayudar a identificar patrones, tendencias y anomalías en grandes volúmenes de datos, agilizando el proceso de análisis.

5. Predicciones y Análisis Avanzado:
La IA Generativa puede utilizarse en análisis predictivos y generación de escenarios futuros basados en datos históricos.

6. Optimizar Procesos de Toma de Decisiones: Puede sugerir recomendaciones basadas en datos para mejorar la toma de decisiones de la organización.

En resumen, la IA Generativa está empezando a revolucionar la gestión de datos al agregar eficiencia y capacidades avanzadas para aprovechar al máximo la información. 

Las organizaciones la utilizan para obtener información más precisa y rápida, lo que les permite tomar decisiones más informadas y generar más valor a partir de sus datos.


NOTA: ampliamos la información en los siguientes puntos.