No es un secreto que el proceso de digitalización en el que estamos inmersos se ha convertido en el núcleo central del avance de las empresas, la tecnología y por supuesto de la sociedad. De hecho, durante la última década la importancia del dato como activo se ha visto potenciada, no solo por el volumen cada vez mayor de datos que se genera y captura sino también por el potencial existente en su explotación y extracción de valor como clave para esta transformación y el desarrollo económico.
Hablando en términos prácticos, gestionar los datos como un activo estratégico es cada vez más importante para sobresalir en el mercado. En este contexto, hablamos del potencial de contar con datos de calidad para que algoritmos de Inteligencia Artificial puedan ser entrenados, pero también de otros aspectos como la necesidad de infraestructuras adecuadas para procesarlos, herramientas para su análisis y visualización, y sobre todo la apuesta decidida a la hora de realizar una compartición controlada de los mismos entre los actores del sector y su cadena de valor.
Y entonces, ¿qué pasa con la seguridad de los datos? ¿qué tiene que ver todo esto con los espacios de datos? Mucho. Para que efectivamente se produzca ese intercambio voluntario de datos, necesitamos generar confianza entre aquellos que comparten sus datos, y garantizar la seguridad, portabilidad e interoperabilidad de los mismos. Valores que rigen la apuesta de la Unión Europea por impulsar la economía de los datos. Esto sin duda, supone un cambio de paradigma nada sencillo de afrontar, por ello es fundamental contar con espacios de experimentación e innovación con datos que faciliten y habiliten a empresas y administraciones en la creación de espacios de datos.
Un espacio de datos es una infraestructura que permite el acceso, almacenamiento, gestión, análisis y compartición voluntaria de datos entre diversos actores de una forma segura y en un entorno de confianza que facilita la extracción de valor y garantiza la soberanía de los datos para los propietarios de los datos.
INDDIS, un proyecto de empresas, para empresas
En esta línea, en ITI lideramos el proyecto INDDIS, a través del cual estamos trabajando por una parte en el diseño y puesta en marcha de un espacio de datos para la Industria de la Comunitat Valenciana, y por otra parte en la consolidación y expansión de un ecosistema de empresas dispuestas a explotar sus posibilidades.
En términos generales, el proyecto se dirige a empresas industriales valencianas, que generan gran cantidad de datos con potencial de explotación, y a empresas tecnológicas capaces de procesar y explotar estos datos. Aunque en general las empresas de la región son conscientes del valor de los datos, suele surgir dudas en cuanto al beneficio de participar en iniciativas de este tipo: ¿Qué gano yo con compartir mis datos? ¿Qué beneficios obtengo al participar en un proyecto como este?
Bien, en términos generales, las empresas que participan en un espacio de datos pueden verse beneficiadas desde tres puntos de vista. Por una parte, los beneficios relacionados con el conocimiento:
- sobre su punto de partida en cuanto a gestión y explotación de sus datos
- acerca de cómo de preparada se está para la adopción de tecnologías basadas en datos
- de las implicaciones de los aspectos legales y éticos de las técnicas de explotación de datos e Inteligencia Artificial.
En un segundo pilar, los beneficios relacionados con la facilidad para acceder:
- a un lugar seguro y de confianza en donde depositar los datos, que posteriormente podrían ser puestos a disposición de otros para que puedan explotarlos, creando aplicaciones que optimizan sus procesos
- a datos de terceros que complementen sus propios datos (cadena de valor) – en el caso de las empresas industriales / datos privados, públicos o sintéticos para el desarrollo de experimentos – en el caso de las tecnológicas.
- a Infraestructuras, herramientas y tecnologías para probar aplicaciones basadas en datos e IA y mejorar la competitividad.
Y en el tercer pilar, aquellos beneficios derivados del soporte:
- Soporte en la preparación de los datos, de forma que puedan ser fácilmente explotados y compartidos.
- Soporte en la planificación de valor que se puede obtener de sus datos, y formas de monetizar sus datos.
Con INDDIS se busca que este prototipo permita la explotación de datos en el sector y a lo largo de su cadena de valor de una forma segura y confiable y por ello ponemos especial énfasis en el desarrollo de las funcionalidades relacionadas con la gobernanza, la calidad y la seguridad del dato. Quizá alguno de estos términos os suene distante, en el post “datos, no me des más damelos mejor” se ejemplifican estos términos.
Pero…desde el punto de vista técnico ¿En qué se está trabajando?
Del lado técnico, el primer problema que se aborda es la gobernanza de datos, específicamente en lo relacionado con su usabilidad. Al respecto dotamos a las empresas de mecanismos y herramientas que les permitan estructurar, catalogar u organizar sus datos de manera adecuada. Y esto es realmente importante para que los usuarios puedan entender los datos a los que están accediendo. Como factor diferencial, nuestro desarrollo permite relacionar o encontrar un punto de encuentro entre la información técnica y la información de negocio.
En relación con la seguridad y control de acceso al dato, ofrecemos las herramientas necesarias para dictaminar quién accede a qué datos cuándo, cómo y por qué. Esta dimensión cobra cada vez más importancia debido a las regulaciones en este aspecto. Por ello, sabemos la importancia de garantizar que nadie que no esté expresamente autorizado pueda a acceder a los datos.
En términos de calidad del dato abordamos mecanismos que permitan evaluar datasets de manera objetiva en base a distintos indicadores y métricas, tanto generales como de naturaleza técnica y estamos trabajando para permitir la inclusión de indicadores de negocio. Esta evaluación permitirá conocer cuán buenos son estos datasets en base a los indicadores definidos, permitiendo comparar con otro de similares características o contexto. Además, puede permitir, entre otras cosas, llegar a identificar posibles problemas en la captura de los datos.
De forma transversal, trabajamos en la adopción de diversos mecanismos de ingesta o almacenamiento de datos. Esto tiene como objetivo aspectos como la optimización del espacio de almacenamiento, proporcionar mecanismos sencillos que puedan ser utilizados por los usuarios para introducir sus datos y facilitar su posterior explotación.