Volvemos a hablar de expresiones informáticas, hoy con el uso de la palabra DATA

Data lake, data mesh, data fabric…

Amigos del Pulpo, y hoy nos estamos dirigiendo a los amigos más veteranos, vamos a retomar una de las tradiciones más recordadas de este blog, que no es otra que la de las entradas divulgativas sobre conocimientos de informática, sobre todo en relación al uso de expresiones definitorias de conceptos tecnológicos varios.  En concreto, hoy vamos a hablar de almacenamiento.

Como puede que recordéis algunos de vosotros, hace mucho tiempo nos dio por escribir post sobre las palabras y expresiones que han inundado el mundo digital en las últimas décadas, no sin cierta sorna e ironía, no sólo porque la guasa y el choteo sean marca de la casa en esta bitácora, sino porque esa terminología ya se presta en ocasiones a la mofa por sí misma; Digamos que donde hay friquis hay broma, es inevitable. Y otra cosa no, pero friquis en la informática, unos cuantos…

Hoy nos va a costar más ahondar en el pitorreo ya que, llegado un cierto nivel de profundidad en los tecnicismos, la materia se vuelve tan farragosa que el aburrimiento se impone a cualquier intento de diversión. Y es que nos vamos a adentrar, como ya hemos avisado, en el denso ámbito de las tecnologías de almacenamiento de datos. Ya tocamos este tema en su día, e incluso el Pulpo os hizo alguno de sus característicos exámenes al respecto, pero es uno de esos asuntos que nunca se acaban.

Hoy más bien hablaremos de una serie de conceptos que llevan la palabra DATA por delante (no como en Big Data, donde va por detrás -lo sentimos si esto está sonando feo-), y que a groso modo se podría decir que explican la forma en que se almacenan y/o gestionan los datos. Estos son el Data lake, el data mesh y el data fabric. Vamos allá, sin más preámbulos (que bastante tenemos ya…).

 

Data lake

Data_Lake

Un data lake es un repositorio de datos que almacena grandes volúmenes de información en su forma original, sin una estructura predefinida. A diferencia de los sistemas tradicionales de almacenamiento de datos, que requieren una modelación y transformación previa de los datos antes de almacenarlos, un data lake permite almacenar datos en su forma bruta, incluyendo datos estructurados, semiestructurados y no estructurados.

El concepto de data lake se basa en la idea de que la información puede ser valiosa incluso si no se tiene claro cómo será utilizada en el futuro. En lugar de imponer una estructura rígida a los datos desde el principio, se les permite existir en su estado natural dentro del data lake.

En definitiva, que esto es como guardo yo mis archivos de fotos, vídeos, películas, documentos y demás zarandajas en el disco duro externo que tengo por ahí como oro en paño: Si hay algo nuevo que tener, para dentro que va, a cholón.

 

Data fabric

fabric

El concepto de Data Fabric se refiere a una arquitectura de datos que busca integrar y unificar de manera coherente los diferentes sistemas, fuentes y formatos de datos dentro de una organización. Se trata de una infraestructura que permite gestionar y acceder a los datos de manera ágil y eficiente, facilitando su descubrimiento, integración, calidad, seguridad y análisis.

En un Data Fabric, los datos se consideran un activo empresarial fundamental y se diseñan procesos y tecnologías para asegurar su flujo, disponibilidad y confiabilidad en toda la organización. Algunas características clave del Data Fabric son la integración de datos, la virtualización de datos, los mecanismos para garantizar la calidad de datos, la seguridad y gobernanza y la la agilidad y escalabilidad.

Esto es lo menos parecido a como almaceno yo las cosas (los datos y las cosas físicas, en general). Como una leonera, vaya…

 

Data mesh

mesh

El concepto de Data Mesh es un enfoque emergente en la gestión de datos que busca descentralizar la responsabilidad y el poder sobre los datos en una organización. Propone un cambio en la forma en que se organizan, entregan y consumen los datos, alejándose de los enfoques centralizados y monolíticos hacia una estructura más distribuida y orientada al dominio.

En un entorno de Data Mesh, en lugar de tener un equipo centralizado que controla y administra todos los aspectos de los datos, se establecen equipos autónomos y multidisciplinarios en diferentes dominios o áreas de negocio. Cada uno de estos equipos es responsable de sus propios datos, incluyendo su calidad, gobernanza, entrega y mantenimiento. Estos equipos, a menudo denominados "dominios de datos", tienen la autoridad y la responsabilidad de definir y gestionar sus propias necesidades y requerimientos de datos.

Esto me vendría bien a mí: Alguien que me ordenara los calcetines y los calzoncillos, otra persona para las camisetas y los pantalones, otra más para las cartas de las multas, etc.

 

Otros conceptos con la expresión data

Data Warehouse: Sistema centralizado que recopila y almacena grandes cantidades de datos de diferentes fuentes en un formato estructurado y optimizado para el análisis.

Data Mart: Versión más pequeña y enfocada de un data warehouse, que se centra en un área específica de negocio y almacena datos relevantes para esa área en particular.

Data Governance: Se refiere a los procesos, políticas y estándares que garantizan la calidad, disponibilidad, integridad, seguridad y uso adecuado de los datos en una organización.

Data Integration: Proceso de combinar datos de diferentes fuentes y sistemas en un formato coherente y estructurado.

Data Mining: Proceso de descubrir patrones, relaciones y conocimientos útiles a partir de grandes conjuntos de datos.

 

¡Hala! ¡Toma pedazo de entrada divulgativa de lujo! Para que luego digan que las nuevas tecnologías no dan de sí. Realmente, si nos lo propusiéramos este blog sería infinito, de contenidos interminables… Y lo mejor de todo es que esto va a dar para un futuro exámen del Pulpo… ¡Avisados estáis!