La virtualización de datos: presente y futuro de la integración de datos
Según Gartner, en 2020 un 50 por ciento de las grandes empresas habrá implementado soluciones de virtualización de datos, como una opción eficiente y económica para la integración de datos.
En la era actual de transformación digital, la cantidad y variedad de fuentes de datos que manejan las empresas crecen de forma exponencial, por lo que la capacidad de integrar, gestionar y analizar esos datos se convierte en un importante desafío.
La virtualización de datos se presenta en este escenario como una gran aliada para permitir a las organizaciones reducir costes y afrontar cambios con mayor agilidad. De hecho, Gartner estima que las empresas que implementan virtualización de datos reducen hasta un 45% sus costes de integración de datos. Denodo, empresa líder en virtualización de datos, comparte sus predicciones en este campo para el año 2019:
• La integración del aprendizaje automático (machine learning) y la virtualización de datos será aún más importante para las empresas. La analítica basada en AI (Inteligencia Artificial) seguirá cobrando importancia este año, en paralelo a la aparición de nuevas herramientas que eliminen las barreras para aplicar técnicas de AI en todo tipo de aplicaciones. Sin embargo, los resultados que ofrecen estas técnicas dependen de la calidad de los datos que procesan y los data scientists aún dedican más de un 80% de su tiempo a descubrir, integrar y preparar los datos que necesitan, como apuntaba un estudio de CrowdFlower. La virtualización de datos es capaz de exponer con facilidad todos los datos relevantes para la empresa en el formato que mejor se ajuste a cada aplicación y esto mejora enormemente la productividad de los data scientists. Por ello, esta tecnología va a tener un papel cada vez más protagonista en las arquitecturas de data science.
• Aumentará el uso de catálogos de datos con autoservicio e interactivos basados en virtualización de datos. En 2019 las empresas emplearán cada vez más las herramientas de Catálogo de datos como parte de su estrategia de ‘autoservicio de información’. Los Catálogos de datos permiten a los usuarios y desarrolladores de aplicaciones de negocio localizar fácilmente datos relevantes para sus necesidades, como alternativa a la comprobación de numerosas fuentes de datos dispares alojadas en silos. Para ser realmente efectivos, los Catálogos de datos, deben integrarse con una capa unificada de delivery de información como la proporcionada por la virtualización de datos. De esta manera, los catálogos pasan a ser realmente dinámicos: reflejan la realidad de las fuentes de datos reales y garantizan que todos los usuarios tengan una manera única, segura y gobernada de acceder a cualquier conjunto de datos en el catálogo, sin preocuparse de en qué sistema reside o cuál es su formato nativo. Las empresas y sus equipos de TI necesitan un medio para descubrir, organizar y describir los activos de datos empresariales y los catálogos de datos basados en la virtualización de datos pueden ser la respuesta.
• De legacy a cloud: las arquitecturas híbridas en múltiples localizaciones se convertirán en la norma. A medida que las iniciativas cloud progresen, con un volumen cada vez mayor de datos migrándose a entornos en la nube, el centro de gravedad de los datos cambiará, y la necesidad de integración de datos distribuidos en varias localizaciones aumentará drásticamente. A diferencia de las tecnologías de integración de datos tradicionales, la virtualización de datos se diseñó desde un principio para proporcionar una integración y gestión unificadas de datos distribuidos en múltiples ubicaciones, lo que la hace muy adecuada para este tipo de escenarios. Por lo tanto, la virtualización de datos tendrá un papel cada vez más importante en las arquitecturas híbridas cloud.
Todo lo anterior pone de manifiesto que la virtualización de datos no solo es el futuro, sino que es ya el presente de la integración de datos. El próximo año se presenta como una gran oportunidad para que las empresas implementen esta tecnología para tomar decisiones más informadas a la vez que reducen muy significativamente los costes asociados a la integración de datos.