Programación verde y Data Streaming
La programación "verde" y el Data Streaming son actores clave en el impulso de una tecnología más sostenible
Comentario de Sergio Durán Vegas, Global Staff Solutions Engineer
La llegada del big data ha traído consigo grandes avances y mejoras tanto para los negocios como para los usuarios finales, pero también supone una enorme carga medioambiental: cada gigabyte almacenado en la nube consume unos siete kilovatios de energía por hora. La forma de gestionar estos datos puede marcar la diferencia.
En días como el Día Mundial del Medioambiente, el 5 de junio, es la ocasión de plantearse cómo un uso eficiente de la tecnología puede ser beneficioso para el planeta. En Confluent, como pioneros en Data Streaming, somos muy conscientes de que tecnologías como esta pueden ser claves en el ahorro energético, haciendo más sostenible el procesamiento de data. En una sociedad cada vez más digital, todos los sectores deben buscar soluciones para evitar que nuestras actividades coarten cualquier esfuerzo para evitar el calentamiento del planeta.
El data streaming es más eficiente que el procesamiento por lotes
Las organizaciones tienen que decidir si el procesamiento de datos se hará por lotes (procesamiento de grandes volúmenes a intervalos programados) o a través de data streaming (procesamiento continuo de datos en tiempo real a medida que llegan). Un mito muy extendido es que el streaming debe ser menos eficiente porque requiere una potencia de procesamiento constante, al igual que puede ocurrir con la conducción: tener un vehículo en marcha continuamente es peor que encenderlo y apagarlo cuando se necesita.
Pero es precisamente la idea opuesta, y es que el procesamiento por lotes requiere picos tan regulares e intensos de potencia de procesamiento que es significativamente menos eficiente que un streaming continuo de bajo nivel. Por seguir con la analogía automovilística, esto equivale a apagar y poner de nuevo en marcha el coche en cada semáforo en rojo en vez de mantenerlo encendido pero en punto muerto. El resultado es que, evidentemente, se consume mucha más energía.
El streaming de datos permite que en lugar de esperar a que se acumule una masa de mensajes y procesarlos con un enorme pico de potencia de la CPU, se ejecuta un mensaje cada vez y se consume mucha menos energía, y el resultado es una ola suave en lugar de un maremoto repentino.
Unido a esto, el streaming de datos también proporciona un procesamiento que permite a las organizaciones predecir y pronosticar mejor sus necesidades, así como analizar el flujo de datos y prever qué energía será necesaria con mucha precisión. Lo mismo sucede con el almacenamiento, ya que el uso de la nube, de sistema serverless en combinación con las tecnologías nativas de compresión y tiered storage de Confluent, consigue tanto una optimización del uso de espacio al mismo tiempo que evita el uso innecesario de disco. Esto tiene el resultado final de una reducción clara tanto en costes como por ende en contaminación.
Para quienes trabajan en industrias basadas en grandes volúmenes de datos, la combinación de data streaming y un proveedor de cloud ecológico representa un gran paso hacia un futuro más sostenible.