El concepto de temperatura de
datos y acceso podemos aplicar lo desde dos componentes y siempre teniendo en
cuenta el contexto sobre el cual estamos trabajando:
- La temperatura de los datos hace referencia al momento en el cual se han producido esos datos, por ejemplo si nos encontramos en medio de una conferencia y alguno de los asistentes realiza una publicación sobre la misma, podemos hablar que ese dato es muy caliente, puesto que acaba de producirse en la línea temporal. En función del negocio en el que nos encontremos, la temperatura de los datos influirá en mayor medida en la toma de decisiones y en los análisis que debamos realizar.
- Acceso, vendrá determinado por el instante en el que accederemos a los datos, por ejemplo siguiendo el caso anterior, si almacenamos y analizamos un histórico de publicaciones de hace un año, estos serán datos menos calientes, siendo además su volumen mayor que los producidos en el día de hoy.
Este
factor debe ser tenido en cuenta a la hora de diseñar una solución de Big Data
al determinar las necesidades de almacenamiento a corto, medio y largo plazo y
por supuesto el coste requerido. La temperatura de los datos inicialmente se puede
clasificar en los siguientes tipos:
- Calientes, datos que se acaban de generar con un % de acceso muy elevado.
- Templados, datos con un cierto componente temporal que disponen de un % de acceso muy elevado.
- Fríos. datos básicamente históricos.
En
la siguiente imagen podemos ver una tabla donde para esta clasificación, que
nos muestra órdenes de magnitud a tener en cuenta en el tratamiento de los
mismos sobre diferentes variables como son el volumen de datos, el tamaño de
los elementos, latencia, durabilidad, velocidad de respuesta durante el
análisis de datos y el costo previsto para su almacenamiento.

Comentarios
Publicar un comentario