Almacenes de datos (data warehouse)
Tipos de almacén de datos
El almacenamiento de datos es el depósito electrónico seguro de información por parte de una empresa u otra organización. El objetivo de los almacenes de datos es crear un conjunto de datos históricos que puedan ser recuperados y analizados para proporcionar una visión útil de las operaciones de la organización.
El almacenamiento de datos es un componente vital de la inteligencia empresarial. Este término más amplio engloba la infraestructura de información que las empresas modernas utilizan para hacer un seguimiento de sus éxitos y fracasos pasados y fundamentar sus decisiones para el futuro.
La necesidad de almacenar datos evolucionó cuando las empresas empezaron a depender de los sistemas informáticos para crear, archivar y recuperar documentos empresariales importantes. El concepto de almacenamiento de datos fue introducido en 1988 por los investigadores de IBM Barry Devlin y Paul Murphy.
El almacenamiento de datos está diseñado para permitir el análisis de datos históricos. La comparación de datos consolidados de múltiples fuentes heterogéneas puede proporcionar una visión del rendimiento de una empresa. Un almacén de datos está diseñado para que sus usuarios puedan realizar consultas y análisis sobre datos históricos procedentes de fuentes transaccionales.
Características del almacén de datos
Un almacén de datos es un repositorio central de información que proporciona a los usuarios información actual e histórica de apoyo a la toma de decisiones a la que es difícil acceder o que está presente en el almacén tradicional de datos operativos. Su objetivo principal es proporcionar una correlación entre los datos de diferentes sistemas, por ejemplo, conecta el inventario de productos almacenado en un sistema de compras con los pedidos emitidos para un cliente específico, que se almacenan en un sistema diferente.
Un almacén de datos suele residir en servidores dedicados a esta función que ejecutan un sistema de gestión de bases de datos [DBMS] como SQL Server. Se utiliza una herramienta de software de extracción, transformación y carga [ETL], como SQL Server Integration Services [SSIS], para obtener los datos de cada una de las fuentes adecuadas, incluidos los sistemas ERP que puedan estar en uso. Las herramientas ETL extraen los datos de los sistemas de origen, los leen y los editan, y luego organizan los datos de forma que faciliten el análisis.
El almacén de datos en la minería de datos
Un almacén de datos bien diseñado es la base de cualquier programa exitoso de BI o análisis. Su función principal es alimentar los informes, cuadros de mando y herramientas analíticas que se han convertido en indispensables para las empresas de hoy en día. Un almacén de datos proporciona la información para sus decisiones basadas en datos – y le ayuda a tomar la decisión correcta en todo, desde el desarrollo de nuevos productos hasta los niveles de inventario. Los beneficios de un almacén de datos son muchos. He aquí algunas de ellas:
Cuando los almacenes de datos se hicieron populares a finales de los años 80, se diseñaron para almacenar información sobre personas, productos y transacciones. Estos datos -llamados datos estructurados- estaban organizados y formateados para facilitar el acceso. Sin embargo, las empresas pronto quisieron almacenar, recuperar y analizar datos no estructurados, como documentos, imágenes, vídeos, correos electrónicos, publicaciones en redes sociales y datos brutos procedentes de sensores de máquinas. Un almacén de datos moderno puede albergar tanto datos estructurados como no estructurados. Al fusionar estos tipos de datos y romper los silos entre ambos, las empresas pueden obtener una imagen completa y exhaustiva para obtener los conocimientos más valiosos.
Almacén de datos oracle
El almacenamiento de datos es el almacenamiento electrónico seguro de información por parte de una empresa u otra organización. El objetivo de los almacenes de datos es crear un fondo de datos históricos que puedan ser recuperados y analizados para proporcionar una visión útil de las operaciones de la organización.
El almacenamiento de datos es un componente vital de la inteligencia empresarial. Este término más amplio engloba la infraestructura de información que las empresas modernas utilizan para hacer un seguimiento de sus éxitos y fracasos pasados y fundamentar sus decisiones para el futuro.
La necesidad de almacenar datos evolucionó cuando las empresas empezaron a depender de los sistemas informáticos para crear, archivar y recuperar documentos empresariales importantes. El concepto de almacenamiento de datos fue introducido en 1988 por los investigadores de IBM Barry Devlin y Paul Murphy.
El almacenamiento de datos está diseñado para permitir el análisis de datos históricos. La comparación de datos consolidados de múltiples fuentes heterogéneas puede proporcionar una visión del rendimiento de una empresa. Un almacén de datos está diseñado para que sus usuarios puedan realizar consultas y análisis sobre datos históricos procedentes de fuentes transaccionales.