Componentes de la inteligencia de negocios
Fuentes de información.
Es donde se va adquiriendo la información para la alimentación del datawarehouse. por mencionar algunas fuentes de información son: sistemas departamentales, fuentes de información externas, sistemas operacionales.
Proceso ETL
La
primera parte del proceso ETL consiste en localizar y extraer los datos, ya que
en la mayoría de los proyectos de almacenamiento se fusionan datos provenientes
de diferentes sistemas de origen tales como ERP, CRM, bases de datos,
plantillas Excel, etc
Los
formatos de las fuentes normalmente se encuentran en bases de datos
relacionales o ficheros planos, pero pueden incluir también bases de datos no
relacionales y otras estructuras o formatos diferentes. La extracción convierte
los datos a un formato homogéneo y consolidado para iniciar el proceso de transformación.
Un
requerimiento importante que se debe exigir a la tarea de extracción es que
ésta cause el menor impacto en el sistema de origen. Si los datos a extraer son
muchos, el sistema de origen se podría ralentizar e incluso colapsar,
provocando que éste no pueda utilizarse con normalidad para su uso cotidiano.
Por esta razón, en sistemas grandes las operaciones de extracción suelen
programarse en horarios o días donde este impacto sea nulo o mínimo.
La
fase de carga es el momento en el cual los datos de
la fase anterior (transformación) son cargados en el sistema de destino.
Datawarehouse
Un Datawarehouse es una base de datos corporativa que
se caracteriza por integrar y depurar información de una o más fuentes distintas,
para luego procesarla permitiendo su análisis desde infinidad de perspectivas y
con grandes velocidades de respuesta. La creación de un datawarehouse
representa en la mayoría de las ocasiones el primer paso, desde el punto de
vista técnico, para implantar una solución completa y fiable de Business
Intelligence.
La ventaja principal de
este tipo de bases de datos radica en las estructuras en las que se almacena la
información (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc). Este tipo de persistencia de la información es homogénea
y fiable, y permite la consulta y el tratamiento jerarquizado de la misma
(siempre en un entorno diferente a los sistemas operacionales).
Olap server
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el
campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo
es agilizar la consulta de grandes cantidades de datos. Para ello utiliza
estructuras multidimensionales (o Cubos OLAP)
que contienen datos resumidos de grandes Bases de
datos o Sistemas
Transaccionales (OLTP).
Se usa en informes de negocios de ventas, marketing, informes de dirección,minería de datos y áreas similares.
La razón de usar OLAP para las
consultas es la rapidez de respuesta. Una base de datos relacional almacena
entidades en tablas discretas si han sido normalizadas. Esta estructura es
buena en un sistema OLTP pero para las complejas consultas
multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor
desde el punto de vista operativo) es una base de datos multidimensional.
La principal característica que
potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para
operaciones de tipo INSERT, UPDATE Y DELETE.
Herramientas de acceso
son todos aquellos host finales en donde podemos visualizar la información procesada para la toma de decisiones.
No hay comentarios.:
Publicar un comentario