sábado, 27 de septiembre de 2014

Modelo Dimensional del Kardex (realizado en la entrada 1)


En el siguiente post se presenta una propuesta de Modelo Dimensional a la actividad desarrollada en la primera entrada, que consistía en realizar un sistema automatizado, implementando una Base de datos en 3FN (tercera forma normal) del proceso que lleva a cabo el departamento de Control de Estudio de la Facultad de Ciencia en la UCV (específicamente la escuela de computación), el cual lleva un control académico de los estudiante de dicha casa de estudio en un documento denominado "Kardex".


Modelo Dimensional:



En el siguiente enlace se muestra el informe técnico donde se registro la solución de dicha actividad.

lunes, 22 de septiembre de 2014

Una introduccion al modelado dimensional


Esta entrada basada en el capitulo 5 y 6 del libro Kimball LifeCycle trata de una introducción al modelado dimensional, donde se abordan los conceptos de:


Modelado Dimensional: 

Es una técnica para modelar la información aplicada en el desarrollo de un DataWarehouse buscando modelar esa información con unos esquemas claros, fácilmente comprensibles por el usuario final y con buenos rendimientos en las consultas masivas. Para conseguirlo, es permitida la redundancia de datos y la consistencias no se garantiza a través de la estructura de la base de datos, sino dejando esta responsabilidad a los programas de carga de información.

La gran diferencia con el modelo entidad-relación  es que  el E/R busca ante todo eliminar redundancias lo que conlleva a descomponer la información en múltiples entidades y relaciones que se corresponderán con diferentes tablas en el diseño de la base de datos.


Datamarts: 

Es un pequeño almacén de datos, diseñado para una unidad de negocio. Se refiere a una vista del DataWarehouse orientada sólo a un aspecto de la organización, contiene mucha menos cantidad de datos que el Datawarehouse.


Tabla de Hechos: 

Es una relación multiclave que expresa relaciones muchos a muchos, cada clave se relaciona con una dimensión. Un hecho es una medición del negocio, distinta a un atributo.


Dimensión:

Es un conjunto de atributos que definen características de una entidad, ofreciendo descripciones textuales con una clave única que corresponde con uno de los componentes de la tabla de hechos.
Los atributos de la dimensión surgen del sistema operacional y son los más relevantes para el análisis de los datos.


Granularidad: 


Es el nivel de detalle capturado en el Datawarehouse. Un grano se puede ver como una fila única en una tabla de hecho, por tanto a mayor nivel de granularidad se tienen menos detalles de los datos y viceversa.



Dimensiones Conformadas:

Son dimensiones que tienen exactamente el mismo conjunto de claves primarias y el mismo número de registros. Dos dimensiones conformadas pueden ser combinadas en una simple dimensión creando la unión de sus atributos.

Dimensión Basura:

Conjunto de indicadores y banderas que pueden tomar valores discretos dentro de un rango muy pequeño.



Dimensión Degenerada:

Es una dimensión que está representada en otras dimensiones ya que sus atributos están definidos en las otras dimensiones, entonces al no poseer atributos y sólo tener clave primaria, la misma es absorbida por la tabla de hechos..