Desarrollo e implementación de un modelo dimensional para el proceso de negocio de preguntas y respuestas de la plataforma Stack Overflow
Loading...
Date
2022-02-04
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de El Salvador
Abstract
El presente documento desarrolla el ciclo de vida de un proyecto de un datawarehouse , cuyo objetivo final es diseñar e implementar un modelo dimensional para un conjunto de datos; los datos que se utilizaron pertenecen a un dataset público de la comunidad de Stack Overflow; el modelo que se implementa busca solventar las necesidades analíticas que no pueden ser resueltas con modelos relacionales; teniendo un diseño dimensional claro se procede a diseñar y desarrollar procesos de extracción , transformación y carga del conjunto de datos; el modelo por lo tanto solventará las necesidades actuales y futuras a través de la construcción de un serie de reportes analíticos , los reportes son construidos con la herramienta de Power BI, estos reportes se alimentan de los datos procesados por los ETL implementados; los datos se encuentran almacenados en un servicio de almacenamiento oncloud llamado Bigquery
Description
Keywords
Modelo dimensional, stack overflow, datawarehouse, big data, etl, datalakehouse, dataset, perfilado de datos, dimension, tabla de hechos, fact tables, tablero de datos, reportes analiticos, inteligencia de negocios, power bi, google bigquery, google cloud storage, apache spark, databricks, cloud iam, repositorio oncloud