Desarrollo e implementación de un modelo dimensional para el proceso de negocio de preguntas y respuestas de la plataforma Stack Overflow

Loading...
Thumbnail Image

Date

2022-02-04

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad de El Salvador

Abstract

El presente documento desarrolla el ciclo de vida de un proyecto de un datawarehouse , cuyo objetivo final es diseñar e implementar un modelo dimensional para un conjunto de datos; los datos que se utilizaron pertenecen a un dataset público de la comunidad de Stack Overflow; el modelo que se implementa busca solventar las necesidades analíticas que no pueden ser resueltas con modelos relacionales; teniendo un diseño dimensional claro se procede a diseñar y desarrollar procesos de extracción , transformación y carga del conjunto de datos; el modelo por lo tanto solventará las necesidades actuales y futuras a través de la construcción de un serie de reportes analíticos , los reportes son construidos con la herramienta de Power BI, estos reportes se alimentan de los datos procesados por los ETL implementados; los datos se encuentran almacenados en un servicio de almacenamiento oncloud llamado Bigquery

Description

Keywords

Modelo dimensional, stack overflow, datawarehouse, big data, etl, datalakehouse, dataset, perfilado de datos, dimension, tabla de hechos, fact tables, tablero de datos, reportes analiticos, inteligencia de negocios, power bi, google bigquery, google cloud storage, apache spark, databricks, cloud iam, repositorio oncloud

Citation