INDUSTRIA: GOBIERNO
SOLUCIÓN: BIG DATA / DATA SCIENCE / CLOUD + APPS
PROYECTO: BIG DATA
Cliente:
Sunat
Industria:
Gobierno
Solución:
Big Data / Data Science / Cloud + Apps
Proyecto:
Big Data
SITUACIÓN INICIAL
La Superintendencia Nacional de Administración Tributaria (Sunat) es la entidad recaudadora de impuestos del gobierno del Perú, y desde el 2018 ha extendido el uso de facturas electrónicas como parte de sus objetivos de formalizar la economía y reducir la evasión tributaria
DESAFÍO
Sunat tenía el reto de levantar a una base de datos en Azure la historia de 5 años de facturas electrónicas, que sumaban varios cientos de millones de archivos XML, procesarlas para extraer los datos en un formato plano, e integrarlo con las herramientas analíticas con las que cuenta.
IMPLEMENTACIÓN
Analytics trabajo en conjunto con Sunat y Microsoft Consulting Services para la evaluación y ejecución del proceso de carga histórica inicial y de carga diaria de sincronización de la información hacia el ambiente de Hive de determinadas estructuras de datos desde diversos ambientes, tales como Informix, Azure Windows Table y Cosmos DB. La construcción del proceso incluyó el uso de:
- Azure Storage Account
- Azure Data Factory
- Hive
RESULTADO
El proceso implementado mejoró el rendimiento en el tiempo de carga respecto a diversos procesos que se tenían en evaluación y/o ejecución, lo cual permitía realizar las cargas de información que se tenían estimados en un tiempo mayor a 10 meses a un tiempo no mayor de dos semanas.