D4Maia - Data for Maia

D4Maia – «Data for Maia»
Pedro Pimenta
Tópicos Avançados de Computação
Licenciatura em Informática
ISMAI, Maia, Oct 26th 2023
1

2
https://community.spiceworks.com/people/pedroccpimenta/projects/d4maia
https://baze.cm-maia.pt/BaZe/iso37120T6v2.htm

3
Projecto BaZe –
Balanço Zero de Carbono
– Pilotos de sensorização
para a descarbonização
REOT2018
2020
REOT2020
(data lake)
2021 2022 2023
Em preparação
REOT 2024
hoje
2024
Projecto Omega-X
GitHub Omegax-Maia
Indicadores Internos
GitHub D4fa
BaZe – Balanço Zero de Carbono
Projecto SPARCS
ISO37120
Dados Abertos
ISO37120
ISO37120
D4Maia
PAMUS
PMAAC
(...)

BaZe Data Lake
The
«verticals»
The
Citizen
The
Municipality
③
①
②

Data Source
1
Data Source
2
Data Source
...
OpenDataSoft
Carto
Mangomaps
GisCloud
base2b
pwall5
Data harvesters
python / ...
geojson.io
BaZe
database(s)
REST APIs
Open format
JSON / geoJSON / ...
Power BI
Dundas
Tableau CKan
GitHub
Data Source
...
(em preparação)
BaZe datalake

«Ciclo de vida» dos datasets
• «Eu gostaria de ter acesso aos dados xxx »
• Compreensão da ‘necessidade’ do ‘cliente’
• Identificação da ‘fonte’, autorização de acesso / compra (etc) / registo técnico -
> acesso aos dados
• Preparação da pipeline (python)
• Leitura (REST API – JSON / geoJSON; BDados – registo(s); Ficheiro (CSV, XLS, Outro); etc -
KML)
• Recepção de dados (script php / LoRa)
• Análise do processamento / harmonização (Unidades, variáveis de interesse)
• Estabelecimento da frequência de leitura / escrita (2 mins – 1 x / ano)
• Escrita no nosso «data lake» (MariaDB / Mongodb) + logfile
• Inclusão no nosso «crontab»
• Monitorização da execução do pipeline ( upgrade -> Apache Airflow )
• Monitorização do data lake / base de dados
7
ISO37120
Regulamento de execução

• Exposição dos dados em função da necesssidade do cliente
• Identificação dos valores a serem expostos (em formato JSON / geoJSON)
- que variáveis, granularidade, agregação, intervalo de tempo, estrutura,
etc)
• Preparação do endpoint (php)
• Parsing dos parâmetros
• Verificação / harmonização dos parâmetros (cpeconsumo.php)
• Extração dos dados do «data lake» (MariaDB / php)
• Construção do JSON / geoJSON
• Exposição da resposta
• Monitorização da execução do endpoint (tempo de extracção / output -> base de
dados)
8

• Verificação do endpoint / dados expostos
• Verificação visual do output do endpoint
• Verificação da correcção do formato (jsonlint / geojson.io)
• Rendering numa consola (gstat, base2b, sumac, consumoe,
catalogo2, ...)
• Rendering num dashboard específico (pwall2)
• Melhoria / Optimização de todo o pipeline incluindo a visualização
• Adaptação aos sensores instalados (5->6, Qualidade do Ar)
• Export MariaDB -> CSV -> GitHub (Arquivo / «Dados abertos»)
9

• ‘Fim de vida’
• Deixámos de ter acesso aos dados (Bird, Frog)
• Deixámos de ter interesse nesses dados
• Desactivar o crontab
• Arquivar o histórico dos dados recolhidos
• Manter as scripts python / php (para uso futuro – Bolt(?))
• Apagar histórico de ‘dados acessórios’ / ‘complementares’ (Compta/ITGest)
• Apagar «logs» (15 dias ~ 1 mês)
10

Revisão – competências em jogo
• Dados (Compreensão da complexidade do processamento e interpretação dos dados)
• Formatos JSON / geoJSON, csv, xls, xlsx, kml, xml, shapefile, ad-hoc.
• Gestão Linux (Utilizadores, cópias de segurança, permissões, update, instalação de
bibliotecas (python, php), monitorização do sistema)
• Python / MariaDB / bash (operação, monitorização e optimização) (Apache Airflow)
• Maria DB (modelação de dados, gestão de BD e Utilizadores) (MongoDB, Postgres,
DB2)
• Importação / exportação de dados (CSV, sql)
• php / MariaDB (operação, monitorização e optimização) (Django)
• HTML + Javascript + JQuery + HighCharts («consolas») + Bibliotecas gráficas
• Tableau, Power BI, OpenDataSoft, Jupyter Notebooks, Python+seaborn, R, Matlab /
Octave, Cognos, Qlink, ...
11

Project-based learning (duas UCs)
http://oxigen.somee.com/capi/apiipmaia.htm
12

13
Thank you for your attention
Looking forward for your
feedback

D4Maia - Data for Maia

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a D4Maia - Data for Maia

Semelhante a D4Maia - Data for Maia (20)

Mais de Pedro Pimenta

Mais de Pedro Pimenta (20)

Último

Último (20)

D4Maia - Data for Maia