Este documento contém a transcrição de uma sessão de perguntas e respostas com Diego Nogare, data scientist. Vários participantes fazem perguntas sobre tópicos como armazenamento de dados em big data, a diferença entre data science e business intelligence, responsabilidades de plataformas com big data e privacidade de usuários, e publicação de relatórios no Power BI. Nogare responde às perguntas com detalhes técnicos e considerações sobre esses tópicos.
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de perguntas e respostas
1. Aula 12
Sessão exclusiva de perguntas e respostas
Diego Nogare
Data Scientist @ NGR Solutions
nogare@ngrsolutions.com.br
Data Science
Institute
2. Data Science Institute
Diego Nogare
Σ Microsoft MVP Data Platform|08
Σ Regional Mentor|14-15
Σ Board Advisor|15-16
Σ Chapter Leader Codificando.Net e SQL
Σ www.diegonogare.net
Σ www.livrosdonogare.com.br
Σ www.ngrsolutions.com.br
Σ www.datascienceinstitute.com.br
3. Anisio Neto
Pelo que percebi big data reúne dados de várias
naturezas, como são armazenados esses dados?
Há uma estrutura central que armazena tudo?
Há uma modelagem de dados? No BI, por
exemplo, há estruturas que guardam dados
provindos de vários sistemas transacionais, os
conhecidos data warehouses e data marts.
4. Alessandra Oliveira
Eu perdi um pouco da aula de ontem e talvez
tenha me perdido no Conceito. Eu trabalho com
BI e queria que me corrigisse se estou fugindo
muito do conceito. O conceito teórico do BI ou
cientista de dados, não foge de um conceito de
BI? O que altera é a tecnologia utilizada e os
meios de ganho. Podemos dizer assim ou estou
muito errada?
5. Marcussuel Silva
Boa tarde Diego, e não tenho nenhuma dúvida específica sobre os materiais apresentados em aula, e acredito que
diferentemente da maior parte das pessoas que estão fazendo o curso, eu não tenho formação em ciência da
computação, programação, engenharia, etc.
Estou no último ano de direito e estou escrevendo a minha monografia sobre a responsabilidade das plataformas que
possuem Big Data e que analisam os dados de seus usuários, isto é, se há algum limite na
obtenção/análise/comercialização de dados. Você com certeza sabe muito melhor do que eu, que a tendência é que as
informações contidas na rede sejam cada vez mais ampliadas, atribuindo às plataformas que as detém mais ""poder"" e
deixando os usuários mais ""frágeis"".
Tendo isso em vista, gostaria de pedir, por gentileza, uma respostas, opinião ou a indicação de algum livro, sobre os
seguintes pontos:
1- Em regra, as empresas com Big Data arquivam todos os dados que trafegam pela sua rede ou somente os que são
resultado de seus algoritmos de busca? Elas possuem um local físico determinado (uma cidade, Estado ou país
específicos) para o armazenamento dos dados, correto? Estes dados podem ser acessados por suas filiais localizadas
em outro Estado e/ou país, para serem analisadas?
2- É possível limitar a análise/utilização de dados ou fazê-lo de forma que os usuários tenham conhecimento de quais
dados a empresa tem acesso e à quem estes dados serão destinados? Caso isso seja possível, a limitação não
atrapalharia e atrasaria o desenvolvimento de referidas empresas e a própria análise dos dados?
O objetivo do meu trabalho é debater as melhores alternativas para garantir a liberdade das empresas que utilizam Big
Data e processam os dados, sem que a segurança e privacidade de seus usuários sejam desrespeitadas, gerando perigo
e instabilidade social – como pode acontecer em ataques terroristas (eu comecei a ler o livro que você indicou,
“Numerati”). Atualmente estes fatores são colocados como antagônicos, mas meu intuito é debater alternativas para
que não sejam e possibilitem um maio desenvolvimento com segurança – o que pode ser feito pela regulação ou não
destes serviços.
Quero agradecer primeiramente pelo curso e dizer que está sendo de grande proveito! Peço desculpas pela minha
linguagem atécnica nessas perguntas, mas uma opinião sua seria de grande valia para mim e, peço que faça todos as
considerações que achar pertinente já agradecer por ter lido disposto do seu tempo para ler este e-mail. Muito
obrigado!
6. Ricardo Costa
Diego boa noite. Ao fazer a publicação di
PowerBI na web, ele sobe também a massa de
dados que usou de origem? Outra coisa, o
usuário final teria alguma Central para escolher
qual relatório irá visualizar ou ele teria apenas
os links direto do relatório?