COMUNICAÇÃO

DIGITAL
CRP-0420
AULA 04: BIG DATA
NA AULA PASSADA…
CONTEÚDOS E DEBATES
TAREFAS:
PALESTRAS TED:
DANIEL DENNETT, ELLEN JORGENSEN,
JOHANNA BLAKLEY, JUAN ENRIQUEZ,
LUCY MCRAE, MARTINE ROTHBLATT
FICÇÃO
BEING JOHN MALKOVICH
BLACK MIRROR - S01E03 S02E01
DOCUMENTÁRIOS:
FUTURESCAPE - S01E02
HORIZON:
MONITOR ME
HOW YOU REALLY MAKE DECISIONS
WHO'S AFRAID OF DESIGNER BABIES?
LEITURAS
CALIFORNIAN IDEOLOGY - BIT.LY/CD03-3
THE TRANSHUMANIST READER - PARTE 3
HUMAN NO MORE - CAPS 2, 4, 12
FREE WILL - CAP 1
CONSCIOUSNESS EXPLAINED - CAP 9
ANTROPOLOGIA DO CIBORGUE - CAP 3
PENSADOR DO TEMA:
SAM HARRIS - BIT.LY/CD03-1
DANIEL DENNETT - BIT.LY/CD03-2
LEITURA (LIVRO)
LINKED - CAPS 3 A 6
WHAT TECHNOLOGY WANTS - CAPS 3, 13
EMERGENCE - INTRO, CAPS 2 E 20
PROGRAMA:
6/8 - CONTEXTO
13/8 - A COISA
20/8 - IDENTIDADE
27/8 - NADA (LDOC)
3/9 - BIG DATA
10/9 - SEMPÁTRIA
17/9 - EDUCAÇÃO
24/9 - CROWD*
1/10 - EXCLUSÃO
8/10 - CIBERATIVISMO
15/10 - GAMES
22/10 - VR, AI
29/10 - IOT, SMART CITIES
5/11 - NEURO E BIO
12/11 - HACK E CODE
19/11 - FABRICATION
26/11 - TENDÊNCIAS
3/12 - PECHA KUCHA 1+2
LDOC
DATACRACIA
A VIDA NA INTERFACE
LULI RADFAHRER
CRP-ECA-USP
“TORNOU-SE EVIDENTE QUE O CHOQUE DO FUTURO
NÃO É MAIS UM PERIGO POTENCIAL DISTANTE, MAS
UMA DOENÇA AUTÊNTICA, DA QUAL PADECE UM
NÚMERO CADA VEZ MAIOR DE PESSOAS.
ESTE ESTADO PSICO-BIOLÓGICO PODE SER
DESCRITO EM TERMOS MÉDICOS E PSIQUIÁTRICOS:
É A DOENÇA DA MUDANÇA.


— ALVIN TOFFLER, 1970
NARRATIVA / SINFONIA
CONSTRUÇÃO COMO
FARSESCA, DRAMÁTICA, GRANDIOSA
1. O CAOS
DESPERTAR
1.1. ABOMINÁVEL MUNDO NOVO?
ANTROPOCENO - LONGEVIDADE - EVOLUÇÃO DO
COMPUTADOR - CIBORGUES - CHOQUE DO FUTURO
1.2. CAOS (DES) CONTROLADO
TEMPO IRREAL - VÍCIO EM VELOCIDADE - ESTRESSE
ATOS REFLEXOS - PARADOXO DA EVOLUÇÃO
TECNOLÓGICA - UNABOMBER E SEU MANIFESTO
FALSA PREMISSA:
CULPA DA TECNOLOGIA
1.3. TECNOLOGIAS E INTERNET
SOCIEDADE TECNOCULTURAL - ETAPAS DA INTERNET
CICLOS DE VIDA DE TECNOLOGIAS
NINGUÉM
A RECORRER
1.4. GATEKEEPERS EM CRISE
FIM DO GATEKEEPER - LIVRO E IMPRESSO
PARÊNTESE DE GUTENBERG
DESINFORMAÇÃO
E EXCLUSÃO
1.5. NOVOS APRENDIZADOS
TECNOCRACIA E TECNOPÓLIO - ENVELOPAMENTO
APRENDIZADOS - ESCOLAS
1.6. EXCLUSÃO DIGITAL
SUBDESENVOLVIMENTO TECNOLÓGICO
EXCLUSÃO CULTURAL - INICIATIVAS PRIVADAS
2. TECNOLOGIA
INVESTIGAÇÃO
2.1. QUASE VIVA
TEORIA ATOR-REDE - ATORES TECNOLÓGICOS
2.2. EMERGÊNCIA
GRAFOS - EMERGÊNCIA - REDES - NÚMERO DE DUNBAR
LEIS DE POTÊNCIA - INTELIGÊNCIA COLETIVA
SUPERORGANISMOS - O LIMIAR DA VIDA
QUESTIONAMENTO:
PESSOAL
2.3. BIG DATA
PRINCÍPIOS - VANTAGENS - PROBLEMAS
2.4. MENSURAÇÃO
METADADOS - CORRETORES - FONTES
2.5. LIVRE ARBÍTRIO
HEURÍSTICAS - NATUREZA - OBSTÁCULOS DIGITAIS
2.6. MODELOS MENTAIS
SOCIEDADES - RECONHECIMENTO - FÉ
3. A VIDA NA REDE
QUESTIONAMENTO:
SOCIAL
3.1. FUTURO DO PRETÉRITO
IDEOLOGIA DA CALIFÓRNIA - OBJETIVISMO - ESTADO
3.2. O USUÁRIO E SUA EXPERIÊNCIA
ATUAÇÃO - PROBLEMAS - DESIGN DE EXPERIÊNCIA
3.3. A VIDA COMPARTILHADA
INDIVIDUALISMO - COMPUTAÇÃO SOCIAL - ALDEIA VS.
GLOBAL - CONFLITO DE GERAÇÕES - VIDA
COMPARTILHADA - IDENTIDADES MÚLTIPLAS - LACAN
3.4. IMATURIDADE E DOMINAÇÃO
FACEBOOK E TV - INFANTILIZAÇÃO - ALGORITMOS
QUESTIONAMENTO:
COMUNICAÇÃO
3.5. INTERFACES
FLUXO - HCI - INTERFACES - NUI -MECÂNICA, DINÂMICA
E ESTÉTICA - PERCEPÇÃO - METÁFORAS E EXPRESSÕES
3.6. NARRATIVAS
AUTOR - IMPORTÂNCIA - HISTÓRIAS PSEUDOINFANTIS
O VEROSSÍMIL - O INFINITO COMO CONTINUIDADE
4.INTERAÇÕES
FUTURO PRÓXIMO:
HORIZONTES
4.1. INFORMAÇÃO
ANTI-EXPERTS - SOBRECARGA - ATENÇÃO PARCIAL
CONTÍNUA - MULTITAREFA - MEMES - ALGORITMOS
MEMÉTICOS - A METÁFORA DA MÁQUINA
4.2. CRIADOS-FALANTES
PRÓTESE RUIM - MOBILIDADE - AUTÔMATOS - INTERNET
DAS COISAS - COMPUTAÇÃO UBÍQUA - FABRICAÇÃO
4.3. CIDADES INTELIGENTES
M2M - MÉTRICAS URBANAS - MUNDOS ESPELHO
APLICAÇÕES - SISTEMA OPERACIONAL URBANO
NOVAS DOMINAÇÕES
4.4. INTELIGÊNCIA ARTIFICIAL
TESTE DE TURING E QUARTO CHINÊS - FILOSOFIA DA
MÁQUINA - MOORE E RETORNOS ACELERADOS - TIPOS
DE AI - SISTEMAS ESPECIALISTAS - MACHINE LEARNING
REVOLTA - PLASTICIDADE - 3 CENÁRIOS - SIMBIOSE
CONSCIENTIZAÇÃO
E PERSPECTIVAS
4.5. DATASFERA
DATASFERA - REALIDADE AUMENTADA - SEMÂNTICA
CÓDIGO - SOFTWARE LIVRE - HUMANIDADES DIGITAIS
4.6. DATACRACIA
FEUDALISMO DIGITAL - E-GOVERNANÇA

PARTICIPAÇÃO - TRANSPARÊNCIA - DADOS ABERTOS
DATASFERA
A PAISAGEM INVISÍVEL
UNIFICANDO
ESTAMOS NOS
COM O FLUXO DE DADOS
QUE NOS CERCA.
A DATASFERA
MUDA A NATUREZA DA IDENTIDADE,
PRIVACIDADE, SEGURANÇA, CULTURA,
EDUCAÇÃO, CIVISMO E EMPREENDEDORISMO.
A FUSÃO
NÃO PRECISA SER FÍSICA,
CONTANTO QUE SEJA FUNCIONAL.
INTELIGENTES
AGENTES
MUDAM CONHECIMENTO, LEI,

SAÚDE E SOCIEDADE.
IDEOLÓGICO.
CÓDIGO É

MAIS DIFÍCIL DE PERCEBER,
COMPREENDER E RESISTIR.
DATACRACIA
ALÉM DA BUROCRACIA
E DA DEMOCRACIA.
DATACRACIA
DEMOCRACIA É UM ÓTIMO REGIME,
MAS É VULNERÁVEL A MANIPULAÇÕES.
DATACRACIA
DEMOCRACIA, PLUTOCRACIA
OU TECNOCRACIA?
A COMBINAÇÃO DE TECNOLOGIA

E MOVIMENTAÇÃO PÚBLICA

DETERMINARÁ O RESULTADO.
POLÍTICA DIGITAL
PRECISAMOS DE REPRESENTANTES
QUE ENTENDAM CÓDIGO.
O QUE FAZER?
GOVERNOS: GARANTIR A TRANSPARÊNCIA.
CIDADÃOS, EMPRESAS E DESENVOLVEDORES: 

USAR OS DADOS, MOSTRANDO QUE HÁ DEMANDA E
HABILIDADE PARA INTERPRETÁ-LOS.
INSTITUIÇÕES DE ENSINO: PREPARAR ALUNOS E SE
PREPARAR PARA NOVAS LITERACIAS.
MÍDIA: TRANSITAR EM CONTEXTOS
MULTIDISCIPLINÁRIOS.
OBRIGADO.
EXTRASNÃO COUBE, TALVEZ FALE NA PRÓXIMA AULA.
DOCUMENTÁRIO
ALL WATCHED OVER

BY MACHINES OF LOVING GRACE
PONTOS A DEBATER:
• OBJETIVISMO E IDEOLOGIA DA CALIFÓRNIA
• CRISE DO CAPITALISMO INDUSTRIAL
• COMMODITIZAÇÃO DE SENTIMENTOS
• INVESTIMENTO CHINÊS
• TEORIA DE SISTEMAS
• GEODÉSICAS E A RESILIÊNCIA DA NATUREZA
• COMUNAS HIPPIES
• O MUNDO COMO UMA MÁQUINA
• ECOSSISTEMAS
• CONSUMO E CRISE NA ÁFRICA
• GENE EGOÍSTA
BIOHACKING
DOCS HORIZON:
PLAYING GOD
DOCUMENTÁRIOS
SURPLUS
DIGITAL AMNESIA
BIG DATA
FUCKIN’ BIG DATA.
BIG FUCKIN’ DATA.
FERORMÔNIO
TRANSAÇÕES ONLINE DEIXAM RASTRO OU
DIGITAL
DADOS ESTRUTURADOS
PARA OPERAÇÕES AUTOMÁTICAS,
SÃO INFORMAÇÕES COM ALTO GRAU
DE ORGANIZAÇÃO, DE FORMA QUE
SUA INCLUSÃO EM UM BANCO DE
DADOS É TRANSPARENTE E
FACILMENTE ACESSÍVEL.
NÃO ESTRUTURADOS
JÁ OS DADOS
PARECEM FICÇÃO CIENTÍFICA:
ELES NÃO TEM UM MODELO DE
REGISTRO PREDEFINIDO, ESTÃO
MISTURADOS OU NÃO ESTÃO
ORGANIZADOS DA FORMA ESPERADA.
SUA LEITURA RESULTA EM
IRREGULARIDADES E AMBIGUIDADES
QUE O TORNAM DIFÍCIL DE ENTENDER
POR SISTEMAS TRADICIONAIS.
DADOS

ESTRUTURADOS
• 2.7 ZETABYTES NO MUNDO DIGITAL
• FACEBOOK ARMAZENA E ANALISA MAIS DE 30
PETABYTES DE DADOS GERADOS POR USUÁRIOS.
• AKAMAI (MÍDIA PUBLICITÁRIA) ANALISA 75
MILHÕES DE EVENTOS POR DIA PARA DESCOBRIR
OS MELHORES LOCAIS PARA ANÚNCIOS.
• A MAIOR BASE DE DADOS DA AT&T TEM UM BANCO
DE DADOS DE 312 TERABYTES, COM 1,9 TRILHÕES
DE ITENS, INCLUINDO REGISTROS TELEFÔNICOS.
DADOS

NÃO ESTRUTURADOS
• A CADA MINUTO, USUÁRIOS DO YOUTUBE
AGREGAM CERCA DE 300H DE NOVOS VÍDEOS.
• DROPBOX RECEBE DIARIAMENTE CERCA DE UM
BILHÃO DE DOCUMENTOS.
• ESTIMA-SE QUE A PRODUÇÃO DE DADOS EM 2020
SERÁ 43 VEZES MAIOR DO QUE ERA EM 2009.
• A CADA SEGUNDO CERCA DE 6000 MENSAGENS
ENVIADAS PARA O TWITTER, 500 MILHÕES/DIA.
• A NSA ESTÁ CONSTRUINDO UM DATA CENTER EM
UTAH COM CAPACIDADE ESTIMADA ENTRE 5
ZETTABYTES E "ALGUNS YOTTABYTES”
FACEBOOK:
• 1,4 BILHÃO DE USUÁRIOS, 890 MILHÕES ATIVOS
DIARIAMENTE. 6% DO TEMPO GASTO NA INTERNET;
• 250 BILHÕES DE FOTOS, CRESCE A CERCA DE 350
MILHÕES POR DIA.
• USUÁRIOS COMPARTILHAM 4,75 BILHÕES DE ITENS
DE CONTEÚDO E 10 BILHÕES DE MENSAGENS/DIA.
• EMPRESAS TEM CERCA DE 50 MILHÕES DE
PÁGINAS ARMAZENADAS NO SERVIÇO DIGITAL.
• 100 TERABYTES DE DADOS ENVIADOS
DIARIAMENTE PARA O FACEBOOK.
BASE DE DADOS:
CPU DE COMPUTADOR VS.
COMO FUNCIONA?
BASE DE DADOS:
ALIMENTAÇÃO DE UMA
1ª FASE: FUNCIONÁRIOS
2ª FASE: USUÁRIOS
3ª FASE: MÁQUINAS
MUITOS DADOS
E QUANDO SE TEM
QUASE INSTANTÂNEOS?
YOUTUBE E FACEBOOK
OU SEJA: COMO FAZEM
ENTRE OUTROS?
COMO EVITAR UMA SOBRECARGA

DO SISTEMA?
TRANSFERIDOS
OS DADOS NÃO SÃO
PARA O PROCESSADOR
PROCESSADORES DIVERSOS
ANALISAM CONJUNTOS DE DADOS
HADOOP
TECNOLOGIAS DE BIG DATA:
COMMODITY HARDWARE

(QUALQUER LINUX BOX COMJVM BASTA)
FLEXÍVEL, ESCALÁVEL E BARATA
É O LEGO DOS DATA CENTERS
MAPREDUCE
TECNOLOGIAS DE BIG DATA:
TABELA DE REFERÊNCIA
(INDICA O QUE CADA MÁQUINA FAZ COM OS DADOS)
TODAS AS TRANSAÇÕES SÃO
REGISTRADAS E ANALISADAS
POR PROCESSADORES EM PARALELO
REVOLUCIONAM
HADOOP E MAPREDUCE
A ANÁLISE DE DADOS
RÁPIDO (SEM ENTRADA E SAÍDA)
COMPATÍVEL (DADOS BRUTOS, CRUS)
ARMAZENÁVEL EM MEMÓRIA FLASH
DAS AS TRANSAÇÕES SÃO
REGISTRADAS E ANALISADAS
BIG DATA:
APRENDIZADO DE MÁQUINA

E VISÃO COMPUTACIONAL
NOVO EMPIRISMO
• TEORIA QUE DEFINE QUE O CONHECIMENTO
VEM PRIMARIAMENTE DA EXPERIÊNCIA.
• ELA ENFATIZA O PAPEL DA EVIDÊNCIA, DE
PREFERÊNCIA SENSORIAL, NA FORMAÇÃO
DAS IDEIAS SOBRE A NOÇÃO DE IDEIAS
INATAS OU TRADIÇÕES.
• É A BASE DO MÉTODO CIENTÍFICO
BIG DATA: PREVISÕES
• APLICA ANÁLISES ESTATÍSTICAS PARA
ENORMES QUANTIDADES DE DADOS, A FIM
DE INFERIR PROBABILIDADES: PROCURAR OS
MELHORES SINAIS E PADRÕES À MEDIDA
QUE MAIS DADOS SÃO ALIMENTADOS, O QUE
LEVA A UMA NATURAL MELHORIA DE SEUS
RESULTADOS AO LONGO DO TEMPO.
RECOMENDAÇÕES
• AMAZON: LIVRO IDEAL
• GOOGLE: WEBSITE MAIS RELEVANTE
• FACEBOOK: CONTEÚDOS COM BASE NAS
PREFERÊNCIAS DE SEUS USUÁRIOS
• WAZE: INDICAR CAMINHOS
• NETFLIX: NOVOS FILMES
• AS MESMAS TECNOLOGIAS PODERÃO SER
APLICADAS PARA DIAGNOSTICAR DOENÇAS E
RECOMENDAR TRATAMENTOS.
EFEITO SCHRÖDINGER: OBSERVAÇÃO E INFLUÊNCIA.
AMOSTRAGEM
E ESCASSEZ
• A NECESSIDADE DE AMOSTRAGEM É FRUTO DE
ESCASSEZ DE INFORMAÇÃO, CARACTERÍSTICA DE
UMA ERA ANALÓGICA. USANDO AMOSTRAS MUITO
MAIORES, EM ALGUNS CASOS NA ORDEM DE
BILHÕES DE REGISTROS, OU ATÉ A BASE DE
DADOS INTEIRA, HOJE É POSSÍVEL IDENTIFICAR
DETALHES INVISÍVEIS, COMO SUBCATEGORIAS
GRANULARES QUE AMOSTRAS PEQUENAS NÃO
CONSEGUIAM AVALIAR SEM UMA GRANDE
MARGEM DE ERRO.
• PARADOXALMENTE, UMA BASE DE DADOS MAIOR
TAMBÉM LIBERA O PESQUISADOR DA BUSCA POR
BIG DATA
E EXATIDÃO
• QUANDO O VALOR É MUITO GRANDE NÃO É
POSSÍVEL NEM RELEVANTE CONTÁ-LO TODO. 

POR ISSO É POSSÍVEL SE SATISFAZER COM
ESTIMATIVAS APROXIMADAS.
• NÚMERO DE AUTOMÓVEIS, CRIANÇAS OU ANIMAIS
DE ESTIMAÇÃO EM UMA CASA (VALORES PEQUENOS,
DISCRETOS E IMPORTANTES), VS. EM UMA CIDADE
OU O NÚMERO DE GRÃOS DE AREIA OU ESTRELAS.
• QUANDO O VOLUME É PEQUENO, CADA VALOR FAZ
DIFERENÇA E PRECISA SER COMPUTADO COM
EXATIDÃO. QUANDO MUITO GRANDE, A EXATIDÃO
NÃO FAZ SENTIDO NEM É RELEVANTE.
BIG DATA:
DIREÇÃO GERAL
O QUE SE PERDE EM PRECISÃO NO
NÍVEL MICRO, GANHA-SE EM
PERCEPÇÃO NO NÍVEL MACRO.
PRINCÍPIOS:
IMPRECISÃO
• AUMENTAR O VOLUME FACILITA A INEXATIDÃO.
• NÚMEROS ERRADOS E AMOSTRAS CORROMPIDAS
SEMPRE PENETRARAM CONJUNTOS DE DADOS.
• O QUE NUNCA FOI CONSIDERADO, APESAR DE
INEVITÁVEL, ERA APRENDER A VIVER COM ELES.
• AO PARTIR DE AMOSTRAS PEQUENAS, BUSCAVA-
SE A MAIOR PRECISÃO POSSÍVEL. EM
AMOSTRAGEM, A BUSCA POR EXATIDÃO ERA
CRÍTICA, O QUE FAZIA COMPLETO SENTIDO. UM
NÚMERO LIMITADO DE DADOS PODERIA INCORRER
NA AMPLIFICAÇÃO DOS ERROS E REDUZIR A
PRECISÃO DOS RESULTADOS GLOBAIS.
PRINCÍPIOS:
CORRELAÇÃO
• CORRELAÇÕES QUANTIFICAM RELAÇÕES
ESTATÍSTICAS ENTRE DOIS VALORES DE DADOS.
• CORRELAÇÃO FORTE: QUANDO UM DOS VALORES
DE DADOS MUDA, HÁ GRANDE PROBABILIDADE DO
OUTRO TAMBÉM MUDAR.
• CORRELAÇÃO FRACA: QUANDO UM VALOR MUDA, O
OUTRO POUCO SE ALTERA.
• MESMO FORTES CORRELAÇÕES NUNCA SÃO
PERFEITAS. É BEM POSSÍVEL QUE DOIS FATOS
PODEM SE COMPORTAR DE FORMA SEMELHANTE
APENAS POR COINCIDÊNCIA.
PRINCÍPIOS:
REUTILIZAÇÃO
• ÀS VEZES O VALOR DE UMA BASE DE DADOS SÓ
PODE SER DESENCADEADO POR SUA COMBINAÇÃO
COM OUTRA BASE MUITO DIFERENTE,
DESCOBRINDO RELAÇÕES IMPENSADAS.
• OS RESULTADOS NÃO ERAM DESCOBERTOS
ANTERIORMENTE PORQUE A AMOSTRA ESTUDADA
ERA MUITO PEQUENA, OU O PERÍODO DE TEMPO
COBERTO ERA CURTO DEMAIS, OU ERAM BASEADOS
EM DADOS AUTO-RELATADOS, COM ERROS.
• COM BIG DATA A SOMA É MAIS VALIOSA DO QUE
SEUS COMPONENTES INDIVIDUAIS.
QUATRO Vs: VOLUME
O TAMANHO DA BASE DE DADOS DETERMINA O VALOR
E POTENCIAL DOS DADOS EM QUESTÃO. EXEMPLOS:
• TRANSAÇÕES ARMAZENADAS AO LONGO DOS ANOS
• INTERAÇÕES DE MÍDIA SOCIAL
• SENSORES E COMUNICAÇÃO MÁQUINA-A-MÁQUINA

• SE NO PASSADO O VOLUME EXCESSIVO DE DADOS
GERAVA UM PROBLEMA DE ARMAZENAMENTO, COM
A DIMINUIÇÃO DOS CUSTOS OUTRAS QUESTÕES
EMERGEM, COMO A RELEVÂNCIA DAS RELAÇÕES EM
GRANDES VOLUMES DE DADOS.
QUATRO Vs:
VELOCIDADE
• NOVOS DADOS SÃO ACUMULADOS A UMA
VELOCIDADE SEM PRECEDENTES, PRECISAM
SER ADMINISTRADOS EM TEMPO HÁBIL.
• SISTEMAS DE BIG DATA PRECISAM LIDAR
COM ENXURRADAS DE DADOS EM TEMPO
QUASE REAL;
QUATRO Vs:

VARIEDADE
• DADOS HOJE CHEGAM EM DIVERSOS TIPOS E
FORMATOS. ESTRUTURADOS E NÃO-
ESTRUTURADOS, EM DIVERSAS MÍDIAS,
FORMATOS, TAMANHOS E FORMAS DE
INTERCONEXÃO.
• GERIR, FUNDIR E ADMINISTRAR DIFERENTES
VARIEDADES DE DADOS É FUNDAMENTAL;
QUATRO Vs:

VERACIDADE
• A QUALIDADE DOS DADOS CAPTURADOS
PODE VARIAR MUITO.
• A PRECISÃO DA ANÁLISE DEPENDE DA
QUALIDADE DOS DADOS DE ORIGEM.
MAIS Vs:
• VARIABILIDADE - FLUXOS DE DADOS PODEM SER
ALTAMENTE INCONSISTENTES, TANTO EM VOLUME,
COM PICOS PERIÓDICOS, QUANTO EM QUALIDADE.
• VALOR DA INFORMAÇÃO - INFORMAÇÕES PASSÍVEIS
DE ANÁLISE E CONVERSÃO EM MATERIAL APLICÁVEL
NA TOMADA DE DECISÃO.
• VIABILIDADE - A GESTÃO DE DADOS PODE SE
TORNAR UM PROCESSO MUITO COMPLEXO. OS
DADOS TEM QUE SER CONECTADOS E
CORRELACIONADOS, PARA QUE SEJA POSSÍVEL SE
EXTRAIR A INFORMAÇÃO DESEJADA.
METADADOS• "DADOS SOBRE DADOS"
PODEM SER DE DOIS TIPOS:
• ESTRUTURAIS, DIZEM RESPEITO AO PROJETO E
ESPECIFICAÇÕES DA ESTRUTURA DOS DADOS; E
• DESCRITIVOS, QUE DIZEM RESPEITO AO
CONTEÚDO DOS DADOS.
• UMA DAS PRIMEIRAS APLICAÇÕES DE METADADOS
FORAM FICHAS CATALOGRÁFICAS DE
BIBLIOTECAS. À MEDIDA QUE A INFORMAÇÃO
TORNOU-SE CADA VEZ MAIS DIGITAL, METADADOS
TAMBÉM PASSARAM A SER USADOS PARA
DESCREVER DADOS DIGITAIS.
RADICAL.
Precisamos de transparência
PROPRIEDADE
COMO RESOLVER O PROBLEMA DA
DOS DADOS?
IDENTIFICÁ-LOS COMPLETAMENTE
PODE SER UMA SOLUÇÃO?
BOLHA DE FILTRO.
ISSO SEM LEVAR EM CONTA A
LIBERDADE
E PRIVACIDADE?
TUDO É MUITO LINDO, MAS COMO FICAM
BIG DATA, PARA TER VALOR, PRECISA SER
BEM ADMINISTRADA.
ELA NÃO SIGNIFICA INFINITUDE
AUTOMÁTICA NEM SUBSTITUTO PARA A
VISÃO. MUITO PELO CONTRÁRIO.

MÁS ANÁLISES PODEM GERAR
RESULTADOS CATASTRÓFICOS.
FIMNÃO TEM AULA SEMANA QUE VEM.
TAREFAS:
TRABALHINHOS:
CHEGA DE VÁRZEA.
TRABALHO FINAL:
MELHORAR O MUNDO.
PALESTRAS TED:
ALESSANDRO ACQUISTI, JOEL
SELANIKIO, JESSICA DONOHUE,
CHRISTOPHER SOGHOIAN, JEAN-
BAPTISTE MICHEL, ANNE MILGRAM,
MALTE SPITZ
FICÇÃO
GATTACA
MINORITY REPORT
ENEMY OF THE STATE
MR. ROBOT - S01E01
DOCUMENTÁRIOS:
HORIZON: THE AGE OF BIG DATA
THE HUMAN FACE OF BIG DATA
WALL STREET CODE - BIT.LY/CD04-3
LEITURAS
DATABASE NATION - CAPS 2, 8, 11
TAMING BIG DATA TIDAL WAVE - CAPS 3 E 4
BIG DATA NOW - CAPS 2 E 5
DATACLYSM - CAPS 13, 14
SOCIAL PHYSICS - CAPS 1, 3, 10
PRIVACY IN THE AGE OF BIG DATA - CAPS 1 E 5
BIGA DATA: A REVOLUTION - CAPS 2, 3 E 9
PENSADOR DO TEMA:
SANDY PENTLAND - BIT.LY/CD04-1
STEPHEN WOLFRAM - BIT.LY/CD04-2

Aula CRP-0420-2015-04

  • 1.
  • 2.
  • 3.
  • 4.
    PALESTRAS TED: DANIEL DENNETT,ELLEN JORGENSEN, JOHANNA BLAKLEY, JUAN ENRIQUEZ, LUCY MCRAE, MARTINE ROTHBLATT
  • 6.
  • 10.
    DOCUMENTÁRIOS: FUTURESCAPE - S01E02 HORIZON: MONITORME HOW YOU REALLY MAKE DECISIONS WHO'S AFRAID OF DESIGNER BABIES?
  • 12.
    LEITURAS CALIFORNIAN IDEOLOGY -BIT.LY/CD03-3 THE TRANSHUMANIST READER - PARTE 3 HUMAN NO MORE - CAPS 2, 4, 12 FREE WILL - CAP 1 CONSCIOUSNESS EXPLAINED - CAP 9 ANTROPOLOGIA DO CIBORGUE - CAP 3
  • 13.
    PENSADOR DO TEMA: SAMHARRIS - BIT.LY/CD03-1 DANIEL DENNETT - BIT.LY/CD03-2
  • 14.
    LEITURA (LIVRO) LINKED -CAPS 3 A 6 WHAT TECHNOLOGY WANTS - CAPS 3, 13 EMERGENCE - INTRO, CAPS 2 E 20
  • 15.
    PROGRAMA: 6/8 - CONTEXTO 13/8- A COISA 20/8 - IDENTIDADE 27/8 - NADA (LDOC) 3/9 - BIG DATA 10/9 - SEMPÁTRIA 17/9 - EDUCAÇÃO 24/9 - CROWD* 1/10 - EXCLUSÃO 8/10 - CIBERATIVISMO 15/10 - GAMES 22/10 - VR, AI 29/10 - IOT, SMART CITIES 5/11 - NEURO E BIO 12/11 - HACK E CODE 19/11 - FABRICATION 26/11 - TENDÊNCIAS 3/12 - PECHA KUCHA 1+2
  • 16.
  • 17.
    DATACRACIA A VIDA NAINTERFACE LULI RADFAHRER CRP-ECA-USP
  • 18.
    “TORNOU-SE EVIDENTE QUEO CHOQUE DO FUTURO NÃO É MAIS UM PERIGO POTENCIAL DISTANTE, MAS UMA DOENÇA AUTÊNTICA, DA QUAL PADECE UM NÚMERO CADA VEZ MAIOR DE PESSOAS. ESTE ESTADO PSICO-BIOLÓGICO PODE SER DESCRITO EM TERMOS MÉDICOS E PSIQUIÁTRICOS: É A DOENÇA DA MUDANÇA. 
 — ALVIN TOFFLER, 1970
  • 20.
    NARRATIVA / SINFONIA CONSTRUÇÃOCOMO FARSESCA, DRAMÁTICA, GRANDIOSA
  • 21.
  • 22.
    DESPERTAR 1.1. ABOMINÁVEL MUNDONOVO? ANTROPOCENO - LONGEVIDADE - EVOLUÇÃO DO COMPUTADOR - CIBORGUES - CHOQUE DO FUTURO 1.2. CAOS (DES) CONTROLADO TEMPO IRREAL - VÍCIO EM VELOCIDADE - ESTRESSE ATOS REFLEXOS - PARADOXO DA EVOLUÇÃO TECNOLÓGICA - UNABOMBER E SEU MANIFESTO
  • 23.
    FALSA PREMISSA: CULPA DATECNOLOGIA 1.3. TECNOLOGIAS E INTERNET SOCIEDADE TECNOCULTURAL - ETAPAS DA INTERNET CICLOS DE VIDA DE TECNOLOGIAS
  • 24.
    NINGUÉM A RECORRER 1.4. GATEKEEPERSEM CRISE FIM DO GATEKEEPER - LIVRO E IMPRESSO PARÊNTESE DE GUTENBERG
  • 25.
    DESINFORMAÇÃO E EXCLUSÃO 1.5. NOVOSAPRENDIZADOS TECNOCRACIA E TECNOPÓLIO - ENVELOPAMENTO APRENDIZADOS - ESCOLAS 1.6. EXCLUSÃO DIGITAL SUBDESENVOLVIMENTO TECNOLÓGICO EXCLUSÃO CULTURAL - INICIATIVAS PRIVADAS
  • 26.
  • 27.
    INVESTIGAÇÃO 2.1. QUASE VIVA TEORIAATOR-REDE - ATORES TECNOLÓGICOS 2.2. EMERGÊNCIA GRAFOS - EMERGÊNCIA - REDES - NÚMERO DE DUNBAR LEIS DE POTÊNCIA - INTELIGÊNCIA COLETIVA SUPERORGANISMOS - O LIMIAR DA VIDA
  • 28.
    QUESTIONAMENTO: PESSOAL 2.3. BIG DATA PRINCÍPIOS- VANTAGENS - PROBLEMAS 2.4. MENSURAÇÃO METADADOS - CORRETORES - FONTES 2.5. LIVRE ARBÍTRIO HEURÍSTICAS - NATUREZA - OBSTÁCULOS DIGITAIS 2.6. MODELOS MENTAIS SOCIEDADES - RECONHECIMENTO - FÉ
  • 29.
    3. A VIDANA REDE
  • 30.
    QUESTIONAMENTO: SOCIAL 3.1. FUTURO DOPRETÉRITO IDEOLOGIA DA CALIFÓRNIA - OBJETIVISMO - ESTADO 3.2. O USUÁRIO E SUA EXPERIÊNCIA ATUAÇÃO - PROBLEMAS - DESIGN DE EXPERIÊNCIA 3.3. A VIDA COMPARTILHADA INDIVIDUALISMO - COMPUTAÇÃO SOCIAL - ALDEIA VS. GLOBAL - CONFLITO DE GERAÇÕES - VIDA COMPARTILHADA - IDENTIDADES MÚLTIPLAS - LACAN 3.4. IMATURIDADE E DOMINAÇÃO FACEBOOK E TV - INFANTILIZAÇÃO - ALGORITMOS
  • 31.
    QUESTIONAMENTO: COMUNICAÇÃO 3.5. INTERFACES FLUXO -HCI - INTERFACES - NUI -MECÂNICA, DINÂMICA E ESTÉTICA - PERCEPÇÃO - METÁFORAS E EXPRESSÕES 3.6. NARRATIVAS AUTOR - IMPORTÂNCIA - HISTÓRIAS PSEUDOINFANTIS O VEROSSÍMIL - O INFINITO COMO CONTINUIDADE
  • 32.
  • 33.
    FUTURO PRÓXIMO: HORIZONTES 4.1. INFORMAÇÃO ANTI-EXPERTS- SOBRECARGA - ATENÇÃO PARCIAL CONTÍNUA - MULTITAREFA - MEMES - ALGORITMOS MEMÉTICOS - A METÁFORA DA MÁQUINA 4.2. CRIADOS-FALANTES PRÓTESE RUIM - MOBILIDADE - AUTÔMATOS - INTERNET DAS COISAS - COMPUTAÇÃO UBÍQUA - FABRICAÇÃO 4.3. CIDADES INTELIGENTES M2M - MÉTRICAS URBANAS - MUNDOS ESPELHO APLICAÇÕES - SISTEMA OPERACIONAL URBANO
  • 34.
    NOVAS DOMINAÇÕES 4.4. INTELIGÊNCIAARTIFICIAL TESTE DE TURING E QUARTO CHINÊS - FILOSOFIA DA MÁQUINA - MOORE E RETORNOS ACELERADOS - TIPOS DE AI - SISTEMAS ESPECIALISTAS - MACHINE LEARNING REVOLTA - PLASTICIDADE - 3 CENÁRIOS - SIMBIOSE
  • 35.
    CONSCIENTIZAÇÃO E PERSPECTIVAS 4.5. DATASFERA DATASFERA- REALIDADE AUMENTADA - SEMÂNTICA CÓDIGO - SOFTWARE LIVRE - HUMANIDADES DIGITAIS 4.6. DATACRACIA FEUDALISMO DIGITAL - E-GOVERNANÇA
 PARTICIPAÇÃO - TRANSPARÊNCIA - DADOS ABERTOS
  • 36.
  • 37.
    UNIFICANDO ESTAMOS NOS COM OFLUXO DE DADOS QUE NOS CERCA.
  • 39.
    A DATASFERA MUDA ANATUREZA DA IDENTIDADE, PRIVACIDADE, SEGURANÇA, CULTURA, EDUCAÇÃO, CIVISMO E EMPREENDEDORISMO.
  • 40.
    A FUSÃO NÃO PRECISASER FÍSICA, CONTANTO QUE SEJA FUNCIONAL.
  • 41.
  • 42.
    IDEOLÓGICO. CÓDIGO É
 MAIS DIFÍCILDE PERCEBER, COMPREENDER E RESISTIR.
  • 43.
  • 44.
    DATACRACIA DEMOCRACIA É UMÓTIMO REGIME, MAS É VULNERÁVEL A MANIPULAÇÕES.
  • 45.
    DATACRACIA DEMOCRACIA, PLUTOCRACIA OU TECNOCRACIA? ACOMBINAÇÃO DE TECNOLOGIA
 E MOVIMENTAÇÃO PÚBLICA
 DETERMINARÁ O RESULTADO.
  • 46.
    POLÍTICA DIGITAL PRECISAMOS DEREPRESENTANTES QUE ENTENDAM CÓDIGO.
  • 47.
    O QUE FAZER? GOVERNOS:GARANTIR A TRANSPARÊNCIA. CIDADÃOS, EMPRESAS E DESENVOLVEDORES: 
 USAR OS DADOS, MOSTRANDO QUE HÁ DEMANDA E HABILIDADE PARA INTERPRETÁ-LOS. INSTITUIÇÕES DE ENSINO: PREPARAR ALUNOS E SE PREPARAR PARA NOVAS LITERACIAS. MÍDIA: TRANSITAR EM CONTEXTOS MULTIDISCIPLINÁRIOS.
  • 48.
  • 49.
    EXTRASNÃO COUBE, TALVEZFALE NA PRÓXIMA AULA.
  • 50.
    DOCUMENTÁRIO ALL WATCHED OVER
 BYMACHINES OF LOVING GRACE
  • 68.
    PONTOS A DEBATER: •OBJETIVISMO E IDEOLOGIA DA CALIFÓRNIA • CRISE DO CAPITALISMO INDUSTRIAL • COMMODITIZAÇÃO DE SENTIMENTOS • INVESTIMENTO CHINÊS • TEORIA DE SISTEMAS • GEODÉSICAS E A RESILIÊNCIA DA NATUREZA • COMUNAS HIPPIES • O MUNDO COMO UMA MÁQUINA • ECOSSISTEMAS • CONSUMO E CRISE NA ÁFRICA • GENE EGOÍSTA
  • 75.
  • 78.
  • 79.
  • 80.
  • 81.
  • 84.
  • 87.
  • 89.
    DADOS ESTRUTURADOS PARA OPERAÇÕESAUTOMÁTICAS, SÃO INFORMAÇÕES COM ALTO GRAU DE ORGANIZAÇÃO, DE FORMA QUE SUA INCLUSÃO EM UM BANCO DE DADOS É TRANSPARENTE E FACILMENTE ACESSÍVEL.
  • 90.
    NÃO ESTRUTURADOS JÁ OSDADOS PARECEM FICÇÃO CIENTÍFICA: ELES NÃO TEM UM MODELO DE REGISTRO PREDEFINIDO, ESTÃO MISTURADOS OU NÃO ESTÃO ORGANIZADOS DA FORMA ESPERADA. SUA LEITURA RESULTA EM IRREGULARIDADES E AMBIGUIDADES QUE O TORNAM DIFÍCIL DE ENTENDER POR SISTEMAS TRADICIONAIS.
  • 92.
    DADOS
 ESTRUTURADOS • 2.7 ZETABYTESNO MUNDO DIGITAL • FACEBOOK ARMAZENA E ANALISA MAIS DE 30 PETABYTES DE DADOS GERADOS POR USUÁRIOS. • AKAMAI (MÍDIA PUBLICITÁRIA) ANALISA 75 MILHÕES DE EVENTOS POR DIA PARA DESCOBRIR OS MELHORES LOCAIS PARA ANÚNCIOS. • A MAIOR BASE DE DADOS DA AT&T TEM UM BANCO DE DADOS DE 312 TERABYTES, COM 1,9 TRILHÕES DE ITENS, INCLUINDO REGISTROS TELEFÔNICOS.
  • 93.
    DADOS
 NÃO ESTRUTURADOS • ACADA MINUTO, USUÁRIOS DO YOUTUBE AGREGAM CERCA DE 300H DE NOVOS VÍDEOS. • DROPBOX RECEBE DIARIAMENTE CERCA DE UM BILHÃO DE DOCUMENTOS. • ESTIMA-SE QUE A PRODUÇÃO DE DADOS EM 2020 SERÁ 43 VEZES MAIOR DO QUE ERA EM 2009. • A CADA SEGUNDO CERCA DE 6000 MENSAGENS ENVIADAS PARA O TWITTER, 500 MILHÕES/DIA. • A NSA ESTÁ CONSTRUINDO UM DATA CENTER EM UTAH COM CAPACIDADE ESTIMADA ENTRE 5 ZETTABYTES E "ALGUNS YOTTABYTES”
  • 95.
    FACEBOOK: • 1,4 BILHÃODE USUÁRIOS, 890 MILHÕES ATIVOS DIARIAMENTE. 6% DO TEMPO GASTO NA INTERNET; • 250 BILHÕES DE FOTOS, CRESCE A CERCA DE 350 MILHÕES POR DIA. • USUÁRIOS COMPARTILHAM 4,75 BILHÕES DE ITENS DE CONTEÚDO E 10 BILHÕES DE MENSAGENS/DIA. • EMPRESAS TEM CERCA DE 50 MILHÕES DE PÁGINAS ARMAZENADAS NO SERVIÇO DIGITAL. • 100 TERABYTES DE DADOS ENVIADOS DIARIAMENTE PARA O FACEBOOK.
  • 96.
    BASE DE DADOS: CPUDE COMPUTADOR VS. COMO FUNCIONA?
  • 97.
    BASE DE DADOS: ALIMENTAÇÃODE UMA 1ª FASE: FUNCIONÁRIOS 2ª FASE: USUÁRIOS 3ª FASE: MÁQUINAS
  • 98.
    MUITOS DADOS E QUANDOSE TEM QUASE INSTANTÂNEOS?
  • 99.
    YOUTUBE E FACEBOOK OUSEJA: COMO FAZEM ENTRE OUTROS? COMO EVITAR UMA SOBRECARGA
 DO SISTEMA?
  • 100.
    TRANSFERIDOS OS DADOS NÃOSÃO PARA O PROCESSADOR PROCESSADORES DIVERSOS ANALISAM CONJUNTOS DE DADOS
  • 101.
    HADOOP TECNOLOGIAS DE BIGDATA: COMMODITY HARDWARE
 (QUALQUER LINUX BOX COMJVM BASTA) FLEXÍVEL, ESCALÁVEL E BARATA É O LEGO DOS DATA CENTERS
  • 102.
    MAPREDUCE TECNOLOGIAS DE BIGDATA: TABELA DE REFERÊNCIA (INDICA O QUE CADA MÁQUINA FAZ COM OS DADOS) TODAS AS TRANSAÇÕES SÃO REGISTRADAS E ANALISADAS POR PROCESSADORES EM PARALELO
  • 103.
    REVOLUCIONAM HADOOP E MAPREDUCE AANÁLISE DE DADOS RÁPIDO (SEM ENTRADA E SAÍDA) COMPATÍVEL (DADOS BRUTOS, CRUS) ARMAZENÁVEL EM MEMÓRIA FLASH DAS AS TRANSAÇÕES SÃO REGISTRADAS E ANALISADAS
  • 104.
    BIG DATA: APRENDIZADO DEMÁQUINA
 E VISÃO COMPUTACIONAL
  • 105.
    NOVO EMPIRISMO • TEORIAQUE DEFINE QUE O CONHECIMENTO VEM PRIMARIAMENTE DA EXPERIÊNCIA. • ELA ENFATIZA O PAPEL DA EVIDÊNCIA, DE PREFERÊNCIA SENSORIAL, NA FORMAÇÃO DAS IDEIAS SOBRE A NOÇÃO DE IDEIAS INATAS OU TRADIÇÕES. • É A BASE DO MÉTODO CIENTÍFICO
  • 106.
    BIG DATA: PREVISÕES •APLICA ANÁLISES ESTATÍSTICAS PARA ENORMES QUANTIDADES DE DADOS, A FIM DE INFERIR PROBABILIDADES: PROCURAR OS MELHORES SINAIS E PADRÕES À MEDIDA QUE MAIS DADOS SÃO ALIMENTADOS, O QUE LEVA A UMA NATURAL MELHORIA DE SEUS RESULTADOS AO LONGO DO TEMPO.
  • 107.
    RECOMENDAÇÕES • AMAZON: LIVROIDEAL • GOOGLE: WEBSITE MAIS RELEVANTE • FACEBOOK: CONTEÚDOS COM BASE NAS PREFERÊNCIAS DE SEUS USUÁRIOS • WAZE: INDICAR CAMINHOS • NETFLIX: NOVOS FILMES • AS MESMAS TECNOLOGIAS PODERÃO SER APLICADAS PARA DIAGNOSTICAR DOENÇAS E RECOMENDAR TRATAMENTOS. EFEITO SCHRÖDINGER: OBSERVAÇÃO E INFLUÊNCIA.
  • 108.
    AMOSTRAGEM E ESCASSEZ • ANECESSIDADE DE AMOSTRAGEM É FRUTO DE ESCASSEZ DE INFORMAÇÃO, CARACTERÍSTICA DE UMA ERA ANALÓGICA. USANDO AMOSTRAS MUITO MAIORES, EM ALGUNS CASOS NA ORDEM DE BILHÕES DE REGISTROS, OU ATÉ A BASE DE DADOS INTEIRA, HOJE É POSSÍVEL IDENTIFICAR DETALHES INVISÍVEIS, COMO SUBCATEGORIAS GRANULARES QUE AMOSTRAS PEQUENAS NÃO CONSEGUIAM AVALIAR SEM UMA GRANDE MARGEM DE ERRO. • PARADOXALMENTE, UMA BASE DE DADOS MAIOR TAMBÉM LIBERA O PESQUISADOR DA BUSCA POR
  • 109.
    BIG DATA E EXATIDÃO •QUANDO O VALOR É MUITO GRANDE NÃO É POSSÍVEL NEM RELEVANTE CONTÁ-LO TODO. 
 POR ISSO É POSSÍVEL SE SATISFAZER COM ESTIMATIVAS APROXIMADAS. • NÚMERO DE AUTOMÓVEIS, CRIANÇAS OU ANIMAIS DE ESTIMAÇÃO EM UMA CASA (VALORES PEQUENOS, DISCRETOS E IMPORTANTES), VS. EM UMA CIDADE OU O NÚMERO DE GRÃOS DE AREIA OU ESTRELAS. • QUANDO O VOLUME É PEQUENO, CADA VALOR FAZ DIFERENÇA E PRECISA SER COMPUTADO COM EXATIDÃO. QUANDO MUITO GRANDE, A EXATIDÃO NÃO FAZ SENTIDO NEM É RELEVANTE.
  • 110.
    BIG DATA: DIREÇÃO GERAL OQUE SE PERDE EM PRECISÃO NO NÍVEL MICRO, GANHA-SE EM PERCEPÇÃO NO NÍVEL MACRO.
  • 111.
    PRINCÍPIOS: IMPRECISÃO • AUMENTAR OVOLUME FACILITA A INEXATIDÃO. • NÚMEROS ERRADOS E AMOSTRAS CORROMPIDAS SEMPRE PENETRARAM CONJUNTOS DE DADOS. • O QUE NUNCA FOI CONSIDERADO, APESAR DE INEVITÁVEL, ERA APRENDER A VIVER COM ELES. • AO PARTIR DE AMOSTRAS PEQUENAS, BUSCAVA- SE A MAIOR PRECISÃO POSSÍVEL. EM AMOSTRAGEM, A BUSCA POR EXATIDÃO ERA CRÍTICA, O QUE FAZIA COMPLETO SENTIDO. UM NÚMERO LIMITADO DE DADOS PODERIA INCORRER NA AMPLIFICAÇÃO DOS ERROS E REDUZIR A PRECISÃO DOS RESULTADOS GLOBAIS.
  • 112.
    PRINCÍPIOS: CORRELAÇÃO • CORRELAÇÕES QUANTIFICAMRELAÇÕES ESTATÍSTICAS ENTRE DOIS VALORES DE DADOS. • CORRELAÇÃO FORTE: QUANDO UM DOS VALORES DE DADOS MUDA, HÁ GRANDE PROBABILIDADE DO OUTRO TAMBÉM MUDAR. • CORRELAÇÃO FRACA: QUANDO UM VALOR MUDA, O OUTRO POUCO SE ALTERA. • MESMO FORTES CORRELAÇÕES NUNCA SÃO PERFEITAS. É BEM POSSÍVEL QUE DOIS FATOS PODEM SE COMPORTAR DE FORMA SEMELHANTE APENAS POR COINCIDÊNCIA.
  • 113.
    PRINCÍPIOS: REUTILIZAÇÃO • ÀS VEZESO VALOR DE UMA BASE DE DADOS SÓ PODE SER DESENCADEADO POR SUA COMBINAÇÃO COM OUTRA BASE MUITO DIFERENTE, DESCOBRINDO RELAÇÕES IMPENSADAS. • OS RESULTADOS NÃO ERAM DESCOBERTOS ANTERIORMENTE PORQUE A AMOSTRA ESTUDADA ERA MUITO PEQUENA, OU O PERÍODO DE TEMPO COBERTO ERA CURTO DEMAIS, OU ERAM BASEADOS EM DADOS AUTO-RELATADOS, COM ERROS. • COM BIG DATA A SOMA É MAIS VALIOSA DO QUE SEUS COMPONENTES INDIVIDUAIS.
  • 115.
    QUATRO Vs: VOLUME OTAMANHO DA BASE DE DADOS DETERMINA O VALOR E POTENCIAL DOS DADOS EM QUESTÃO. EXEMPLOS: • TRANSAÇÕES ARMAZENADAS AO LONGO DOS ANOS • INTERAÇÕES DE MÍDIA SOCIAL • SENSORES E COMUNICAÇÃO MÁQUINA-A-MÁQUINA
 • SE NO PASSADO O VOLUME EXCESSIVO DE DADOS GERAVA UM PROBLEMA DE ARMAZENAMENTO, COM A DIMINUIÇÃO DOS CUSTOS OUTRAS QUESTÕES EMERGEM, COMO A RELEVÂNCIA DAS RELAÇÕES EM GRANDES VOLUMES DE DADOS.
  • 116.
    QUATRO Vs: VELOCIDADE • NOVOSDADOS SÃO ACUMULADOS A UMA VELOCIDADE SEM PRECEDENTES, PRECISAM SER ADMINISTRADOS EM TEMPO HÁBIL. • SISTEMAS DE BIG DATA PRECISAM LIDAR COM ENXURRADAS DE DADOS EM TEMPO QUASE REAL;
  • 117.
    QUATRO Vs:
 VARIEDADE • DADOSHOJE CHEGAM EM DIVERSOS TIPOS E FORMATOS. ESTRUTURADOS E NÃO- ESTRUTURADOS, EM DIVERSAS MÍDIAS, FORMATOS, TAMANHOS E FORMAS DE INTERCONEXÃO. • GERIR, FUNDIR E ADMINISTRAR DIFERENTES VARIEDADES DE DADOS É FUNDAMENTAL;
  • 118.
    QUATRO Vs:
 VERACIDADE • AQUALIDADE DOS DADOS CAPTURADOS PODE VARIAR MUITO. • A PRECISÃO DA ANÁLISE DEPENDE DA QUALIDADE DOS DADOS DE ORIGEM.
  • 119.
    MAIS Vs: • VARIABILIDADE- FLUXOS DE DADOS PODEM SER ALTAMENTE INCONSISTENTES, TANTO EM VOLUME, COM PICOS PERIÓDICOS, QUANTO EM QUALIDADE. • VALOR DA INFORMAÇÃO - INFORMAÇÕES PASSÍVEIS DE ANÁLISE E CONVERSÃO EM MATERIAL APLICÁVEL NA TOMADA DE DECISÃO. • VIABILIDADE - A GESTÃO DE DADOS PODE SE TORNAR UM PROCESSO MUITO COMPLEXO. OS DADOS TEM QUE SER CONECTADOS E CORRELACIONADOS, PARA QUE SEJA POSSÍVEL SE EXTRAIR A INFORMAÇÃO DESEJADA.
  • 120.
    METADADOS• "DADOS SOBREDADOS" PODEM SER DE DOIS TIPOS: • ESTRUTURAIS, DIZEM RESPEITO AO PROJETO E ESPECIFICAÇÕES DA ESTRUTURA DOS DADOS; E • DESCRITIVOS, QUE DIZEM RESPEITO AO CONTEÚDO DOS DADOS. • UMA DAS PRIMEIRAS APLICAÇÕES DE METADADOS FORAM FICHAS CATALOGRÁFICAS DE BIBLIOTECAS. À MEDIDA QUE A INFORMAÇÃO TORNOU-SE CADA VEZ MAIS DIGITAL, METADADOS TAMBÉM PASSARAM A SER USADOS PARA DESCREVER DADOS DIGITAIS.
  • 121.
  • 122.
    PROPRIEDADE COMO RESOLVER OPROBLEMA DA DOS DADOS? IDENTIFICÁ-LOS COMPLETAMENTE PODE SER UMA SOLUÇÃO?
  • 123.
    BOLHA DE FILTRO. ISSOSEM LEVAR EM CONTA A
  • 124.
    LIBERDADE E PRIVACIDADE? TUDO ÉMUITO LINDO, MAS COMO FICAM BIG DATA, PARA TER VALOR, PRECISA SER BEM ADMINISTRADA. ELA NÃO SIGNIFICA INFINITUDE AUTOMÁTICA NEM SUBSTITUTO PARA A VISÃO. MUITO PELO CONTRÁRIO.
 MÁS ANÁLISES PODEM GERAR RESULTADOS CATASTRÓFICOS.
  • 125.
    FIMNÃO TEM AULASEMANA QUE VEM.
  • 126.
  • 127.
  • 128.
  • 129.
    PALESTRAS TED: ALESSANDRO ACQUISTI,JOEL SELANIKIO, JESSICA DONOHUE, CHRISTOPHER SOGHOIAN, JEAN- BAPTISTE MICHEL, ANNE MILGRAM, MALTE SPITZ
  • 130.
    FICÇÃO GATTACA MINORITY REPORT ENEMY OFTHE STATE MR. ROBOT - S01E01
  • 131.
    DOCUMENTÁRIOS: HORIZON: THE AGEOF BIG DATA THE HUMAN FACE OF BIG DATA WALL STREET CODE - BIT.LY/CD04-3
  • 132.
    LEITURAS DATABASE NATION -CAPS 2, 8, 11 TAMING BIG DATA TIDAL WAVE - CAPS 3 E 4 BIG DATA NOW - CAPS 2 E 5 DATACLYSM - CAPS 13, 14 SOCIAL PHYSICS - CAPS 1, 3, 10 PRIVACY IN THE AGE OF BIG DATA - CAPS 1 E 5 BIGA DATA: A REVOLUTION - CAPS 2, 3 E 9
  • 133.
    PENSADOR DO TEMA: SANDYPENTLAND - BIT.LY/CD04-1 STEPHEN WOLFRAM - BIT.LY/CD04-2