Extraindo dados públicos na marra com Python

7.125 visualizações

Publicada em

Juntando as motivações jornalísticas com dados públicos e a capacidade técnica dos programadores, podemos ver exemplos de como vai ser o jornalismo do futuro.

Publicada em: Tecnologia
2 comentários
13 gostaram
Estatísticas
Notas
  • Muito legal a apresentação,

    sou designer e sei da grande importancia que a visualizacao de dados pode contribuir para a solucoes de vários problemas sociais... Como na California onde a policia utiliza dados de abordagem/crimes para evitar possiveis futuras acoes...

    Gostaria se possivel que me indicasse livros sobre mineracao de dados. O livro 'Mineração de dados da web social ' é um bom starter?

    Abs.
       Responder 
    Tem certeza que deseja  Sim  Não
    Insira sua mensagem aqui
  • Show de bola, pena que perdi (mas foi por uma boa causa). O #fikdik foi recebido e confirmado, só preciso chegar no evento (a agenda apertou com um mini-curso que eu dei em Rio Claro, mas tou a caminho :-) )
       Responder 
    Tem certeza que deseja  Sim  Não
    Insira sua mensagem aqui
Sem downloads
Visualizações
Visualizações totais
7.125
No SlideShare
0
A partir de incorporações
0
Número de incorporações
25
Ações
Compartilhamentos
0
Downloads
187
Comentários
2
Gostaram
13
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Extraindo dados públicos na marra com Python

  1. 1. Extraindo dados públicos na marra com Python PythonBrasil[6] Curitiba, PR - Outubro de 2010
  2. 2. Aviso: Não é uma palestra técnica :(
  3. 3. comunidade Python + hacks com dados públicos = o futuro do jornalismo
  4. 4. @pedrovalente
  5. 5. jornalista
  6. 6. desenvolvedor
  7. 7. Python desde 2008
  8. 8. Yahoo!
  9. 9. desenvolvimento de software + jornalismo
  10. 10. na raça
  11. 11. Matt Waite
  12. 12. "Build something or STFU" Matt Waite - Politifact
  13. 13. Python na vanguarda
  14. 14. Lawrence Journal-World
  15. 15. Holovaty
  16. 16. Everyblock: plataforma para consumo de dados públicos
  17. 17. dados públicos
  18. 18. Você já precisou deles
  19. 19. e provavelmente foi mal atendido
  20. 20. Horários de voos Infraero
  21. 21. Preço de combustível ANP
  22. 22. Candidatos e votações TSE
  23. 23. Achar uma agência dos Correios
  24. 24. CEPs do Brasil são vendidos num CD!!!!!
  25. 25. CEPs do Brasil são vendidos num CD!!!!!
  26. 26. a administração pública precisa ser transparente
  27. 27. pouca grana pepinos gigantes precisa foco no que ninguém mais tem
  28. 28. por isso precisa abrir os dados
  29. 29. não deve depender de lei. É obrigação moral
  30. 30. wiki.thackdaydf.com.br
  31. 31. Se o fornecedor não colabora, fazemos justiça com as próprias mãos
  32. 32. e aí entra o scraping, por exemplo
  33. 33. Tem muitas maneiras de se fazer isso. BeautifulSoup Scrapy urllib :)
  34. 34. pode ser um bom tema pros open spaces
  35. 35. tem cada vez mais gente atacando os problemas
  36. 36. Transparência Hackday groups.google.com/group/thackday thackdaydf.com.br Random Hacks of Kindness www.rhok.org Próximo é em dezembro!
  37. 37. Pra quem nunca viu: um hack com dados públicos feito em Python
  38. 38. cruzalinhas.appspot.com
  39. 39. cruzalinhas.appspot.com lightning talk? #fikdik
  40. 40. http://github.com/guilhermechapiewski/correios-api-py
  41. 41. Yahoo! Open Hackday
  42. 42. vários hacks legais surgiram usando dados públicos
  43. 43. http://github.com/legisdados
  44. 44. http://meusgastos.com.br/meuspostos/
  45. 45. http://f1results.socialminds.com.br/
  46. 46. http://eleicoes.mamulti.com/
  47. 47. http://cmsp.topical.com.br/
  48. 48. sacsp.mamulti.com
  49. 49. visibilidade e repercussão
  50. 50. é desenvolvimento ou é jornalismo?
  51. 51. Descobrir e comunicar informação de interesse público é o trabalho do jornalista
  52. 52. Não importa o suporte tecnológico
  53. 53. Uma folha de papel é um suporte tecnológico
  54. 54. assim como um computador conectado em rede
  55. 55. vs.
  56. 56. hmmm...
  57. 57. isso significa que todo desenvolvedor pode fazer jornalismo
  58. 58. parece óbvio, mas muitos ignoram essa diferença
  59. 59. Alguns jornais já perceberam isso
  60. 60. The Guardian
  61. 61. Simon Willison
  62. 62. The Guardian http://mps-expenses.guardian.co.uk/
  63. 63. www.guardian.co.uk/open-platform/ www.guardian.co.uk/data-store
  64. 64. NYTimes developer.nytimes.com
  65. 65. Nos EUA a comunidade cresce rapidamente
  66. 66. valeu Obama!
  67. 67. http://help.hackshackers.com/
  68. 68. Mas e aqui?
  69. 69. ainda temos iniciativas isoladas, que podem crescer com a colaboração
  70. 70. mas podemos pensar mais além
  71. 71. oportunidade
  72. 72. empresas de mídia não entendem de tecnologia
  73. 73. e a *renascença* do jornalismo passa pelo desenvolvimento de software
  74. 74. aplicações que coletam, distribuem e visualizam dados podem ser jornalismo
  75. 75. grandes empresas estão acordando para isso
  76. 76. pequenas iniciativas podem sair na frente
  77. 77. e vocês estão numa posição única para serem a vanguarda deste movimento
  78. 78. Obrigado! @pedrovalente

×