Relat´orio Parcial de Atividades de Bolsa de Inicia¸c˜ao Cient´ıfica
Instituto de Inform´atica
Universidade Federal do Rio ...
Dados de Identifica¸c˜ao
Projeto
T´ıtulo do Projeto Statistical Physics in Diverse Realizations:
Networks and Text Analysis...
1
1.1 Introdu¸c˜ao
Esse relat´orio descreve as atividades realizadas durante o per´ıodo de vigˆencia da bolsa de inicia¸c˜...
entregues por um v´ertice em uma itera¸c˜ao.
g(v) =
s=v=t
σst(v)
σst
(1.1)
1.3 Redes de metrˆo
Nesse trabalho foi feita a ...
9. Depois de ter os dados necess´arios, deve-se acessar a plataforma My Maps do Google
(https://www.google.com/mymaps), on...
Figure 1.1: Plotagem atual das escolas do Rio de Janeiro
1.6 Conclus˜ao
Esse relat´orio descreveu as atividades realizadas...
Bibliografia
[1] Luiz Eduardo Borges. Python para desenvolvedores - aborda python 3.3. Paris, 2007.
[2] Antiqueira et al. A...
Próximos SlideShares
Carregando em…5
×

Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

114 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
114
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
2
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Relatório Parcial de Atividades de Bolsa de Iniciação Científica - Projeto SPIDER

  1. 1. Relat´orio Parcial de Atividades de Bolsa de Inicia¸c˜ao Cient´ıfica Instituto de Inform´atica Universidade Federal do Rio Grande do Sul Levindo Neto
  2. 2. Dados de Identifica¸c˜ao Projeto T´ıtulo do Projeto Statistical Physics in Diverse Realizations: Networks and Text Analysis Vigˆencia da Bolsa 01/08/2014 a 31/07/2015 Orientador Silvio Renato Dahmen Bolsista Nome Levindo Gabriel Taschetto Neto Bachalerado em Engenharia de Computa¸c˜ao Instituto de Inform´atica Universidade Federal do Rio Grande do Sul CPF 019.690.790-02 E-mail levindo.neto@inf.ufrgs.br Per´ıodo de Atua¸c˜ao 01/08/2014 a 31/07/2015 Local de Realiza¸c˜ao Instituto de Inform´atica - UFRGS 1
  3. 3. 1 1.1 Introdu¸c˜ao Esse relat´orio descreve as atividades realizadas durante o per´ıodo de vigˆencia da bolsa de inicia¸c˜ao cient´ıfica, a qual ´e de 01/08/2014 a 31/07/2015. Esse documento cont´em descritas todas as ativi- dades at´e o momento. No projeto est˜ao sendo desenvolvidos alguns trabalhos que envolvem a liga¸c˜ao entre a f´ısica estat´ıstica e a computa¸c˜ao por meio de sistemas multiagentes. O projeto SPIDER (Statistical Physics in Diverse Realizations: Networks and Text Analysis) tem por pilares principais a f´ısica estat´ıstica juntamente com a computa¸c˜ao. Os objetivos dos trabalhos realizados s˜ao mostrar a centralidade das linhas de metrˆo do estado de S˜ao Paulo e mostrar como a geolocaliza¸c˜ao de determinada regi˜ao influi nos tipos e na quantidade de escolas do estado do Rio de Janeiro. Nesse projeto s˜ao usadas ferramentas de plotagem de mapas e duas linguagens de programa¸c˜ao (Python e R) para algumas partes espec´ıficas, alguns pacotes para R [4] tamb´em foram utilizados, como o OSM e Java7, al´em de artigos cient´ıficos, como os do autor Antiqueira [2]. Alguns resultados j´a foram obtidos, como a plotagem das linhas de metrˆo de S˜ao Paulo, utilizando Python-Igraph, e outros ainda est˜ao sendo obtidos, caso da plotagem das escolas da cidade do Rio de Janeiro. 1.2 Redes Complexas No come¸co do per´ıodo da bolsa foi desenvolvido pesquisa na ´area de redes complexas. O in´ıcio das pesquisas em Redes Complexas foi em 1930, nas quais eram baseadas na centralidade (o v´ertice mais central) e a conectividade (v´ertices com maior n´umero de conex˜oes), aquela ´epoca ainda eram utilizados indiv´ıduos nas redes, para ver qual tinha mais influˆencia por exemplo. Atualmente j´a sabe-se que a topologia e a evolu¸c˜ao das redes no mundo real apresentam pro- priedades organizacionais bastante robustas e distintas das redes aleat´orias. Simplificadamente, podemos dizer que as redes complexas n˜ao seguem um padr˜ao regular. Uma rede ´e um grafo, onde cada aresta tem uma dire¸c˜ao ou sentido que conecta um v´ertice de origem at´e um v´ertice de destino. Nem todo grafo pode ser considerado uma rede complexa.[3] Uma propriedade importante de redes complexas ´e o coeficiente de aglomera¸c˜ao, tamb´em conhecido como fenˆomeno de transitividade, o qual representa de forma an´aloga um triˆangulo, no qual trˆes v´ertices est˜ao ligados entre si. Nessa parte da pesquisa, fatos importantes foram notados, entre eles o ”clustering”, o qual ´e uma t´ecnica de “Data Mining” para fazer agrupamentos autom´aticos de dados segundo seu grau de semelhan¸ca, o ”betweenness centrality”, conforme a Equa¸c˜ao 1.1, que ´e uma medida (baseada em um caminho m´ınimo) utilizada para identificar arestas que conectam comunidades, apresentando valores altos para essas arestas e penalizando as arestas que conectam v´ertices de um mesmo sub- grafo, roteadores, na parte de tr´afego de pacotes, que s˜ao respons´aveis por encontrar o melhor caminho entre os ”hosts” remetente e destinat´ario e encaminhar os pacotes por este caminho ao longo do tempo, al´em do controle de congestionamento de pacotes, o qual ´e a quantidade de pacotes 2
  4. 4. entregues por um v´ertice em uma itera¸c˜ao. g(v) = s=v=t σst(v) σst (1.1) 1.3 Redes de metrˆo Nesse trabalho foi feita a plotagem de redes de metrˆo do estado de S˜ao Paulo levando em conta as linhas de metrˆo e o peso do tr´afego nas mesmas para mostrar a centralidade das esta¸c˜oes, ou seja, dos nodos das linhas do metrˆo do estado de S˜ao Paulo. O trabalho foi realizado com o aux´ılio de Python-Igraph (http://igraph.org/python)[1] e do mapa com as linhas de metrˆo de SP (http://www.metro.sp.gov.br/pdf/mapa-da-rede-metro.pdf) que foi encontrado no site do metrˆo do estado. O movimento das pessoas e das mercadorias ´e o reflexo das diferentes atividades que existem numa sociedade, sendo algo determinante para a qualidade de vida das pessoas. Por isso nessa parte do projeto SPIDER foi feito uma an´alise do peso do tr´afego dos metrˆos do estado de S˜ao Paulo, para as pessoas terem uma vis˜ao melhor de onde est´a circulando mais passageiros e poderem escolher um melhor caminho, aplicando o conceito de ”betweenness”. 1.4 Plotagem de escolas do Rio de Janeiro Esse trabalho visa mostrar como a geolocaliza¸c˜ao de determinado local influi no n´umero de escolas particulares e p´ublicas de determinada regi˜ao. Para mostrar isso utiliza-se de plotagem de pontos (escolas em cores diferentes, com uma cor para cada tipo de escola). S˜ao utlizados para a plotagem escolas do tipo municipal, estadual, federal e particular. Abaixo segue uma lista de passos utilizados para a plotagem das escolas, utilizando a plataforma My Maps do Google (https://www.google.com/mymaps). 1. Fonte de dados: a)Particulares: http://portal.educacao.rj.gov.br/escolaparticular/Pesquisa.asp b)Demais Escolas: http://www.qedu.org.br/busca (Foi usado no come¸co da busca de escolas) 2. Com o site a) obtˆem-se as escolas particulares com seus respectivos endere¸cos e com o site b) obtˆem-se o nome da escola, tipo(municipal, estadual, federal ou particular, colocando o filtro que aparece no canto superior direito ap´os escolher a cidade a ser encontrada) e localiza¸c˜ao; 3. Com o passo 1, deve-se acessar o Google Maps(https://maps.google.com) e na aba de pesquisar colocar o nome da escola no formato: TipoDaEscola NomeDaEscola BairroDaEscola e pressionar a tecla Enter; 4. Assim que achar achar a escola(´ıcone de pingo vermelho invertido no mapa), clicar com o bot˜ao direito do mouse sobre esse ´ıcone vermelho; 5. Clicar na 3a op¸c˜ao(What’s here); 6. Aparecer´a no canto superior esquerdo do mapa dois n´umeros(coordenadas) abaixo do endere¸co da escola; 7. O primeiro n´umero ´e a Latitude e o segundo n´umero ´e a Longitude; 8. Esses n´umeros, para melhor organiza¸c˜ao, devem ser salvos em um arquivo .CSV no qual as informa¸c˜oes ficam no formato abaixo(Salvar em arquivos .CSV’s separados por o tipo da escola): NomeDaEscola, ”no Latitude”, ”no Longitude”; 3
  5. 5. 9. Depois de ter os dados necess´arios, deve-se acessar a plataforma My Maps do Google (https://www.google.com/mymaps), onde pode-se fazer a importa¸c˜ao dos dados via arquivo formatado do tipo .CSV; 10. Assim que aberto o site, clicar na op¸c˜ao ”Criar um novo mapa”; 11. Na parte superior esquerda clicar em ”Importar”, abaixo de ”Camada sem t´ıtulo”; 12. Clicar em ”Selecionar um arquivo do computador”(caso o arquivo esteja na m´aquina que est´a utilizando no momento) ou pode se pegar o arquivo do Google Drive na conta do Google que est´a conectada no momento da utiliza¸c˜ao da plataforma; 13. Quando o arquivo estiver carregado, aparecer´a na tela a caixa com t´ıtulo ”Escolher colunas para posicionar marcadores”; 14. Clicar na caixinha do primeiro n´umero, abaixo do nome da escola que aparece al´ı(que ´e a primeira do .CSV) que est´a no arquivo .CSV; 15. Selecionar ”Latitude” e clicar no segundo n´umero;; 16. Selecionar ”Longitude” e clicar em ”Continuar”; 17. Selecionar o nome da escola que aparece primeiro dentre as trˆes op¸c˜oes e depois concluir; 18. Na tela foram plotados os pontos correspondentes as coordenadas do arquivo .CSV importado; 19. Para melhor visualiza¸c˜ao pode alterar o tipo de mapa e ´ıcone, para alterar ´ıcone basta passar o mouse por cima de ”Todos os itens”(abaixo de ”Estilo uniforme) que aparecer´a um ´ıcone de balde de tinta, ao clicar nele, aparecer´a v´arias op¸c˜oes de altera¸c˜ao de ´ıcone do mapa. Para alterar o tipo do mapa, basta clicar no triˆangulo invertido que est´a `a esquerda de ”Mapa b´asico” e escolher o tipo de mapa desejado; 20. Para separar os tipos de escolas deve-se ir adicionando camadas, clicando em ”Adicionar camada”, que fica `a esquerda de ”Compartilhar” e voltar no passo X at´e ter plotado todos os tipos de escolas desejados; 21. O mapa pronto pode ser compartilhado, bastando clicar no bot˜ao ”Compartilhar”, colocando um t´ıtulo e uma descri¸c˜ao para o mapa, e clicando em salvar, assim o My Maps gera um link que pode ser acessado por qualquer pessoa com acesso `a internet ou pode ser compartilhado por meios de E-mail, Google +, Facebook e Twitter. 1.5 Resultados Redes de metrˆo Nesse trabalho notou-se que se arrumada de maneira organizada as linhas de metrˆo de um deter- minado estado(no caso S˜ao Paulo) com seus pesˆos e linhas de tr´afego,pode-se obter uma lista de nodos ordenados por betweenness e medir a centralidade de seus nodos. Plotagem das escolas do Rio de Janeiro Nesse trabalho, ao longo do aumento de dados e escolas plotadas no mapa da cidade do Rio de Janeiro, notou-se que a concentra¸c˜ao de escolas p´ublicas ´e maior nas zonas per´ıfericas e que ocorre maior concentra¸c˜ao de escolas particulares nas zonas mais nobres do estado, demonstrando como as diferen¸cas geogr´aficas influem nos tipos de escola de uma regi˜ao, o atual mapa ´e mostrado na figura[1.1]. 4
  6. 6. Figure 1.1: Plotagem atual das escolas do Rio de Janeiro 1.6 Conclus˜ao Esse relat´orio descreveu as atividades realizadas at´e o momento durante o per´ıodo de vigˆencia da bolsa de inicia¸c˜ao cient´ıfica com seus devidos resultados. Nela trabalhou-se com redes complexas para obter conceitos utilizados em outros trabalhos, como medidas de centralidade e ”betweenness centrality”, plotagem de linhas de metrˆo do estado de S˜ao Paulo e de escolas no estado do Rio de Janeiro. O trabalho de redes de metrˆo foi feito para mostrar a centralidade dos nodos das linhas de metrˆo do estado de S˜ao Paulo. No trabalho de plotagem das escolas do Rio de Janeiro quer-se mostrar como a geolocaliza¸c˜ao de determinado local influi no n´umero de escolas e nos tipos de escolas desse lugar. Durante o per´ıodo da bolsa tem-se trabalhado com f´ısica estat´ıstica ligada a computa¸c˜ao e m´etodos de plotagem de mapas com o uso de ferramentas de programa¸c˜ao. A centralidade dos nodos das linhas de metrˆo j´a foi medida e a plotagem das escolas do estado do Rio de Janeiro ainda est´a sendo realizada, mas j´a ´e poss´ıvel ver a concentra¸c˜ao de escolas particulares em bairros nobres e de escolas p´ublicas nas grandes periferias do estado. 5
  7. 7. Bibliografia [1] Luiz Eduardo Borges. Python para desenvolvedores - aborda python 3.3. Paris, 2007. [2] Antiqueira et al. Analyzing and modeling realworld phenomena with complex networks: A survey of applications. physics and society. 2005. [3] Jean Metz. Redes complexas: conceitos e aplica¸c˜oes. In The 2nd International Workshop on Engineering Multi-Agent Systems (EMAS 2014), Paris, 2007. [4] Luis Torgo. Linguagem R - Programa¸c˜ao para a an´alise de dados. 2009. 6

×