Um estudo aprofundado sobre a rede brasileira de blogs, com foco na blogosfera, baseado em um modelo em forma de grafo com dados reais para analisar a formação da rede e suas atuais proprriedades, como topologia, dinâmica da rede e possibilidades de entrar em colapso, concluindo com os benefícios que esta análise pode trazer aos usuários de blogs.
Interação Mediada por Sites de Redes Sociais entre Revistas e Leitores: Um Ma...
A rede brasileira de blogs sob a visão de redes complexas com foco na blogosfera
1. ˜
A REDE BRASILEIRA DE BLOGS SOB A VISAO DE
REDES COMPLEXAS COM FOCO NA BLOGOSFERA
William Roberto de Paiva
Faculdade de Tecnologia, Universidade Estadual de Campinas.
R. Paschoal Marmo, 1888, Jardim Nova It´lia, Limeira, SP, CEP 13484-332.
a
E-mail: will.unicamp@gmail.com
28 de Mar¸o de 2011
c
Resumo
O objetivo de este artigo ´ fazer um estudo aprofundado sobre a rede brasileira de
e
blogs, com foco na Blogosfera, baseado em um modelo em forma de grafo com da-
dos reais para analisar a forma¸˜o da rede e suas atuais propriedades, como topologia,
ca
dinˆmica da rede e possibilidades de entrar em colapso, concluindo com os benef´
a ıcios
que esta an´lise pode trazer aos usu´rios de blogs.
a a
Palavras-chave: redes complexas, blog, blogosfera, grafo.
Abstract
The aim of this paper is to make a deep study about the brazilian network of blogs,
focusing in the Blogosphere, based on a model in graph form with real data to analyze
the formation of this networks and it’s current properties, like topoogy, network dynam-
ics and the chances to collapse, concluding with the benefits about this analysis to the
users of blogs.
Keywords: complex network, blog, blogosphere, graph.
1 Introdu¸˜o
ca
De acordo com o site Dictionary.com em [5], blog ´ um di´rio online ou um registro pessoal
e a
de pensamentos publicados em uma p´gina web em ordem cronol´gica, tamb´m chamado de
a o e
weblog.
Os blogs s˜o uma forma que usu´rios de internet encontraram de divulgar opini˜es de forma
a a o
f´cil e r´pida. Devido a isso a ferramenta se tornou popular e blogs de diversas categorias
a a
surgiram, como humor, cr´ ıticas, di´rios virtuais, etc.
a
Como uma esp´cie de acordo inconsciente, os blogs come¸aram a divulgar um ao outro por
e c
meio de cita¸˜es de links[6]. Essas cita¸˜es evolu´
co co ıram para parcerias, que s˜o links est´ticos
a a
adicionados em alguma parte da p´gina. Esta forma de se conectar formou uma rede interligada
a
de blogs.
Blogs come¸aram a ser levados a s´rio. Para aqueles com vis˜o empreendedora, se tornou
c e a
um neg´cio muito lucrativo. O grande n´mero de blogs que surgiu criou uma imensa rede
o u
2. social. Concorrˆncia come¸ou a surgir, a rede come¸ou a se auto-organizar, a possuir comu-
e c c
nidades e hubs1 . Tornou-se uma rede complexa.
Nas se¸˜es a seguir, ´ feita uma an´lise do crescimento desta rede, das suas propriedades e
co e a
os desafios que se encontram neste ambiente, focando principalmente o cluster de blogs mais
populares, conhecido como Blogosfera.
2 Metodologia
Para visualizar e analisar as informa¸˜es com mais precis˜o, um modelo da interconex˜o
co a a
existente entre v´rios blogs foi feito. Os dados para fazˆ-lo foram obtidos observando e
a e
cadastrando manualmente os links existentes entre cento e vinte e oito blogs. A coleta dos
dados iniciou-se por um blog popular obtido em um buscador e a partir deste foram cadastradas
os blogs por ele apontados. O mesmo foi feito com cada um dos outros blogs at´ que houvesse
e
em torno de cinquenta cadastrados. Ap´s isso foram buscados e registrados blogs de menor
o
popularidade e seus blogs adjacentes.
Com base nestes dados, um grafo direcionado foi criado, como pode ser visualizado na
Figura 1 , sendo que cada v´rtice representa um blog e cada aresta um link para um outro
e
blog.
Al´m de utilizar o grafo, o comportamento dos blogs pesquisados tamb´m foi observado
e e
por um per´ ıodo de trinta dias para melhor identificar as intera¸˜es que entre eles.
co
Figura 1: D´
ıgrafo da Blogosfera brasileira
1
V´rtices(blogs) que possuem muitos links apontando para si a partir de outras p´ginas na internet.
e a
3. 3 Forma¸˜o da Blogosfera
ca
Os blogs come¸aram como simples di´rios onde um usu´rio relatava tudo que achasse interessante[6].
c a a
Tornaram-se populares e em 1999 j´ existiam diversos blogs, cada um com um prop´sito difer-
a o
ente, alguns como di´rio virtual, outros para humor, outros para opini˜o pol´
a a ıtica, etc.
Analisando a rede desde o in´ ıcio, onde poucos blogs surgiram sem possuir nenhum tipo
de v´
ınculo formal (parcerias) com outros, as preferˆncias de conex˜es entre eles se deram por
e o
semelhan¸a de conte´do e amizade entre os autores de cada blog. Dessa forma come¸aram a
c u c
surgir pequenas comunidades, voltadas a assuntos espec´ ıficos que compartilhavam informa¸˜es
co
entre seus membros.
Alguns hubs que foram surgindo come¸aram a se destacar e ganhar popularidade, aumen-
c
tando dessa forma sua aptid˜o e a aptid˜o dos n´s adjacentes a estes hubs. Assim surgiram
a a o
diversas comunidades em torno destes hubs. Uma destas comunidades conseguiu um destaque
not´vel e tornou-se a mais popular destas comunidades. Em algumas pesquisas de opini˜es
a o
de blogueiros e leitores de blogs, esta comunidade ´ conhecida como Blogosfera.
e
4 An´lise da rede atual
a
4.1 Topologia
Primeiramente foi analisada a sequˆncia de grau dos v´rtices do grafo da Figura 1 e foram
e e
2
encontrados alguns hubs de semigrau interior , que s˜o destacados com tamanho maior e
a
colora¸˜o mais escura. Como foi citado em [8], esta ´ uma propriedade comum das redes
ca e
sociais e era esperado encontr´-la na rede analisada, demonstrando que esta segue uma lei de
a
potˆncia e ´ uma rede do tipo livre de escala[2]. Isto pode ser melhor ilustrado no gr´fico a
e e a
seguir.
Uma caracter´ ıstica curiosa ´ que o mesmo n˜o ocorre com a sequˆncia de semigrau exte-
e a e
rior3 . Cada v´rtice possui uma quantidade de arestas para outros v´rtices semelhante e ao que
e e
pˆde ser observado pelo autor, esse n´mero varia de acordo com a comunidade a qual o n´
o u o
pertence. Se por exemplo considerarmos a comunidade B referenciada na Figura 1, esta possui
uma m´dia de quinze a vinte arestas externas enquanto na comunidade D cada blog aponta
e
para em m´dia quarenta e cinco outros. Estas arestas n˜o est˜o todas vis´
e a a ıveis na figura, pois,
estes dados foram somente observados nos blogs visitados e n˜o est˜o presentes no modelo.
a a
Pensando logicamente, se cada v´rtice tem um n´mero de arestas padr˜o, na comunidade
e u a
a que pertencem todos deveriam ter um n´mero semelhante de semigrau interior, mas n˜o ´ o
u a e
que ocorre. Observando a Figura 1 nota-se que de todas as comunidades partem v´rios links
a
para a Blogosfera (comunidade A) mas o contr´rio n˜o ocorre. Internamente, os v´rtices que
a a e
fazem parte da Blogosfera est˜o em sua maioria conectados entre si, formando um grande
a
cluster de hubs[2]. Isso ´ comprovado ao separar a comunidade A das demais como mostrado
e
na Figura 3. Os 37 v´rtices da Blogosfera mantiveram 482 conex˜es enquanto os 91 v´rtices
e o e
perif´ricos ficaram com apenas 211.
e
2
Em um d´ ıgrafo, semigrau interior ´ a quantidade de arestas que partem de outros v´rtices para o v´rtice
e e e
em quest˜o[3], tamb´m conhecido como grau de entrada[1].
a e
3
Em um d´ ıgrafo, semigrau exterior ´ a quantidade de arestas que partem do v´rtice em quest˜o para outros
e e a
v´rtices[3], tamb´m conhecido como grau de sa´
e e ıda[1].
4. Figura 2: Gr´fico de referˆncias aos blogs
a e
4.2 Dinˆmica da rede
a
Diante do que foi colocado na subse¸˜o anterior, a pergunta que surge ´: por quˆ h´ tantas
ca e e a
referˆncias para os blogs da blogosfera e o mesmo n˜o ocorre com outras comunidades?
e a
Na concep¸˜o da rede, como j´ foi citado na introdu¸˜o, os blogs come¸aram a criar
ca a ca c
parcerias baseado em amizade e em similaridade de conte´do. Os blogs pertencentes ` blo-
u a
gosfera, em sua maioria s˜o antigos na rede, e possuem parceria h´ muito tempo. Como j´
a a a
dito anteriormente, cada blog chega a um n´mero m´ximo de parcerias e n˜o ultrapassa esse
u a a
limite. Desta forma, conclui-se que a blogosfera ´ um aglomerado de blogs antigos que j´
e a
saturaram seu n´mero de conex˜es. Al´m deste motivo, o fato de evitar criar novas referˆncias
u o e e
para blogs menores ajuda a melhorar a visibilidade de todos os blogs desta comunidade em
buscadores que se baseiam no PageRank[4].
A popularidade, amizade e similaridade de conte´do s˜o as principais qualidades que car-
u a
4
acterizam a aptid˜o de um n´ na rede atual, sendo a principal delas a popularidade, que est´
a o a
diretamente relacionada ao semigrau interior. Ao tentar entrar na rede, um blog novo busca
primeiramente criar conex˜es com v´rtices da Blogosfera. Como n˜o consegue retorno, passa
o e a
a buscar conex˜es com blogs menores, seja de amigos ou blogs que tenham conte´do semel-
o u
hante. Como estes blogs j´ passaram pelo mesmo processo, costumam j´ possuir conex˜es
a a o
com blogs semelhantes em conte´do e popularidade, o que leva o novo n´ a buscar se conectar
u o
com todos da comunidade.
Ainda assim, isso n˜o explica o por que os blogs da Blogosfera tem um semigrau interior
a
m´dio muito maior em rela¸˜o `s outras comunidades e isso ser´ melhor detalhado na pr´xima
e ca a a o
subse¸˜o.
ca
4
Aptid˜o ´ a habilidade que um v´rtice tem de atrair arestas.
a e e
5. Figura 3: Cluster formado pela Blogosfera ` esquerda e os blogs externos a ela ` direita
a a
4.3 Informa¸˜es
co
Ao visitar diversos blogs, o autor notou que se os blogs pertencem ` mesma categoria(como
a
blogs de entretenimento, por exemplo) as chances de se deparar com informa¸˜es redundantes
co
s˜o muito altas. Isso se trata de uma sincroniza¸˜o de informa¸˜es na rede e h´ dois fatores
a ca co a
principais que causam esta sincronia: a fonte da informa¸˜o e a relevˆncia da informa¸˜o na
ca a ca
internet.
Se a fonte da informa¸˜o for um blog popular, essa informa¸˜o tende a se propagar pela
ca ca
rede, come¸ando pelos v´rtices adjacentes e seguindo adiante pelos adjacentes aos adjacentes,
c e
perdendo potˆncia a cada retransmiss˜o. Este ´ um dos motivos da informa¸˜o se repetir
e a e ca
diversas vezes dentro de uma comunidade de blogs. Dessa forma a informa¸˜o ganha mais
ca
importˆncia em buscadores na internet, aumentando inclusive a popularidade daqueles que
a
a propagam. Analisando isso, podemos concluir que ´ este o maior motivo da Blogosfera
e
ter um semigrau interior m´dio alto. Por sua popularidade, a Blogosfera gera informa¸˜es
e co
que j´ nascem com relevˆncia maior, e outros blogs procuram utilizar as informa¸˜es desta
a a co
comunidade como fonte. J´ outras comunidades n˜o possuem essa influˆncia, e os n´s n˜o
a a e o a
se interessam em manter conex˜es a n˜o ser que sejam retribu´
o a ıdos.
J´ a relevˆncia da informa¸˜o cria um contexto que envolve a rede toda. Se por ex-
a a ca
emplo existe uma crise mundial, muitos blogs v˜o falar sobre a crise, seja para dar opini˜o
a a
sobre os motivos ou para satirizar os pa´ mais prejudicados. Assim, aqueles que propagam
ıses
esta informa¸˜o ganham tamb´m chances de serem encontrados em buscadores, j´ que est˜o
ca e a a
tratando de uma informa¸˜o muito procurada no momento.
ca
4.4 Imperfei¸˜es
co
Faria alguma diferen¸a perder um n´ da gigantesca rede de blogs? Para a rede como um todo,
c o
a perda de qualquer um de seus n´s nem seria notada pela maioria, mas ao se tratar de cada
o
comunidade pode ser que um n´ fa¸a muita diferen¸a.
o c c
A Blogosfera n˜o perderia sua configura¸˜o com a perda de qualquer um de seus n´s. A
a ca o
6. sua resiliˆncia5 garante que a interconex˜o de seus componentes se manter´ caso isso ocorra.
e a a
Isto ´ v´lido para todas as comunidades que tem coeficiente de cluster6 elevado.
e a
J´ o mesmo n˜o pode ser dito de outras comunidades. Como exemplo, a comunidade 3
a a
na Figura 1 possui um unico n´ que tem grande popularidade perante a rede e sua robustez
´ o
´ baixa. Nesse caso, a perda deste n´ central afetaria drasticamente esta comunidade, talvez
e o
at´ gerando sua extin¸˜o.
e ca
Sendo assim, a Blogosfera ´ indestrut´
e ıvel? Apesar de sua robustez, h´ outros fatores que
a
poderiam prejudicar esta rede. Um exemplo ´ a informa¸˜es incorretas. Uma not´ falsa
e co ıcia
seria rapidamente espalhada na rede toda, j´ que a blogosfera ´ referˆncia de diversos blogs.
a e e
Isso pode acarretar em perda de credibilidade se ocorrer com frequˆncia.
e
O surgimento de outras redes tamb´m pode ser preocupante, por´m, no momento ainda
e e
n˜o ´. Apesar de diversas comunidades existirem, nenhuma se equipara ` blogosfera ao ponto
a e a
7
de conseguir referˆncias externas sem que se exija reciprocidade . Assim sendo, nos dias atuais,
e
a Blogosfera dificilmente entrar´ em colapso.
a
Um fator importante a ser considerado ´ a adapta¸˜o do usu´rio a mudan¸as. Mesmo
e ca a c
surgindo uma nova comunidade t˜o forte quanto ` blogosfera, um usu´rio pode se adaptar a
a a a
visitar mais blogs e assim as duas comunidades existiriam sem problema algum. Da mesma
forma, um n´ de uma comunidade ao ser retirado pode fazer com que todos os usu´rios
o a
abandonem a todos os blogs de uma comunidade. S˜o a¸˜es humanas imprevis´
a co ıveis que
podem mudar o comportamento da rede.
5 Conclus˜o
a
Apesar de ser uma pequena amostra da rede, o modelo apresentado neste artigo foi capaz de
demonstrar com bastante efic´cia o comportamento da rede. Durante o per´
a ıodo de observa¸˜o,
ca
foi poss´ notar que a dinˆmica da rede e o tr´fego de informa¸˜es s˜o bastante afetados
ıvel a a co a
pela topologia e tamb´m que a robustez de uma comunidade pode torn´-la muito influente
e a
perante a outras comunidades, como ´ o caso da Blogosfera.
e
Este estudo pode ser muito util para blogueiros que buscam ganhar mais destaque na rede
´
de blogs. Analisando as intera¸˜es entre os blogs e entre as comunidades, principalmente
co
da Blogosfera, podem ser feitas previs˜es e criar estrat´gias se sobressair diante de blogs
o e
concorrentes, como por exemplo criar grupos intencionais para fortalecer a imagem do blog
ou gerenciar informa¸˜es de uma comunidade visando atrair mais usu´rios.
co a
Referˆncias
e
[1] ANGELIS, A. F., Tutorial Redes Complexas, Universidade de S˜o Paulo, S˜o Carlos, 2005.
a a
[2] BARABASI, A.-L., Linked: Como tudo est´ conectado a tudo e o que isso significa para
a
os neg´cios, rela¸˜es sociais e ciˆncias. Editora Leopardo, 2009
o co e
[3] BOAVENTURA, P. O.; JURKIEWICS, S.Grafos: Introdu¸˜o e Pr´tica. Editora Blucher,
ca a
2009
5
Resiliˆncia ´ a capacidade da rede em resistir ` remo¸˜o de seus v´rtices sem a perda de sua
e e a ca e
funcionalidade[1].
6
Coefieciente de cluster indica o qu˜o conectada est´ uma rede ou comunidade[9].
a a
7
Probabilidade de dois v´rtices apontarem-se mutuamente, ou seja, de haver um arco partindo de um n´
e o
para outro e vice-versa simultaneamente[1].
7. [4] BRIN, S., PAGE, L., The Anatomy of a Large-Scale Hypertextual Web Search Engine,
Computer Science Department, Stanford University, Stanford
[5] DICTIONARY.COM, Define Blog at Dictionary.com. Dispon´ıvel em
http://dictionary.reference.com/browse/blog, Acesso em: 4 de Novembro de 2010
[6] NOVAES, C., A hist´ria dos blogs. 2008, Dispon´ em: http://www.brogui.com/a-
o ıvel
historia-dos-blogs, Acesso em 4 de Novembro de 2010
[7] RAMOS TURCI, L. F., Caracteriza¸˜o, Controle de Caos e Sincroniza¸˜o em Circuitos
ca ca
Chaveados. 2009. 24f. Tese de Doutorado - Instituto Tecnol´gico de Aeron´utica, S˜o
o a a
Jos´ dos Campos.
e
[8] TOIVONEN, R., ONNELA, J.P., SARAMAKI, J., HYVONEN, J., KASKI, K., A model for
social networks, Helsinki University of Technology, Laboratory of Computational Engineer-
ing, 2006
[9] WATTS, D. J.,STROGATZ, S., Collective dynamics of ’small-world’ networks. Nature 393,
1998