O pesquisador Marco Toledo Bastos fez um plot das mensagens trocadas na Lista Compós, que agrega pesquisadores em Comunicação, em torno da Associação Nacional dos Programas de Pós-Graduação em Comunicação.
O resultado é visualmente impressionante.
Na lista da Compós, o pesquisador descreve seu projeto e apresenta algumas considerações:
“Tenho feito alguns experimentos com PCA e correlações em listas de discussão e mensagens do Twitter. Achei que seria divertido plotar a rede da compos@yahoogroups.com porque a lista é um importante veículo para a área. Quem quiser se divertir com o plot pode clicar no endereço abaixo.
http://www.eca.usp.br/netclustering/compos.html
Esse é um plot de todas as mensagens que receberam reply na lista. A primeira mensagem foi de Milton José Pinto no dia 06.06.2000 e o primeiro reply foi de Albino Rubim no dia seguinte (em resposta a Jose Luiz Aidar Prado).
O tamanho do nó é proporcional ao volume de mensagens recebidas como resposta. A espessura dos edges pe proporcional às mensagens enviadas. O layout é ForceAtlas II e as cores deveriam indicar comunidades internas. Primeiras observações a partir do plot:
1. O Juremir é o rei dos replies. Não há mensagem enviada pelo Juremir que não tenha gerado uma mensagem-reply.
2. Redes sociais exibem um alto coeficiente de clusterização. A lista/comunidade da Compós não é exceção.
3. A lista está segmentada em uma minoria que alimenta o grupo com informações e uma maioria que alimenta a lista com perguntas.
Encontrei alguns problemas na análise dos dados porque o Yahoo! não disponibiliza as mensagens no formato MIME. Além dessa limitação, o plot também não mostra:
1. Uma quantidade desanimadora de mensagens-reply que não configuram perguntas, muito embora tenham efeito cascata. Tratam-se das mensagens institucionais de congratulação. Ainda não consegui filtrar essa interação que não configura conversa.
2. Cerca de 700 mensagens-reply cujos usuários não foram reconhecidos (NA). O dataset conta com cerca de 12000 mensagens das quais 5000 são mensagens-reply.
3. Alguns usuários postaram mensagens na lista com emails diferentes. Meus scripts não são espertos o suficiente para fazer uma match perfeito de cada user/account.
4. Alguns usuários mudaram o display name ao longo dos anos. Exemplo: Denilson Lopes / Denilson Lopes Silva. O script mapeia cada screenname como um usuário independente.
A análise da rede foi feita com R e o plot com Gephi. Quem quiser brincar com os dados pode baixar o dataset aqui (http://www.eca.usp.br/netclustering/mtblYgr_compos.xlsx).”
marcos palacios
29/10/2011 at 19:23
Interesante trabalho de pesquisa. Já baixei e instalei o programa Gephi em meu computador, excelente software ( e o melhor ainda que é de livre donwload). Valeu pela dica Marcos.
abz, Gonzalo Prudkin