terça-feira, 11 de maio de 2010

Quando a História pode estar escrita em 140 caracteres

The New York Times
Randall Stross 02/05/2010 Tradução: George El Khouri Andolfato



Os usuários do Twitter atualmente transmitem cerca de 55 milhões de tweets por dia. Em apenas quatro anos, foram acumuladas cerca de 10 bilhões dessas mensagens breves.


Algumas são pura baboseira. Mas, reunidas, elas provavelmente serão de valor considerável para futuros historiadores. Elas contêm mais observações, registradas na mesma época por mais pessoas, do que jamais foi preservado em qualquer meio.

“O Twitter representa dezenas de milhões de usuários ativos. Não existe arquivo com dezenas de milhões de diários”, disse Daniel J. Cohen, um professor associado de história da Universidade George Mason e co-autor de um livro de 2006, “Digital History”. Além disso, ele disse: “O Twitter representa o momento, é onde as pessoas são mais honestas”.

No mês passado, o Twitter anunciou que doaria seu arquivo de mensagens públicas para a Biblioteca do Congresso, assim como forneceria atualizações contínuas.

Vários historiadores disseram que a herança tem um tremendo potencial. “Minha reação inicial foi, ‘quando você olha tweet por tweet, parece um lixo’, disse Amy Murrell Taylor, uma professora associada de história da Universidade Estadual de Nova York, em Albany. “Mas poderia ser realmente valioso se visto coletivamente.”

Taylor está trabalhando em um livro sobre escravos fugitivos durante a Guerra Civil; o projeto envolve montanhas de documentos em papel. “Eu não tenho uma ferramenta de busca para peneirá-los”, ela disse.

O arquivo do Twitter, que “nasceu digital”, como dizem os arquivistas, será facilmente pesquisável por máquina –diferente das cartas de família e diários que estão empoeirando nos sótãos.

Como um registro escrito, os tweets estão muito próximos dos pensamentos originais. “A maioria de nossas fontes é escrita após o fato, mediada pela memória –às vezes uma memória falsa”, disse Taylor. “E os jornais são mediados pelos editores. Os tweets levam você exatamente ao momento de uma forma como nenhuma outra fonte faz. Isto é o que é mais empolgante.”

As mensagens do Twitter preservam relatos de testemunhas de uma variedade extraordinária de eventos por todo o planeta. “No passado, algumas pessoas eram capazes, no local, de escrever ou esboçar algo como testemunha de um evento, como o enforcamento de John Brown”, disse William G. Thomas 3º, um professor de história da Universidade de Nebraska-Lincoln. “Mas esse é um registro histórico raro, excepcional.”

Dez bilhões de mensagens de Twitter ocupam pouco espaço de armazenamento: cerca de cinco terabytes de dados. (Um disco rígido de dois terabytes pode ser encontrado por menos de US$ 150.) E o Twitter diz que o arquivo será um pouco menor quando for enviado para a biblioteca. Antes de transferi-lo, a empresa removerá as mensagens dos usuários que optaram por designar sua conta como “protegida”, para que apenas pessoas que obtêm sua permissão explícita possam acompanhá-las.

Um usuário do Twitter também pode optar por usar um pseudônimo e não compartilhar qualquer informação que o identifique pessoalmente. O Twitter também não adiciona tags de identidade para associar seus usuários a pessoas reais.

Cada mensagem é acompanhada por algumas poucas informações complementares, como o número de seguidores que o autor tinha no momento e quantos usuários o autor estava seguindo. Apesar de Cohen ter dito que seria útil para um historiador saber quem são os seguidores e os seguidos, essa informação não está incluída no próprio tweet.

Mas não há nada privado sobre quem segue quem entre os usuários das contas públicas, desprotegidas, do Twitter. Esta informação está exibida tanto no próprio site do Twitter quanto nos aplicativos desenvolvidos por terceiros, que o Twitter permite que explorem seu banco de dados.

Alexander Macgillivray, o diretor jurídico geral do Twitter, disse: “Desde o início, o Twitter é um serviço público e aberto”. A política de privacidade do Twitter declara: “Nossos serviços são principalmente voltados a ajudar você a compartilhar informação com o mundo. Grande parte da informação que você nos fornece é informação que você nos pede para tornar pública”.

Macgillivray acrescentou: “Este é o motivo, quando revisamos nossa política de privacidade, por termos brincamos com a ideia de chamá-la de nossa ‘política pública’”. Ele disse que era o que empresa faria, mas a lei da Califórnia exigia que a “política de privacidade” fosse chamada dessa forma.

Apesar dos tweets públicos sempre terem sido destinados aos olhos de todos, a Biblioteca do Congresso fica nervosa em se aproximar de algo que possa ser controverso. Martha Anderson, diretora do Programa Nacional de Infraestrutura e Preservação da Informação Digital da biblioteca, disse: “Há preocupação com questões de privacidade a curto prazo e somos sensíveis com essas preocupações”.

A biblioteca manterá um embargo das mensagens por seis meses após sua transmissão original. Se isso não for suficiente para por um fim às questões de privacidade, ela disse: “Nós poderemos filtrar certas coisas ou aguardar um pouco mais para disponibilizá-las”. A biblioteca planeja conceder o acesso ao seu arquivo do Twitter apenas para aqueles que Anderson chamou de “pesquisadores qualificados”.

Mas as restrições da biblioteca ao acesso não importam. Macgillivray, do Twitter, disse que sua empresa também entregará cópias de sue arquivo público ao Google, Yahoo e Microsoft. Essas empresas já recebem instantaneamente o fluxo de mensagens do Twitter. Quando o arquivo de velhos tweets for acrescentado aos seus depósitos de dados, eles terão um conjunto completo, constantemente atualizado, e os usuários não encontrarão um embargo de seis meses.

O Google já oferece aos seus usuários o Replay, uma opção de restringir uma busca por palavra-chave apenas a Tweets e a períodos em particular. Ela pode ser facilmente acessada a partir da página de resultados de busca. (Clique em “mostrar opções”, depois “Atualizações”, depois um período de tempo em particular.)

Uma ferramenta como o Google Replay é de ajuda para se concentrar em um assunto. Mas ele exibe apenas 10 tweets por vez. Para explorar 10 bilhões –vejamos, calculando seis segundos para um rápido exame de cada tela– seriam necessários cerca de 190 anos sem dormir.

Cohen encoraja os historiadores a encontrarem novas ferramentas e métodos para mineração de dados do “registro histórico incrivelmente grande” de tweets. Isso exigirá uma abordagem diferente, ele disse, uma saída diretamente da “história relatada”.

No final, talvez brote qualidade da simples quantidade.

2 comentários: