domingo, julho 23, 2006

Pentágono lança suas vistas sobre sítios web de relacionamento social

"Sou continuamente abalado e fico estarrecido com os pormenores que as pessoas postam voluntariamente online acerca de si mesmas". É o que diz Jon Callas, responsável chefe de segurança na PGP, um fabricante de software de encriptação com sede em Silicon Valley. Ele está longe de ser o único a perceber que os sítios web de relacionamento social que estão em rápido crescimento, como MySpace e Friendster, são o sonho dos bisbilhoteiros.A New Scientist descobriu que a National Security Agency (NSA) do Pentágono, que se especializa em escutas secretas e decifração de códigos, está a financiar investigações da massa colhida de informação que as pessoas postam acerca de si próprias nas redes sociais. E estas poderia aproveitar avanços na tecnologia Internet — especialmente a "web semântica" que está para vir, promovida pela W3C, a organização dos padrões da web — para combinar dados de sítios web de relacionamento social com pormenores tais como actividades bancárias, compras e registos de propriedade, permitindo à NSA construir extensos e vastos perfis pessoais de indivíduos.Os americanos ainda estão abalados com as revelações do mês passado de que a NSA tem estado a armazenar chamadas telefónicas desde os ataques terroristas do 11 de Setembro de 2001. O Congressional Research Service, que aconselha os legisladores dos EUA, diz que as companhias telefónicas que entregaram registos de chamadas podem ter actuado ilegalmente. Contudo, a Casa Branca insiste em que a ameaça terrorista torna ultrapassada a legislação existente sobre escutas e está a pressionar o Congresso a não investigar a acção da NSA.Enquanto isso, a NSA prossegue seus planos para explorar a web, uma vez que registos telefónicos têm um âmbito limitado. Eles podem ser utilizados para construir um quadro muito básico da rede de contactos de alguém, um processo chamado às vezes de "conectando os pontos". Ajuntamentos (clusters) de pessoas em grupos altamente conectados tornam-se aparentes, assim como as pessoas com poucas conexões que parecem ser as intermediárias entre tais grupos. A ideia é ver quantas ligações ou "graus" separam pessoas de, digamos, um membro de uma organização na lista negra.Ao acrescentar dados de redes sociais online às suas análises telefónicas, a NSA poderia conectar pessoas a níveis mais profundos, através de actividades partilhadas, tais como tomar lições de voo. Tipicamente, os sítios online de relacionamento social pedem aos membros para dar pormenores dos seus círculos de amigos imediatos e extensos, cujos blogs podem ser seguidos. As pessoas muitas vezes listam outras facetas da sua personalidade, incluindo preferências políticas, sexuais, de entretenimento e esportivas. Algumas vão muito mais longe, e umas poucas perderam os seus empregos por descreverem publicamente suas façanhas quanto à bebida e ingestão de drogas. Pessoas jovens têm sido excluídas de colégios religiosos ortodoxos em que estão inscritas por revelarem online serem gays."Você deveria assumir sempre que qualquer coisa que escreva online é agrafada ao seu curriculum. As pessoas não percebem que actualmente serão "Googladas" só por obter uma entrevista para emprego", afirma Callas.Outros dados que a NSA poderia combinar com pormenores de relacionamento social incluem informação sobre compras, onde vamos (disponível a partir de registos de telemóveis, os quais mencionam a estação de base de onde partiu uma chamada) e quais as grandes transações financeiras que fazemos, tais como comprar uma casa.É certo que agora isto é difícil de fazer porque a web de hoje está recheada de dados em formatos incompatíveis. Aqui entra a web semântica, a qual pretende aplanar estas incompatibilidades nos próximos anos através de uma estrutura comum de dados chamada Resource Description Framework (RDF). A W3C tem esperança de que um dia todo sítio web venha a utilizar a RDF para dar a cada tipo de dado uma única, predefinida e não ambígua "tag"."A RDF transforma a web numa espécie de folha de cálculo universal que é lisível tanto por computadores como por pessoas", diz David de Roure da Universidade de Southampton, no Reino Unido, que é conselheiro da W3C. "Isto significa que você será capaz de perguntar a um sítio web questões que antes não podia, ou efectuar cálculos com os dados que contem". Num registo de saúde, por exemplo, um ataque de coração terá a mesma "tag" semântica da sua descrição mais técnica, como enfarte do miocárdio. Anteriormente teriam parecido como condições médicas separadas. Cada peça de dado numérico, tal como a taxa de inflação ou o número de pessoas mortas nas estradas, também terá uma "tag".As vantagens para os cientistas, por exemplo, poderiam ser enormes: eles terão acesso sem precedentes aos conjuntos de dados experimentais de outros e serão capazes de efectuar suas próprias análises sobre eles. Investigar produtos tais como férias tornar-se-á mais fácil pois preços e disponibilidades de dados terão "tags" inteligentes, permitindo investigações poderosas através de centenas de sítios.Quanto à desvantagem, esta facilidade de uso também tornará fácil a bisbilhotice da vida das pessoas. Nenhum plano para garimpar redes sociais através da web semântica foi anunciado pela NSA, mas o seu interessa na tecnologia é evidente numa nota de rodapé acerca do financiamento a um documento de investigação apresentado na conferência WWW2006, da W3C, em Edinburgh, Reino Unido, em Maio último.Aquele documento, intitulado Semantic Analytics on Social Networks , de uma equipe de investigação dirigida por Amit Sheth da Universidade da Georgia, em Athens, e Anupam Joshi, da Universidade de Maryland, em Baltimore, revela como dados de redes sociais online e outras bases de dados podem ser combinados para revelar factos acerca de pessoas. A nota de rodapé diz que o trabalho foi parcialmente financiado por uma organização chamada ARDA.O que é a ARDA? É uma acrónimo para Advanced Research Development Activity . Segundo um relatório intitulado Data Mining and Homeland Security, publicado pelo Congressional Research Service, o papel da ARDA é gastar dinheiro da NSA em investigações que podem "resolver alguns dos problemas mais críticos enfrentados pela comunidade de inteligência dos EUA". O principal dentre os objectivos da ARDA é fazer com que adquiram sentido as quantidades maciças de dados coleccionados pela NSA — algumas das suas fontes crescem ao ritmo de 4 milhões de gigabytes por mês.As redes sociais online, sempre em crescimento, são parte do fluxo de informação da Internet que poderia ser garimpada: alguns dos sítios de topo, como MySpace, têm agora mais de 80 milhões de membros (ver gráfico).A investigação financiada pela ARDA foi concebida para verificar se a web semântica poderia ser utilizada facilmente para conectar pessoas. A equipe de investigação escolheu tratar de um assunto caro aos seus corações académicos: detectar conflitos de interesses em avaliações (peer review) de trabalhos científicos. Os amigos não podem avaliar documentos de investigação uns dos outros, nem tão pouco pessoas que anteriormente tenham sido autoras conjuntas de trabalhos da outra.Assim, a equipe desenvolveu software que combinava dados das "tags" RDF da rede social online Friend of a Friend ( www.foaf-project.org ), onde as pessoas simplesmente informam quem está no seu círculo de amigos, e uma base de dados bibliográfica comercial semanticamente etiquetada (tagged) chamada DBLP, a qual lista os autores de documentos sobre ciência computacional. Joshi afirma que o seu sistema descobriu conflitos entre revisores potenciais e autores que apresentavam documentos a uma conferência sobre Internet. "Ele certamente torna mais fácil a descoberta de relacionamentos entre pessoas", afirma Joshi. "Ele levantou conflitos mais ténues [não óbvios] que antes não teriam sido vistos".A tecnologia funcionará exactamente da mesma forma para a agência de inteligência e de segurança nacional e para assuntos financeiros, tais como a detecção de informações privilegiadas em proveito próprio (insider trading), afirmam os autores. Ligar "quem conhece quem" com compras ou registos bancários poderia destacar grupos terroristas, lavadores de dinheiro ou grupos na lista negra, afirma Sheth.A NSA recentemente mudou o nome da ARDA para Disruptive Technology Office. O interesse do DTO nas análises de redes sociais online reflecte a controversa iniciativa Total Information Awareness (TIA) do Pentágono após o 11 de Setembro. Aquele programa, destinado a coleccionar, rastrear e analisar rastros de dados online, foi suspenso em 2002 após um furor público acerca da privacidade. Mas em Setembro de 2003 elementos do TIA foram incorporados no programa classificado do Pentágono, o Defense Appropriations Act.Grupos de privacidade preocupam-se em que o "perfilamento automatizado de inteligência" possa manchar reputações de pessoas ou mesmo levar a abusos na justiça — especialmente porque os dados das redes de sítios de relacionamento social podem ser inexactos, não verdadeiros ou incompletos, adverte De Roure.Mas Tim Finin, colega de Joshi, pensa que a difusão de tal tecnologia é imparável. "A informação está a ficar mais fácil de unir, fundir e extrair inferências. Há dinheiro a ser feito e controle a ser obtido ao fazer isso. E não vejo o que possa travá-la", afirma ele.Callas pensa que as pessoas têm de se tornar conscientes de quanta informação acerca de si mesmas deveriam divulgar em sítios web públicos. Isto pode parecer óbvio, diz ele, mas ser discreto é uma parte importante da manutenção da privacidade. É tempo, talvez, de pressionar a tecla "delete".

Paul Marks
http://resistir.info/

Sem comentários: