A gente vive uma época insana, na qual é possível fazer coisas que há dez anos eram realmente impensáveis.
Só pra começar, nunca antes tantas pessoas estiveram ao mesmo tempo interagindo online nas mais diversas plataformas que estão por aí. Ainda no terreno do óbvio, estamos fazendo de tudo, desde conversando com nossos parentes e amigos, até comprando o almoço do dia pela internet. Isso nós sabemos por que simplesmente é o que fazemos. Nós e nossos amigos agem dessa forma.
Muito ouvimos falar que o Facebook coleta informações e as usa. O que poucos de nós têm consciência, é sobre como nossas ações online são usadas no garimpo de informações. Só pra citar um exemplo pouco conhecido ou comentado, o Facebook coleta, em tempo real, não só o que publicamos, como também tudo o que sofre autocensura. Ou seja, o que você escreve ali na caixinha que pergunta “O que você está pensando?” e não publica, eles também guardam – o mesmo vale para comentários, caso você esteja se perguntando.
Parece que não há muito o que fazer com informações triviais como “ontem eu dei like em uma fanpage de gifs de gatinhos”. Mas a Jennifer Golbeck, cientista da computação que estuda a forma como interagimos nas redes sociais na Universidade de Maryland, explica nessa fala do TED que, sim, mesmo o mais ingênuo like pode falar muito a nosso respeito. Mais do que isso, essas informações podem ter consequências bem perigosas para nossas vidas pessoais, se usadas para finalidades não muito nobres.
A fala está nesse vídeo do TED, mas coloquei também a transcrição completa para quem não quer dar o play no vídeo. Vale, pelo menos, para termos um pouco mais de consciência sobre o que as empresas fazem com os dados que os mais inocentes aplicativos conseguem coletar de nós.
Jennifer Golbeck explica porque seu like fala mais do que você imagina
“Se você lembra da primeira década da Internet, era um lugar bem estático. Dava para entrar na Internet, olhar as páginas, e elas eram criadas ou por organizações que tinham equipes para isso ou por “experts” em tecnologia para a época.
Com a ascensão da mídia social e redes sociais no início dos anos 2000, a Internet mudou completamente para um lugar onde, agora, a grande maioria do conteúdo com que interagimos é criado por usuários comuns, seja em vídeos no YouTube ou “posts” em “blogs” ou críticas de produtos ou “posts” em mídia social. E também se tornou um lugar muito mais interativo, onde pessoas interagem umas com as outras, estão comentando, compartilhando, não estão só lendo.
E o Facebook não é o único lugar para isso, mas é o maior, e serve para ilustrar os números. O Facebook tem 1,2 bilhões de usuários por mês. Metade da população da Internet usa o Facebook. Eles são um “site” que, junto com outros, permitiu que as pessoas criassem personalidades virtuais com pouca habilidade técnica, e as pessoas reagiram colocando muitos dados pessoais “online”.
E o resultado é que temos dados de comportamento, de preferências e demográficos para centenas de milhares de pessoas, o que nunca aconteceu antes na história. E como cientista da computação, isto quer dizer que fui capaz de criar modelos que podem prever todo tipo de característica oculta de vocês e vocês nem sabem que estão compartilhando informações sobre isso.
Como cientistas, usamos isso para ajudar as pessoas a interagirem “online”, mas há aplicações menos altruístas, e há um problema em que os usuários não entendem realmente essas técnicas e como elas funcionam, e mesmo se entendessem, não têm muito controle sobre elas. O que quero lhes falar hoje são algumas dessas coisas que podemos fazer, e nos dar algumas ideias de como podemos avançar para devolver um pouco de controle aos usuários.
Essa é a Target, a empresa. Eu não coloquei o logo na barriga desta pobre mulher grávida. Vocês talvez tenham visto essa piada publicada na revista Forbes, em que a Target enviou um panfleto para essa garota de 15 anos com propagandas e cupons para mamadeiras, fraldas e berços, duas semanas antes de ela contar aos seus pais que estava grávida. Pois é, o pai ficou muito bravo. Ele disse: “Como a Target descobriu que essa essa garota estava grávida antes de ela contar aos seus pais?”
Acontece que eles têm um histórico de compras para centenas de milhares de clientes e eles calculam o que chamam de índice de gravidez, que não é só se uma mulher está grávida ou não, mas também quando o bebê deve nascer. E eles o calculam não com base nas coisas óbvias, como a compra de um berço e roupas de bebê, mas coisas como: “Ela comprou mais vitaminas do que normalmente compra”, ou “Ela comprou uma bolsa que é grande o suficiente para guardar fraldas”.
E por si sós, essas compras não parecem revelar muita coisa, mas é um padrão de comportamento que, quando visto no contexto de milhares de outras pessoas, começa a revelar algumas ideias. É esse o tipo de coisa que fazemos quando prevemos coisas sobre vocês na mídia social. Buscamos por pequenos padrões de comportamento que, quando detectados entre milhões de pessoas, nos permitem descobrir todo tipo de coisa.
Em meu laboratório e com colegas, desenvolvemos mecanismos através dos quais podemos prever coisas com muita precisão, como sua preferência política, seu índice de personalidade, gênero, orientação sexual, religião, idade, inteligência, junto com coisas como o quanto você confia nas pessoas que conhece e a força desses relacionamentos. Podemos fazer isso muito bem. E novamente, não vem do que pensaríamos que é informação óbvia.
Meu exemplo preferido vem de um estudo publicado este ano nos Precedentes das Academias Nacionais. Se olharem no Google, vão achar. São quatro paginas, fácil de ler. E eles só observaram o que as pessoas curtiam no Facebook, só as coisas que vocês curtem no Facebook, e as usaram para prever características, junto com algumas outras. E no artigo, eles listaram as cinco “curtidas” que mais indicavam alta inteligência. E entre eles estava uma página de fritas enroladas. (Risos)
Fritas enroladas são deliciosas, Mas gostar delas não significa necessariamente que você é mais esperto que a média. Então, como é que um dos indicadores mais fortes de inteligência é curtir essa página, quando o conteúdo é totalmente irrelevante à característica que está sendo prevista? E acontece que temos que observar um monte de teorias implícitas para ver por que conseguimos fazer isso. Uma delas é uma teoria sociológica chamada homofilia, que basicamente diz que as pessoas ficam amigas de pessoas como elas. Se você é esperto, seus amigos devem ser espertos. Se você é jovem, seus amigos devem ser jovens, e isso foi bem estabelecido por centenas de anos. Também sabemos muito sobre como a informação se propaga pelas redes.
Pelo jeito, coisas como vídeos virais ou “curtidas” no Facebook ou outras informações se espalham exatamente do mesmo jeito que doenças se espalham por redes sociais. Estudamos isso por muito tempo. Temos bons modelos disso. E podemos juntar essas coisas e começar a ver por que essas coisas acontecem.
Se fosse para criar uma hipótese, seria que um cara esperto criou essa página, ou talvez um dos primeiros que curtiu a página teria se saído bem naquele teste. E ele curtiu, e seus amigos viram, e por homofilia, provavelmente ele tinha amigos espertos, e assim se espalhou para eles, e alguns deles curtiram, e eles tinham amigos espertos, e assim se espalhou para eles, e assim se propagou pela rede para uma série de pessoas espertas, de modo que, ao final, o ato de curtir a página das fritas enroladas indica alta inteligência, não por causa do conteúdo, mas porque o ato de curtir em si reflete as características em comum de outras pessoas que também curtiram.
Coisa bastante complicada, certo? É difícil sentar e explicar para um usuário comum, e mesmo se o fizer, o que o usuário comum pode fazer a respeito? Como saber que você curtiu uma coisa que indica um traço seu que é totalmente irrelevante ao conteúdo do que você curtiu? Há muito poder que os usuários não têm para controlar como esses dados são usados. E eu vejo isso como um verdadeiro problema avançando.
Acho que há dois caminhos que podemos observar, se quisermos dar ao usuário o controle sobre a utilização desses dados, porque nem sempre serão usados para seu benefício. Um exemplo que eu sempre uso: se eu me cansar de ser professora, eu vou abrir uma empresa que prevê as características e coisas como trabalho em equipe e se você é usuário de drogas, se é um alcoólatra. Sabemos como prever isso tudo. E vou vender relatórios para empresas de RH e grandes empresas que queiram te contratar. Podemos fazer isso agora. Eu poderia abrir essa empresa amanhã, e você não teria qualquer controle de como eu uso seus dados desse jeito. Para mim, isso parece um problema.
Então, um dos caminhos que podemos seguir é o caminho da política e da lei. E em alguns aspectos, acho que assim seria mais eficiente, mas o problema é que teríamos mesmo que fazer. Observar nosso processo político em ação me faz pensar que é altamente improvável que vamos juntar um monte de representantes, mostrá-lhes isso, e fazer que decretem mudanças extensas à lei da propriedade intelectual nos EUA para que os usuários controlem seus dados.
Ou seguir a rota da política, em que empresas de mídia social dizem: “Sabe? Você é dono de seus dados. Você tem total controle sobre como eles são usados.” O problema são os modelos de receita para a maioria das empresas de mídia social que se baseiam no compartilhamento ou exploração dos dados dos usuários. Dizem do Facebook que os usuários não são os clientes, eles são o produto. Então, como fazemos com que uma empresa ceda o controle de seu principal bem aos usuários? É possível, mas não acho que seja algo que veremos acontecer rapidamente.
E eu acho que o outro caminho que podemos seguir e que será mais eficiente é um mais científico. É usar a ciência que nos permitiu desenvolver todos esses mecanismos para calcular esses dados pessoais a princípio. E é, de fato, uma pesquisa muito similar que teríamos que fazer, se quisermos desenvolver mecanismos que possam dizer ao usuário: “Aqui está o risco do que você acabou de fazer.” Ao curtir aquela página do Facebook, ou ao compartilhar essa informação pessoal, você melhorou minha capacidade de prever se você usa drogas ou não, ou se você se dá bem no ambiente de trabalho ou não. E isso, acredito, pode influenciar a decisão de compartilhar algo, manter privado ou manter inteiramente “offline”.
Também podemos observar coisas como permitir que as pessoas encriptem os dados que elas enviam, para que sejam invisíveis e inúteis a “sites” como o Facebook ou serviços de terceiros que os acessem, mas a usuários selecionados, que a pessoa que postou quer que os vejam, tenham acesso. Tudo isso é uma pesquisa superlegal de uma perspectiva intelectual. Os cientistas estarão dispostos a fazê-la. Isso nos dá uma vantagem sobre o lado da lei.
Um dos problemas que as pessoas levantam quando falo disso é que elas dizem: “Sabe, se todos começarem a manter esses dados privados, todos os métodos que você desenvolveu para prever seus traços vão falhar. E eu digo “com certeza”, e para mim isso é sucesso, porque como cientista, meu objetivo não é inferir informações sobre os usuários, é melhorar o jeito como as pessoas interagem “online”. E, às vezes, isso envolve inferir coisas sobre elas, mas se os usuários não quiserem que eu use esses dados, acho que eles deveriam ter esse direito. Quero que os usuários estejam cientes e de acordo, usuários das ferramentas que desenvolvemos.
Então, acredito que encorajar esse tipo de ciência e apoiar pesquisadores que querem ceder um pouco desse controle aos usuários e tirá-lo das empresas de mídia social significa que avançar, enquanto essas ferramentas evoluem e avançam, significa que vamos ter uma base de usuários instruídos e capacitados, e acho que todos concordamos que esse é o jeito ideal de avançar.
Obrigada.”
Editor do PapodeHomem, ex-designer de produtos, ex-vocalista da bandaTranze. Tem um amor não correspondido pela ilustração, fotografia e música. Volta e meia grava músicas pelo Na Casa de Ana. Está no Twitter,Facebook e Google+.