LLMs podem desmascarar usuários pseudônimos em grande escala com precisão surpreendente

“O que descobrimos é que esses agentes de IA podem fazer algo que antes era muito difícil: a partir de um texto livre (como uma transcrição anônima de uma entrevista), eles podem chegar à identidade completa de uma pessoa”, disse Simon Lermen, coautor do artigo, a Ars. “Esta é uma capacidade bastante nova; abordagens anteriores sobre reidentificação geralmente exigiam dados estruturados e dois conjuntos de dados com um esquema semelhante que poderiam ser vinculados.”

Ao contrário dos métodos mais antigos de remoção de pseudônimos, disse Lermen, os agentes de IA podem navegar na web e interagir com ela da mesma maneira que os humanos. Eles podem usar raciocínio simulado para combinar indivíduos em potencial. Em um experimento, os pesquisadores analisaram as respostas dadas em um questionário que a Antrópica respondeu sobre como várias pessoas usam IA em suas vidas diárias. Usando as informações retiradas das respostas, os pesquisadores conseguiram identificar positivamente 7% dos 125 participantes.

Desanonimização de ponta a ponta a partir de uma única transcrição de entrevista (com detalhes alterados para proteger a identidade do sujeito). Um agente LLM extraiu sinais de identidade estruturados de uma conversa, pesquisou autonomamente na web para identificar um indivíduo candidato e verificou se o candidato correspondia a todas as declarações extraídas.

Embora uma recordação de 7% seja relativamente baixa, demonstra a crescente capacidade da IA para identificar pessoas com base nas informações muito gerais que elas forneceram. “O fato de a IA poder fazer isso é um resultado digno de nota”, disse Lermen. “E à medida que os sistemas de IA melhoram, provavelmente melhorarão na localização de cada vez mais identidades.”

Em um segundo experimento, os pesquisadores reuniram comentários feitos em 2024 do subreddit r/movies e de pelo menos uma das cinco comunidades menores: r/horror, r/MovieSuggestions, r/Letterboxd, r/TrueFilm e r/MovieDetails. Os resultados mostraram que quanto mais filmes um candidato discutia, mais fácil era identificá-los. Uma média de 3,1% dos usuários que compartilham um filme puderam ser identificados com 90% de precisão e 1,2% deles com 99% de precisão. Com cinco a nove filmes compartilhados, a precisão de 90% e 99% aumentou para 8,4% e 2,5% dos usuários, respectivamente. Mais de 10 filmes compartilhados aumentaram a porcentagem para 48,1% e 17%.

Lembre-se em vários limites de precisão.

Em um terceiro experimento, os pesquisadores analisaram um conjunto de 5.000 usuários do Reddit. Os pesquisadores adicionaram 5.000 identidades de “distração” de usuários do Reddit ao grupo de candidatos. Os pesquisadores compararam seu método ao antigo ataque ao prêmio da Netflix. Eles então adicionaram à lista de 10.000 perfis de candidatos 5.000 distratores de consulta, compreendendo usuários que aparecem apenas em um conjunto de consultas, sem nenhuma correspondência verdadeira no conjunto de candidatos.

Deseja saber mais sobre Inteligência Artificial, Clique Aqui!

LLMs podem desmascarar usuários pseudônimos em grande escala com precisão surpreendente

ByiReporter Tech

By iReporter Tech

Related Post

Esta não é uma mosca carregada em um computador

Google, aceleradora Accel India escolhe 5 startups e nenhuma é ‘invólucro de IA’

Advogado por trás de casos de psicose de IA alerta sobre riscos de vítimas em massa

Deixe um comentário Cancelar resposta

You missed

Falhas do CrackArmor expõem sistemas Linux a escalonamento de privilégios

Trump provoca reação por comentar sobre a guerra no Irã: ‘Talvez nem devêssemos estar lá’ | Guerra EUA-Israel contra o Irã

BTC sobe 4%, aproximando-se do nível de US$ 75.000 pela primeira vez em seis semanas

Quénia e Rússia concordam que não serão recrutados quenianos para a guerra na Ucrânia | Notícias da guerra Rússia-Ucrânia