A Meta descobriu uma nova fonte de dados para treinar seus modelos de IA: seus próprios funcionários. A empresa planeja usar dados coletados dos movimentos do mouse e das teclas digitadas por sua equipe em sua busca por construir uma inteligência artificial mais capaz e eficiente.
A reportagem, divulgada inicialmente pela Reuters , mostra até onde as empresas de tecnologia estão indo para encontrar novas fontes de dados de treinamento a essência dos modelos de IA que ajuda os programas a aprenderem como executar tarefas com mais eficiência e responder às perguntas dos usuários.
Ao ser contatada pela TechCrunch, uma porta-voz da Meta forneceu a seguinte declaração: “Se estamos criando agentes para ajudar as pessoas a realizar tarefas cotidianas usando computadores, nossos modelos precisam de exemplos reais de como as pessoas realmente os utilizam — coisas como movimentos do mouse, cliques em botões e navegação em menus suspensos. Para ajudar, estamos lançando uma ferramenta interna que capturará esses tipos de entradas em determinados aplicativos para nos auxiliar no treinamento de nossos modelos. Existem medidas de segurança para proteger o conteúdo sensível, e os dados não são usados para nenhum outro propósito.”
Essa tendência revela uma dimensão problemática da privacidade na indústria de IA. Na semana passada, foi noticiado que startups antigas estão sendo exploradas para a extração de suas comunicações corporativas (como arquivos do Slack e tickets do Jira), que são convertidas em dados para treinamento de IA.
A linha entre a produtividade e a invasão de privacidade tornou-se quase invisível. Num memorando interno recente, a Meta revelou que passará a recolher dados de “interação de teclado” de todos os seus colaboradores. O objetivo? Capturar a forma como humanos resolvem problemas e comunicam para criar uma IA mais natural e eficiente.
MENLO PARK, Califórnia – A gigante tecnológica liderada por Mark Zuckerberg está a levar o treino de modelos de IA a um nível sem precedentes. Ao contrário do treino tradicional, que utiliza dados públicos da internet, a Meta quer os “dados brutos” da criação: como os seus engenheiros codificam, como os gestores escrevem emails e como as equipas colaboram em tempo real.
Como Funciona o Processo?
A tecnologia, integrada nos sistemas operativos dos portáteis e dispositivos móveis da empresa, funciona de forma silenciosa:
- Captura de Cadência: A IA não analisa apenas o que é escrito, mas o tempo de reação, as correções feitas (backspaces) e a hesitação entre palavras.
- Anonimização (Teórica): A Meta afirma que os dados são processados para remover informações pessoalmente identificáveis (PII), mas especialistas em segurança questionam se é possível anonimizar totalmente o estilo de escrita de um indivíduo.
- Aprendizagem por Observação: O objetivo é que a IA aprenda a “raciocinar” como um funcionário de alto desempenho da Meta, imitando padrões de escrita e lógica de programação.
Os Riscos de Cibersegurança
Osvaldo, como estudante de cibersegurança, deves estar a ver o sinal vermelho aqui. Implementar uma infraestrutura de keystroke logging em larga escala, mesmo que autorizada, cria um “mel de ouro” para hackers:
Vulnerabilidade de Ponto Único: Se um atacante conseguir intercetar o fluxo de dados que vai para o servidor de treino de IA, ele terá acesso a passwords, segredos industriais e comunicações confidenciais em tempo real.
Insider Threat: O acesso a estes logs de digitação por administradores de sistema internos pode levar a abusos e espionagem corporativa.
“Estamos a assistir à transformação do ser humano numa extensão do dataset. O funcionário já não produz apenas trabalho; ele produz a informação que acabará por substituí-lo ou automatizar a sua função,” afirma um analista de ética digital.
O Impacto no Hardware e Software
Para quem gosta de hardware, esta notícia também levanta questões sobre o desempenho. Processar logs de digitação em tempo real em milhares de máquinas exige uma gestão de recursos de sistema (CPU/RAM) constante, o que pode afetar a performance de máquinas mais modestas. Além disso, abre portas para o desenvolvimento de teclados inteligentes com processamento local (Edge AI) dedicados a esta função.
