A internet está sendo reconstruída para máquinas

A infraestrutura em nuvem sempre foi projetada para humanos que pesquisam, clicam, rolam a tela e transmitem dados de forma constante e previsível. Os agentes de IA se comportam de maneira diferente. Eles podem desencadear uma onda de atividade, criando vários subagentes que consultam centenas de bancos de dados, pesquisam documentos e chamam APIs em segundos, desaparecendo tão rapidamente quanto surgiram. 

Partindo dessa premissa, a Amazon está reformulando uma peça fundamental de sua infraestrutura em nuvem. Na quinta-feira, a AWS lançou a próxima geração do OpenSearch Serverless , um banco de dados vetorial e de busca totalmente gerenciado — essencialmente um sistema para armazenar e recuperar informações em grande escala — projetado especificamente para cargas de trabalho com agentes. A AWS afirma que o novo sistema pode escalar instantaneamente quando os agentes acionam tarefas e reduzir a escala para zero quando ocioso.

O lançamento reflete uma crescente percepção em toda a indústria de tecnologia: a infraestrutura originalmente projetada para uma internet conduzida por humanos não funciona tão bem em um mundo cada vez mais povoado por agentes.

Embora os agentes de IA ainda representem uma parcela relativamente pequena da atividade na internet, o tráfego gerado por máquinas já é significativo e tende a crescer. A Cloudflare afirma que os bots foram responsáveis ​​por 31% do tráfego HTTP total nos últimos seis meses. Rastreadores de IA, mecanismos de busca e assistentes virtuais representaram aproximadamente um quarto de todas as solicitações de bots durante esse período. 

“O tráfego não humano ultrapassará o tráfego humano em algum momento do primeiro semestre de 2027”, disse  Lai Yi Ohlsen , gerente sênior de produtos da Cloudflare, ao TechCrunch.

Na conferência para desenvolvedores Google I/O, realizada na semana passada, a empresa afirmou que os usuários poderão começar a delegar tarefas a sistemas de IA, como pesquisar compras, reservar viagens, navegar na web e interagir com aplicativos. Mas a iniciativa não se limita a agentes de IA voltados para o consumidor. As empresas estão cada vez mais implementando agentes internamente e para seus clientes, criando novos tipos de tráfego gerado por máquinas nos bastidores. 

Como resultado, os provedores de nuvem e as empresas de infraestrutura têm se deparado com a questão de como adaptar sistemas construídos para humanos a um mundo de agentes que estão constantemente e autonomamente recuperando informações, invocando ferramentas e gerando tráfego de máquina para máquina. 

É aí que entra o novo OpenSearch Serverless da AWS. 

“O momento é simples. Os agentes estão passando da fase de experimentação para a produção e criam padrões de tráfego para os quais a infraestrutura anterior simplesmente não foi projetada”, disse Tia White, gerente geral do Amazon OpenSearch Service, ao TechCrunch. “Eles sofrem picos repentinos, ficam ociosos sem aviso prévio, e as empresas precisam de buscas que acompanhem o ritmo sem pagar por computação ociosa ou sem uso.”

A principal mudança técnica desta nova geração é a separação entre computação e armazenamento, permitindo que a capacidade computacional seja ampliada em segundos para acomodar picos de tráfego de agentes e reduzida a zero, de modo que os clientes não paguem nada quando os agentes estiverem ociosos.

“Anteriormente, mesmo na nossa versão anterior do Serverless, era necessário ter pelo menos uma instância operacional e em execução, porque o armazenamento e o poder computacional eram acoplados”, disse White. “Não era possível simplesmente ativar [poder computacional] automaticamente na taxa necessária, então você sempre tinha poder computacional ocioso reservado para sua carga de trabalho, independentemente de estar usando ou não.”

Pense nisso como pagar sempre por uma vaga de estacionamento, mesmo quando não a está usando. Com o Serverless atualizado da AWS, é mais parecido com pagar por uma vaga de estacionamento com parquímetro.

No lançamento, o OpenSearch Serverless se integrará nativamente com plataformas de desenvolvimento de IA como Vercel e Kiro, para que os desenvolvedores possam implantar back-ends de pesquisa e vetores prontos para produção para agentes sem precisar gerenciar a infraestrutura. 

Essa mudança está emergindo em todo o setor de nuvem. Databricks e Snowflake estão se reposicionando como sistemas de memória e recuperação de IA para dados corporativos. A Microsoft lançou atualizações para o Azure projetadas para lidar com picos de uso de agentes de IA e compartilhar memória entre eles. A Cloudflare, de forma semelhante à Amazon, apresentou no mês passado uma infraestrutura voltada para fornecer aos agentes ambientes persistentes e escalabilidade instantânea. 

Quanto mais empresas implantarem agentes de IA, maior será a pressão para redesenhar a infraestrutura em torno de cargas de trabalho geradas por máquinas, o que, por sua vez, poderá tornar os agentes mais baratos e fáceis de implantar em larga escala.

Compartilhar Artigo

Artigos Relacionados