A Amazon apresentou nesta segunda-feira (31) uma nova versão da inteligência artificila (IA) multimodal da empresa. A ferramenta é a Amazon Nova Act, um novo agente de IA que é capaz de realizar tarefas automatizadas dentro de um navegador e sem acompanhamento humano.
Com configurações personalizadas, esse tipo de serviço é capaz de fazer ações como agendar reuniões, reservar ingressos, preencher formulários online ou pedir comida via delivery, entre outras atividades similares. A Amazon alega ter conseguido uma precisão de acerto de mais de 90% em várias das avaliações internas, um resultado superior a rivais também já apresentados.
A Nova Act é parte do projeto Nova, um modelo generativo lançado pela empresa no final do ano passado e em constante expansão, parte do laboratório AGI que opera dentro da Amazon. O kit de desenvolvimento para interessados está disponível em uma versão prévia, para quem já quiser começar a testar e criar pequenas ferramentas ou rotinas com a IA.
Até o momento, o experimento é limitado para usuários dos Estados Unidos, mas informações adicionais podem ser consultadas na página da plataforma.
Como funciona a Amazon Nova Act
O Amazon Nova Act por enquanto é apenas um kit de desenvolvimento de software (SDK), ou seja, um conjunto de parâmetros e ferramentas para desenvolvedores. Profissionais da área ou usuários que entendam do assunto podem baixá-lo e, a partir de códigos, criar um agente de IA que realize uma ou mais tarefas.
Um dos exemplos mostrados pela equipe é o de pedido de delivery, solicitando que a IA compre o mesmo prato de uma loja digital em um determinado dia. Ela também pode fazer uma lista de apartamentos para aluguel baseada em uma instrução específica, como a distância de bicicleta para um determinado ponto.
- Leia também: Pesquisa revela que usuários "hardcore" do ChatGPT estão se tornando emocionalmente dependentes
Segundo o comunicado oficial, a Nova Act é capaz de ser programada não apenas com ações diretas e objetivas, como "pesquise", "compre" ou "preencha os campos" — embora faça isso bem e de forma fragmentada, aumentando o leque de personalização. Ela também pode receber instruções sobre o que evitar, como fechar um eventual banner de propaganda e recusar extras em uma porção, por exemplo.
Em outro caso mostrado pela Amazon, a plataforma pode ser programada até para jogar no navegador, avançando em um game simples de RPG por turnos envolvendo batalhas entre pombos. O SDK é compatível com várias ferramentas e bibliotecas em Python, o que deve facilitar a adoção rápida da IA.
A ideia é que o Nova Act também seja incorporado na Alexa+, a versão "turbinada" da assistente pessoal da empresa com recursos de IA. Em fase inicial de integração com os dispositivos Echo e custando US$ 19,99 ao mês (cerca de R$ 115), ela ainda não tem data para ser lançada no Brasil.
O que é um agente de IA?
O agente de IA, também chamado de IA agêntica em alguns casos, é um tipo de programa que realiza tarefas autônomas a partir de condições pré-estabelecidas pelo usuário, mas com uma maior capacidade de "raciocínio" do que plataformas tradicionais.
Ele faz isso ao coletar e analisar grandes quantidades de dados, permitindo que uma decisão considerada mais correta seja tomada de forma autônoma — desde que respeite o pedido inicial de sua programação. Essa autonomia faz com que ela consiga até interagir com interfaces digitais, como controlar um navegador e pressionar botões em um site.
Além da Nova Act da Amazon, outras empresas já começaram a disponibilizar ferramentas parecidas que atuam no navegador automaticamente. É o caso do Operator da OpenAI (dona do ChatGPT), o controle do navegador do Claude 3.5 Sonnet e o futuro Project Jarvis, da Google.
O TecMundo já testou o Sora, a IA da dona do ChatGPT que é capaz de gerar vídeos a partir de comandos de texto. Confira aqui o que achamos desse experimento!
Categorias