Amazon revela a Nova Act, IA que faz ações dentro do navegador para você

3 min de leitura
Imagem de: Amazon revela a Nova Act, IA que faz ações dentro do navegador para você
Conteúdo oferecido por

A Amazon apresentou nesta segunda-feira (31) uma nova versão da inteligência artificila (IA) multimodal da empresa. A ferramenta é a Amazon Nova Act, um novo agente de IA que é capaz de realizar tarefas automatizadas dentro de um navegador e sem acompanhamento humano.

Com configurações personalizadas, esse tipo de serviço é capaz de fazer ações como agendar reuniões, reservar ingressos, preencher formulários online ou pedir comida via delivery, entre outras atividades similares. A Amazon alega ter conseguido uma precisão de acerto de mais de 90% em várias das avaliações internas, um resultado superior a rivais também já apresentados.

A Nova Act é parte do projeto Nova, um modelo generativo lançado pela empresa no final do ano passado e em constante expansão, parte do laboratório AGI que opera dentro da Amazon. O kit de desenvolvimento para interessados está disponível em uma versão prévia, para quem já quiser começar a testar e criar pequenas ferramentas ou rotinas com a IA.

Até o momento, o experimento é limitado para usuários dos Estados Unidos, mas informações adicionais podem ser consultadas na página da plataforma.

Como funciona a Amazon Nova Act

O Amazon Nova Act por enquanto é apenas um kit de desenvolvimento de software (SDK), ou seja, um conjunto de parâmetros e ferramentas para desenvolvedores. Profissionais da área ou usuários que entendam do assunto podem baixá-lo e, a partir de códigos, criar um agente de IA que realize uma ou mais tarefas.

Um dos exemplos mostrados pela equipe é o de pedido de delivery, solicitando que a IA compre o mesmo prato de uma loja digital em um determinado dia. Ela também pode fazer uma lista de apartamentos para aluguel baseada em uma instrução específica, como a distância de bicicleta para um determinado ponto.

Segundo o comunicado oficial, a Nova Act é capaz de ser programada não apenas com ações diretas e objetivas, como "pesquise", "compre" ou "preencha os campos" — embora faça isso bem e de forma fragmentada, aumentando o leque de personalização. Ela também pode receber instruções sobre o que evitar, como fechar um eventual banner de propaganda e recusar extras em uma porção, por exemplo.

Em outro caso mostrado pela Amazon, a plataforma pode ser programada até para jogar no navegador, avançando em um game simples de RPG por turnos envolvendo batalhas entre pombos. O SDK é compatível com várias ferramentas e bibliotecas em Python, o que deve facilitar a adoção rápida da IA.

A ideia é que o Nova Act também seja incorporado na Alexa+, a versão "turbinada" da assistente pessoal da empresa com recursos de IA. Em fase inicial de integração com os dispositivos Echo e custando US$ 19,99 ao mês (cerca de R$ 115), ela ainda não tem data para ser lançada no Brasil.

O que é um agente de IA?

O agente de IA, também chamado de IA agêntica em alguns casos, é um tipo de programa que realiza tarefas autônomas a partir de condições pré-estabelecidas pelo usuário, mas com uma maior capacidade de "raciocínio" do que plataformas tradicionais.

Ele faz isso ao coletar e analisar grandes quantidades de dados, permitindo que uma decisão considerada mais correta seja tomada de forma autônoma — desde que respeite o pedido inicial de sua programação. Essa autonomia faz com que ela consiga até interagir com interfaces digitais, como controlar um navegador e pressionar botões em um site.

Além da Nova Act da Amazon, outras empresas já começaram a disponibilizar ferramentas parecidas que atuam no navegador automaticamente. É o caso do Operator da OpenAI (dona do ChatGPT), o controle do navegador do Claude 3.5 Sonnet e o futuro Project Jarvis, da Google.

O TecMundo já testou o Sora, a IA da dona do ChatGPT que é capaz de gerar vídeos a partir de comandos de texto. Confira aqui o que achamos desse experimento!

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.