IA de vídeo Sora parece ter sido treinada com lives de games — e isso é um problema

2 min de leitura
Imagem de: IA de vídeo Sora parece ter sido treinada com lives de games — e isso é um problema

É possível que a OpenAI tenha usado vídeos de gameplays e lives da Twitch para treinar a Sora, sua inteligência artificial que cria vídeos realistas. A ferramenta consegue gerar animações aparentemente inspiradas em clássicos e várias franquias populares.

O site TechCrunch conseguiu gerar uma série de vídeos que ao menos fazem referência a títulos populares, como Super Mario Bros, Call of Duty e Tartaruga Ninja. A qualidade do resultado varia significativamente, mas suas inspirações são facilmente reconhecidas.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

A mesma Sora também parece entender o que é Twitch e como uma transmissão ao vivo se parece. Essa noção do modelo sugere que a base de dados utilizada para treinamento conta com vídeos e imagens de lives na plataforma da Amazon.

A Sora consegue criar vídeos de jogos famosos, e isso pode gerar problemas para a OpenAI. (Fonte: TechCrunch/Reprodução)
A Sora consegue criar vídeos de jogos famosos, e isso pode gerar problemas para a OpenAI. (Fonte: TechCrunch/Reprodução)

Se a Sora consegue gerar vídeos que se parecem com Mario, Call of Duty ou com a aparência de streamers, é possível que a base de treinamento contenha material dessas categorias — e a OpenAI pode não ter licença para utilizar todas elas. A descoberta pode gerar uma série de problemas legais para a empresa de Sam Altman, principalmente quanto a violação de direitos autorais.

Como IAs são treinadas?

O treinamento de IAs generativas como a Sora exige um volume colossal de dados. Basicamente, o modelo aprende como o mundo funciona por observação, e os resultados são probabilísticos.

Para cada imagem gerada, a IA considera uma infinidade de fatores, confrontando o prompt entregue pelo usuário com as informações contidas na sua base de treinamento. O conteúdo devolvido é o resultado dessa combinação.

Possíveis problemas judiciais

"Empresas que treinam [modelos] com vídeos não licenciados de gameplays correm vários riscos", disse o advogado de propriedade intelectual do escritório Pryor Cashman, Joshua Weisgensberg, em entrevista para o TechCrunch.

É possível que a OpenAI tenha utilizado conteúdo protegido por direitos autorais para treinar o modelo da Sora. (Fonte: TechCrunch/Reprodução)
É possível que a OpenAI tenha utilizado conteúdo protegido por direitos autorais para treinar o modelo da Sora. (Fonte: TechCrunch/Reprodução)

"Treinar modelos generativos geralmente envolve copiar a base de treinamento. Se esses dados são vídeos de jogos, provavelmente está cheio de materiais protegidos por direitos autorais", continuou o jurista.

É praticamente impossível deduzir a fonte do "conhecimento" da Sora. Em textos, por exemplo, a detecção de violação de direitos autorais requer profunda investigação, e já rende disputas judiciais à OpenAI.

De toda forma, a geração de imagens que remetem a uma marca também representa riscos para as detentoras oficiais. O conteúdo gerado pode ocasionar em impactos negativos em marcas ou pessoas, principalmente se forem associados a assuntos controversos de forma convincente.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.