A startup apoiada pela Microsoft surpreende as mídias sociais com vídeos hiper-realistas criados usando prompts de texto.
OpenAI, criadora do ChatGPT, revelou uma nova forma de inteligência artificial que cria vídeos realistas com base em instruções de texto, provocando reações de espanto online.
O modelo de texto para vídeo, chamado Sora, tem “uma profunda compreensão da linguagem” e pode gerar “personagens atraentes que expressam emoções vibrantes”, disse a OpenAI em um blog na quinta-feira.
“Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do plano de fundo”, disse a startup apoiada pela Microsoft.
“O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.”
O CEO da OpenAI, Sam Altman, no X, convidou os usuários a sugerir sugestões para Sora antes de postar resultados que incluíam vídeos realistas de dois golden retrievers fazendo podcast no topo de uma montanha, uma avó fazendo nhoque e animais marinhos participando de uma corrida de bicicleta no topo do oceano .
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
-Sam Altman (@sama) 15 de fevereiro de 2024
A qualidade hiper-realista dos vídeos gerou reações de espanto nas redes sociais, com os usuários chamando os resultados de “fora deste mundo” e uma “virada de jogo”.
“Já se passaram duas horas e meu cérebro ainda não consegue processar esses vídeos gerados pelo OpenAI Sora”, disse o usuário do X Allen T.
A manifestação também suscitou preocupações sobre riscos potenciais, especialmente num ano de eleições observadas de perto em todo o mundo, incluindo as eleições presidenciais dos EUA em Novembro.
A OpenAI disse em seu blog que tomaria várias medidas de segurança importantes antes de lançar o Sora ao público em geral.
“Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que testarão o modelo de forma adversa”, disse a empresa.
“Também estamos construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado por Sora.”
A OpenAI também reconheceu que Sora tem pontos fracos, incluindo dificuldade de continuidade e de distinguir a esquerda da direita.
“Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter marca de mordida”, disse a startup com sede em São Francisco.
Os rivais da OpenAI, Meta e Google, também demonstraram tecnologia de IA de texto para vídeo, mas seus modelos não produziram resultados tão realistas quanto os de Sora.
SORA está simplesmente fora deste mundo.
O novo modelo de texto para vídeo da OpenAI acabou de ser lançado e é uma loucura.
Mais exemplos abaixo ⬇️ pic.twitter.com/qbMy5Rz5Mc
– Linus (●ᴗ●) (@LinusEkenstam) 15 de fevereiro de 2024
0 Comments