A startup apoiada pela Microsoft surpreende as mídias sociais com vídeos hiper-realistas criados usando prompts de texto.
![aberto](https://www.aljazeera.com/wp-content/uploads/2024/02/2023-02-21T215204Z_2123788221_RC2UFZ9PGDSK_RTRMADP_3_TECH-OPENAI-1-1708047703.jpg?resize=770%2C513&quality=80)
OpenAI, criadora do ChatGPT, revelou uma nova forma de inteligência artificial que cria vídeos realistas com base em instruções de texto, provocando reações de espanto online.
O modelo de texto para vídeo, chamado Sora, tem “uma profunda compreensão da linguagem” e pode gerar “personagens atraentes que expressam emoções vibrantes”, disse a OpenAI em um blog na quinta-feira.
“Sora é capaz de gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do plano de fundo”, disse a startup apoiada pela Microsoft.
“O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico.”
O CEO da OpenAI, Sam Altman, no X, convidou os usuários a sugerir sugestões para Sora antes de postar resultados que incluíam vídeos realistas de dois golden retrievers fazendo podcast no topo de uma montanha, uma avó fazendo nhoque e animais marinhos participando de uma corrida de bicicleta no topo do oceano .
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
-Sam Altman (@sama) 15 de fevereiro de 2024
A qualidade hiper-realista dos vídeos gerou reações de espanto nas redes sociais, com os usuários chamando os resultados de “fora deste mundo” e uma “virada de jogo”.
“Já se passaram duas horas e meu cérebro ainda não consegue processar esses vídeos gerados pelo OpenAI Sora”, disse o usuário do X Allen T.
A manifestação também suscitou preocupações sobre riscos potenciais, especialmente num ano de eleições observadas de perto em todo o mundo, incluindo as eleições presidenciais dos EUA em Novembro.
A OpenAI disse em seu blog que tomaria várias medidas de segurança importantes antes de lançar o Sora ao público em geral.
“Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que testarão o modelo de forma adversa”, disse a empresa.
“Também estamos construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado por Sora.”
A OpenAI também reconheceu que Sora tem pontos fracos, incluindo dificuldade de continuidade e de distinguir a esquerda da direita.
“Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter marca de mordida”, disse a startup com sede em São Francisco.
Os rivais da OpenAI, Meta e Google, também demonstraram tecnologia de IA de texto para vídeo, mas seus modelos não produziram resultados tão realistas quanto os de Sora.
SORA está simplesmente fora deste mundo.
O novo modelo de texto para vídeo da OpenAI acabou de ser lançado e é uma loucura.
Mais exemplos abaixo ⬇️ pic.twitter.com/qbMy5Rz5Mc
– Linus (●ᴗ●) (@LinusEkenstam) 15 de fevereiro de 2024
0 Comments