O que é IA generativa?

Um conjunto de retratos Lensa AI encomendados pelo escritor da Review Geek, Danny Chadwick. — Danny Chadwick, Lensa AI

A IA generativa é uma tecnologia de inteligência artificial que pode potencialmente transformar a maneira como interagimos com as máquinas. É um tipo de IA que pode criar novos conteúdos como texto, imagens, áudio e vídeo com base em sua compreensão do mundo e nas entradas do usuário.

Nos últimos meses, os aplicativos que usam Generative AI explodiram no mercado. O aplicativo de fotos AI Lensa e o chatbot da OpenAI, ChatGPT, causaram grande impacto porque criam texto e imagens de alta qualidade sob demanda. Agora, a Microsoft e o Google estão tentando recuperar o atraso. Mas o que é IA generativa e como ela funciona?

O que é IA generativa?

Para colocá-lo da forma mais simples possível: IA generativa é uma IA (a chamada “inteligência artificial”) que cria conteúdo exclusivo com base em uma solicitação de um usuário. Por exemplo, o prompt que você dá ao Lensa para transformar aquelas fotos legais de perfil de IA em uma seleção de selfies. No caso do ChatGPT, um prompt poderia ser “escreva um soneto sobre bagels no estilo de HL Mencken”. O texto e as imagens resultantes são totalmente exclusivos e gerados pela IA. E não são apenas textos e imagens que a IA generativa pode criar. Outros produtos de IA podem criar recriações de voz fantásticas, e existem até serviços esperando nos bastidores que podem criar conteúdo de vídeo com base em prompts de texto.

ChatGPT escreve um soneto sobre bagels. — Danny Chadwick / Resenha Geek

A IA generativa combina duas poderosas tecnologias de IA: aprendizado de máquina e a capacidade de criar novos conteúdos. Os programadores de IA usam o aprendizado de máquina para construir modelos que podem reconhecer padrões e tendências nos dados existentes, enquanto a geração de conteúdo permite a criação de itens exclusivos, como uma composição ou uma imagem. Quando uma IA tem um tamanho de amostra grande o suficiente para extrair (seu conjunto de treinamento), ela pode recriar praticamente qualquer coisa que possa reconhecer. E como o conjunto de dados para treinar modelos de IA como o ChatGPT é tão grande, ele pode misturar e combinar elementos de várias fontes para fornecer algo único e reconhecível como o que o prompt pediu.

Tipos de IA generativa e como funcionam

Uma mão robótica segurando uma pilha de caixas. — Andrey_Popov / Shutterstock.com

Os algoritmos de IA generativa vêm em várias formas, mas se enquadram em três categorias gerais: redes adversárias generativas (GANs), autoencoders variacionais (VAEs) e modelos transformadores como GPT-4. Cada tipo de algoritmo de IA generativo tem suas vantagens e desvantagens.

As GANs são um tipo de IA generativa que usa duas redes neurais de aprendizado profundo para gerar novos dados. A primeira rede, chamada de gerador, é treinada para criar novos dados que se assemelham ao conteúdo existente, enquanto a segunda rede, chamada de discriminador, é treinada para distinguir entre dados reais e gerados. À medida que os programadores treinam seus AIs, o gerador aprende como produzir imagens cada vez mais realistas que enganam o discriminador fazendo-o acreditar que são reais. Esse processo é conhecido como “jogo minimax”, pois cada rede tenta enganar a outra enquanto minimiza seus próprios erros.

Uma desvantagem potencial dos GANs é que às vezes eles podem produzir imagens irrealistas ou borradas. Por exemplo, um GAN treinado para gerar imagens de rostos humanos pode, às vezes, criar imagens com um par extra de olhos ou uma estrutura facial distorcida. Mãos humanas podem parecer um verdadeiro pesadelo. No entanto, ainda é cedo para essa tecnologia e questões como essa serão resolvidas no devido tempo.

Os VAEs são outro tipo de IA generativa usada para gerar dados novos e exclusivos. Ao contrário dos GANs, os VAEs usam uma representação compactada de seus dados de entrada para gerar algo novo que se pareça com o original. Os VAEs são usados com mais frequência para criar imagens e vídeos, mas também podem gerar texto. Uma limitação potencial dos VAEs é que seus dados podem não ser tão variados quanto aqueles gerados pelos GANs porque os VAEs aprendem uma representação mais restrita dos dados de entrada. Além disso, os VAEs às vezes sofrem com os problemas de imagem distorcida que os GANs enfrentam.

Modelos de transformadores como o GPT-4 são uma iteração relativamente mais recente de IA generativa que atraiu muitos olhares devido ao seu desempenho impressionante em muitas tarefas de processamento de linguagem natural. O ChatGPT é o atual exemplo de estrela dourada de um produto de IA baseado em transformador. Esses modelos são baseados em um tipo de arquitetura de rede neural chamada “transformador”. Eles são projetados para processar grandes sequências de dados, são treinados em um enorme conjunto de dados de texto e podem dar respostas coerentes e contextualmente relevantes a um prompt.

A vantagem dos modelos transformadores é que eles podem gerar textos diversos e de alta qualidade. No entanto, eles podem sofrer vieses e imprecisões nos dados de treinamento, levando a saídas inadequadas ou errôneas. Além disso, a enorme quantidade de recursos computacionais e dados necessários para treinar e executar esses modelos pode torná-los difíceis e caros para algumas aplicações.

Aplicações de IA generativa

Uma ilustração de duas mãos e um cérebro. — issaro prakalung / Shutterstock.com

A IA generativa já está sendo usada em uma série de serviços populares. Existe o já mencionado chatbot ChatGPT, feito pela OpenAI e seu gerador de imagens irmã DALL-E. Há também uma série de editores de imagem AI, incluindo Lensa (iOS, Android), Wonder (iOS, Android) e muito mais. Todos eles já existem há algum tempo. Mas quando o ChatGPT decolou, o Vale do Silício decidiu que era hora de liberar a nova tecnologia e anunciou um novo produto de IA após o outro.

Desde o início deste ano, a Microsoft e o Google anunciaram encantamentos de IA para seus mecanismos de busca. Seguido logo depois por provedores de pesquisa menores, DuckDuck Go e Brave. A Microsoft adicionou a geração de imagens de IA ao Bing e ao Edge, bem como componentes de IA ao seu pacote de escritório. Até o Opera está adicionando o ChatGPT ao seu navegador de desktop. Além disso, a Shutterstock e a Adobe lançaram geradores de arte de IA treinados no trabalho de usuários remunerados.

Mas a IA generativa pode ir muito além de criadores de imagens, chatbots e assistentes de pesquisa. Profissionais de todas as esferas da vida podem usar essas ferramentas em seu trabalho. A IA generativa tem aplicações potenciais no design de produtos, permitindo que as empresas criem produtos personalizados adaptados às necessidades de cada cliente. Além disso, pode ser utilizado por profissionais de saúde auxiliando no diagnóstico e desenvolvimento de tratamentos.

Além disso, a IA generativa pode criar conteúdo personalizado, como artigos de notícias ou listas de reprodução de música. Ao analisar as preferências e o comportamento de um usuário, os algoritmos generativos de IA podem gerar conteúdo adaptado aos seus interesses, aumentando o envolvimento e a satisfação do usuário. A IA generativa pode ajudar a criar novos conteúdos para a indústria do entretenimento, como roteiros de filmes ou níveis de videogame. A capacidade de gerar produtos exclusivos, mas semelhantes, permite que as empresas criem mais conteúdo com mais rapidez e qualidade consistentemente superior.

Essa é apenas a ponta do iceberg quando se trata das possíveis aplicações da IA generativa. A tecnologia também pode encontrar lugares úteis em muitas outras indústrias e profissões. Não seria exagerado comparar essa tecnologia, quando implementada em escala, com a invenção da imprensa ou o desenvolvimento da linha de montagem em termos de como ela pode transformar a forma como criamos e consumimos conteúdo e realizamos nosso trabalho.

Riscos potenciais e considerações éticas

Uma caveira em um fluxo digital de uns e zeros. — enzozo/Shutterstock.com

Claro, com qualquer nova tecnologia vem o risco de que ela seja mal utilizada ou impactar alguns grupos negativamente. Uma das principais preocupações em torno da IA generativa é que ela pode substituir escritores, artistas e outros tipos criativos que ganham a vida fazendo artigos, arte, roteiros, livros e muito mais. Outra desvantagem potencial da IA generativa é que ela pode ser usada para fazer falsificações profundas de celebridades e políticos que seriam indistinguíveis de vídeos e imagens de pessoas reais e usá-los para enganar o público. E, claro, sempre paira a questão da ficção científica sobre o que acontece se permitirmos que a IA comece a tomar decisões sem supervisão humana adequada. Irá se voltar contra seus criadores ou tomar decisões que prejudiquem os humanos, pensando que isso ajudará?

A boa notícia é que a maioria das questões éticas em torno da IA são preocupações perenes do progresso tecnológico. A destruição de empregos quase sempre acompanha os avanços na automação. Mas também vem com ferramentas mais avançadas para quem se apega ao ofício. Escritores, artistas e outros criativos agora têm um assistente poderoso para ajudá-los em suas vocações, não necessariamente para destruí-los. Além disso, a falsificação de imagens de celebridades e políticos existe desde os primeiros programas de software de edição de fotos. E estamos nos preparando para a aquisição da IA nos filmes desde antes do primeiro Exterminador do Futuro filme. E embora sejam questões e preocupações válidas, provavelmente serão resolvidas de uma forma que beneficie a todos ou pelo menos tratadas de uma forma que não envolva perda maciça de empregos e a vinda de um governo soberano da IA.

No entanto, um grande emaranhado que muitos produtos de IA terão que superar são os direitos autorais. Como a IA generativa é treinada em um enorme conjunto de dados de texto, imagens, sons e muito mais, o material protegido por direitos autorais constitui uma parte distinta do que a IA generativa utiliza para fazer novas criações. É verdade que a natureza da IA generativa impede uma recriação exata palavra por palavra de um trabalho protegido por direitos autorais, mas tudo o que a IA generativa cria é composto de pedaços de material protegido por direitos autorais. Ou pelo menos a IA aprendeu a escrever e desenhar com base nas obras dos humanos. Isso pode levar a possíveis ações judiciais de escritores e artistas que sentem que seu trabalho foi roubado para treinar a IA e que merecem compensação ou exigem que a IA “esqueça” o que aprendeu com seu trabalho.

Mas, pode-se argumentar que a IA não está copiando automaticamente o trabalho protegido e que o aprendizado de máquina é equivalente ao aprendizado humano, assim como se um escritor lesse um livro e se inspirasse a escrever o seu próprio em linhas semelhantes. Provavelmente chegará a uma batalha judicial em que um juiz terá que decidir: “qual é a diferença entre uma IA aprendendo imitando e um humano fazendo isso?” E isso é apenas a ponta do iceberg quando se trata de desvendar todas as implicações legais que a IA generativa certamente levantará. Agora seria um bom momento para os advogados atualizarem sua ciência da computação.

Considerações finais: Bem-vindo ao futuro

A IA generativa pode ser tão assustadora quanto impressionante e fascinante. Mas está aqui agora e não vai embora. Dada a taxa de adoção nos primeiros meses de 2023, não é difícil prever que, até o final do ano, a IA generativa será incorporada a grande parte de sua vida diária. E até o final de 2024, pode ser difícil lembrar da vida sem essa tecnologia.

O que é IA generativa?

O que é IA generativa?

O que é IA generativa?

Tipos de IA generativa e como funcionam

Aplicações de IA generativa

Riscos potenciais e considerações éticas

Considerações finais: Bem-vindo ao futuro

Posted by Vinicius Fontes

0 Comments

Cancel reply

O que é IA generativa?

O que é IA generativa?

Tipos de IA generativa e como funcionam

Aplicações de IA generativa

Riscos potenciais e considerações éticas

Considerações finais: Bem-vindo ao futuro

Like it? Share with your friends!

0 Comments