Mastodon

A Revolução da IA na Geração de Imagens: Da Brincadeira à Realidade

Neste artigo, vou compartilhar uma experiência pessoal utilizando essas ferramentas e como a IA está transformando o mundo das imagens, além de detalhar o processo que segui para treinar modelos e testar suas capacidades.

A Revolução da IA na Geração de Imagens: Da Brincadeira à Realidade

O avanço das tecnologias de IA na geração de imagens chegou a um nível tão surpreendente que aquilo que antes parecia ficção científica se tornou uma realidade assustadora e fascinante. Ferramentas como Stable Diffusion e Flux, combinadas com plataformas como o Civit.ai e o ComfyUI, estão redefinindo o que significa criar e manipular imagens. Essa evolução impacta desde o entretenimento até áreas mais sérias, como a segurança digital, levantando questões éticas sobre autenticidade e confiança.

Neste artigo, vou compartilhar uma experiência pessoal utilizando essas ferramentas e como a IA está transformando o mundo das imagens, além de detalhar o processo que segui para treinar modelos e testar suas capacidades.

Vídeo contando essa história e demonstrando como treinar o modelo

Brincando com IA: Fotos que Enganam Até sua Família

A ideia de criar imagens hiper-realistas com IA me levou a testar um modelo de geração de fotos. Com a ajuda do Civit.ai e do ComfyUI, treinei um modelo baseado em 21 fotos pessoais de celular, redimensionadas para 512x512 pixels e sem fundo. O treinamento durou cerca de 44 minutos, custando menos de cinco dólares. Após o treinamento, fui capaz de gerar imagens que pareciam extremamente reais, o que abriu um leque de possibilidades para testar os limites dessa tecnologia.

Como parte de um experimento divertido, decidi brincar com a ferramenta criando uma série de fotos “minhas” em situações inusitadas. Um dos exemplos mais engraçados foi uma imagem onde apareço brincando com um urso na Estônia. A qualidade das fotos era tão boa que minha esposa deu a ideia: Será que a família acreditaria que isso pudesse ser real?

Resolvi mandar as imagens para o grupo da minha família no WhatsApp. Afinal, qual seria a reação deles ao ver fotos "profissionais" minhas, além de estar brincando com um urso na última imagem? A surpresa foi que todos acreditaram! Minha mãe, irmãos e até parentes mais próximos caíram na brincadeira, comentando sobre como a foto parecia incrível e elogiando o estilo da imagem. Minha mãe, por exemplo, ficou genuinamente impressionada e achou que eu havia feito uma sessão de fotos em estúdio. Após toda a repercussão, eu expliquei do que se tratava e reforcei como serão os golpes daqui em diante.

Essa reação foi uma demonstração prática do quão convincentes essas imagens geradas por IA podem ser. Se minha própria família, que conhece bem meu estilo e o tipo de coisa que costumo fazer, acreditou na autenticidade da imagem, imagine o que pode ser feito em cenários mais sérios, como golpes e fraudes online.

O Processo: Treinando um Modelo com Flux

O coração dessa brincadeira está no treinamento de modelos. Para isso, utilizei o Flux, um dos modelos mais avançados de geração de imagens disponível no Civit.ai. Com 22 gigabytes de tamanho, o Flux é capaz de criar imagens de alta qualidade, especialmente rostos e corpos humanos, superando até mesmo ferramentas populares como o Stable Diffusion.

O processo começou com a escolha de 21 fotos minhas, capturadas em diferentes ângulos e situações, todas tiradas pelo celular. Essas imagens foram cortadas para 512x512 pixels, sem fundo, e devidamente tagueadas para que o modelo pudesse aprender o máximo possível de detalhes sobre meu rosto, corpo e características. No Civit.ai, o sistema permite que você faça o upload dessas imagens e utilize um recurso chamado "auto-tagging", que adiciona automaticamente descrições básicas a cada imagem, como "barba", "óculos", "sorrindo", entre outros.

Depois de preparar o dataset, o treinamento começou e, em cerca de 44 minutos, o modelo estava pronto. A partir daí, bastava fazer a inferência, ou seja, criar as imagens com base no modelo treinado.

A Realidade que Estamos Vivendo

Essa experiência, por mais engraçada que tenha sido, levanta questões sérias sobre o uso de IAs para manipulação de imagens. A facilidade com que uma pessoa comum, como eu, pode criar imagens hiper-realistas, significa que estamos entrando em uma era onde confiar no que vemos será cada vez mais difícil.

Imagens falsas, manipuladas com precisão, podem ser usadas para diversos fins nefastos, como chantagens, fraudes, ou até mesmo para arruinar casamentos e reputações. No exemplo que dei, minha família caiu em uma brincadeira inofensiva, mas imagine as consequências se essa tecnologia fosse utilizada de forma maliciosa.

A Importância de Autenticação e Proteção

A partir dessa experiência, fica claro que precisamos nos proteger de possíveis golpes que utilizem imagens geradas por IA. Um dos métodos mais eficazes que recomendo é a criação de senhas de família. Se você receber uma mensagem ou foto comprometedora, algo que aparentemente envolva alguém da sua família, ter uma senha (palavra, frase ou resposta a uma pergunta) que apenas membros da família saibam pode ser um passo essencial para verificar a autenticidade da comunicação.

Na prática, quando um criminoso tentar usar uma imagem ou voz clonada para enganar alguém, você poderá validar rapidamente durante a própria conversa se está de fato falando com seu familiar ou com um fraudador. Se a pessoa do outro lado não souber a senha, é um sinal de que algo está errado.

Não é necessário solicitar uma senha para a pessoa do outro lado, basta ter acordado previamente a resposta para uma pergunta trivial. Dessa forma você consegue autenticar seu familiar sem levantar maiores suspeitas.

Conclusão: O Futuro da IA e a Realidade que Nos Espera

O que antes parecia ficção científica está acontecendo agora. A tecnologia de IA para geração de imagens chegou a um ponto onde não podemos mais confiar cegamente no que vemos ou ouvimos. Enquanto algumas pessoas usam essas ferramentas para diversão e criação de arte, há também quem as utilize para o crime. Portanto, é fundamental estarmos preparados e informados sobre o que está acontecendo.

Se até minha mãe e meus irmãos acreditaram que a foto com o urso era real, imagine o potencial de danos em situações onde não há um contexto de brincadeira. Estamos caminhando para um futuro onde a realidade e a ficção se misturam de formas que jamais imaginamos.

A melhor maneira de enfrentar isso? Informação, diálogo com a família e amigos, e métodos de autenticação. Nunca foi tão importante verificar o que estamos vendo antes de tomar qualquer atitude baseada nisso.