Os vídeos gerados por IA tornam-se mais realistas. c’t 3003 fez o teste e enfrentou sua própria equipe com 15 clipes – uma mistura de imagens reais e geração de ferramentas atuais de IA. Os resultados mostram que o olho treinado às vezes erra.
Leia mais depois do anúncio
Transcrição do vídeo
(Nota: Esta transcrição é destinada a quem não pode ou não quer assistir ao vídeo acima. O texto não contém todas as informações da trilha da imagem. Além disso, há apenas trechos do vídeo que são lidos aqui. A parte de adivinhação está disponível apenas no vídeo.)
Olha aqui, este vídeo é feito por IA. Claro, você vai saber que não estou falando, mas com isso fica mais difícil, né? A IA de vídeo definitivamente melhorou nos últimos meses. É como uma voz de IA, porque não é minha voz original, mas uma imitação da minha voz de IA. Sim, é tudo muito confuso e certamente pode ser perigoso. A IA falsa é onipresente nas redes sociais. Estávamos interessados: os vídeos de IA ainda podem ser facilmente reconhecidos como falsos ou acabou? E pensei, se alguém consegue perceber a diferença, espero meus amigos aqui do c’t 3003. E foi por isso que fiz um quiz: Alguns vídeos de IA misturados com imagens de câmeras reais e Sahin, Chris e Keno agora assistam com vocês e tentem identificar a IA. Você pode adivinhar e no final darei algumas dicas e truques que você pode usar para compreender com segurança o conteúdo gerado por IA no futuro. Então, fique ligado!
Caros hackers, internautas, sejam bem-vindos aqui…
A seção de taxas só pode ser visualizada no vídeo.
Antes de decidirmos quem é o melhor adivinhador, agora vou mostrar especificamente como você ainda pode reconhecer vídeos de IA em 2026. Porque sim, ainda é possível. E mesmo que o modelo esteja cada vez melhor, algumas dicas com certeza vão te ajudar.
Vamos começar com a peça maior: a física. IA como Kling ou Google Veo não conhecem a gravidade ou o peso, apenas calculam qual pixel virá a seguir. O melhor exemplo é o nosso pescador caindo na água. Não vai cair, vai cair, como num cabo invisível. O peso corporal real é perdido. A água do clipe é ótima para isso. Geralmente noto que a nova geração de geradores de vídeo de IA lida muito bem com a água, incluindo esta cachoeira, que teria parecido pior no passado.
Leia mais depois do anúncio
Ao contrário do fogo. Quando você olha para a e-scooter em chamas, você percebe: o fogo da IA não queima, ele flui, mais como plasma brilhante. E o fogo real lançou uma sombra bruxuleante e bruxuleante ao seu redor. É quase certo que isso está faltando na IA porque, ao contrário dos jogos de hoje, ela não simula o comportamento da luz, sendo a palavra-chave ray tracing. Curiosamente, a mesma física nos deixa presos em clipes reais. O vídeo de Sepp Blatter sendo atacado com notas parece tão ridículo que você pode pensar que é IA. Mas a IA atual não consegue gerenciar como cada nota gira e captura a luz. Então, às vezes, a física perfeita é a prova de que é real.
Assim como a interação de objetos costuma ser um bom indicador, é um problema de recorte. Assim que dois materiais sólidos se tocam, a IA muitas vezes perde a fronteira entre eles. Temos um verdadeiro Söder mordendo uma salsicha e depois um AI Söder bebendo de uma garrafa de cerveja. E preste atenção na interação entre o frasco e os lábios. E em comparação, os lábios e o frasco no vídeo real. Já não é uma grande diferença. Mas aqui fica mais claro que o ciclista bateu no vidro. A pele deve estar completamente plana. Ele não fez isso. Os dedos permanecem redondos e deslizam sem resistência.
Porque a anatomia e o movimento muitas vezes ainda são difíceis. É claro que, mesmo em vídeos de IA, as pessoas agora têm cinco dedos nas mãos e os modelos agora podem fazer rostos individuais quase perfeitamente. Mas ele quebra assim que o movimento ou a profundidade entram em ação. Olhe para o fundo da multidão. Em nosso vídeo fan miles, o cara na frente parece bem, mas atrás dele ele se funde em uma verdadeira montanha de carne. Os braços estão no corpo errado, o rosto é apenas manchas da cor da pele e erros ainda acontecem, principalmente quando se move rápido. O golden retriever ambulante deste clipe é um fantasma clássico, suas garras pairando ligeiramente acima do asfalto e movimentos que não parecem naturais porque a IA não está interpolando erroneamente o desfoque de movimento. Dica Geral: Preste atenção aos pés ao caminhar. Muitas vezes as solas dos pés saltam no chão como uma pessoa deslizando.
E preste atenção ao que está escrito no vídeo. Nossos cérebros são muito bons em reconhecer letras, e é exatamente aí que a IA falha quando algo está se movendo. O melhor exemplo é o nosso vídeo da câmera do painel. Contanto que a placa esteja parada, tudo bem, mas assim que houver movimento, os personagens se transformam em hieróglifos alienígenas ilegíveis. Isso é chamado de cintilação temporal. A mesma coisa acontece com cercas de arame ou padrões xadrez. E preste atenção na assimetria ilógica: uma têmpora de óculos sem nada, ou uma jaqueta com botão à esquerda e zíper à direita.
Quinto ponto: óptica. E ele realmente mentiu para nós. Observe que a textura macia começa a tremer no fundo. Chama-se fervura porque parece que a imagem está fervendo um pouco. Fizemos um voo de drone sobre as falésias da Madeira e só lá estive no início de Junho. Na realidade, as coisas verdes no penhasco não brilham de forma estranha. Mas a IA precisa recriar cada folha individualmente em cada quadro porque não possui um mapa 3D fixo do ambiente em sua cabeça. Para efeito de comparação, um voo real de drone sobre um assentamento de casas geminadas no Canadá: telhados, linhas e cercas permanecem rígidos.
E agora o mais importante, que vai te salvar mesmo que o pixel fique perfeito em algum momento. senso comum. O teste mais importante com esses clipes virais: Por que foi gravado aqui? Por que alguém com mão firme está filmando uma estrada rural vazia onde um meteorito cai três segundos depois? Se a câmera for muito perfeita antes, o tempo de reação humana será perdido. Então sempre preste atenção à lógica. Assim, com a e-scooter, a bola de fogo explodiu e os pedestres continuaram caminhando calmamente. Sim, a IA não conhece causa e efeito. Se você vir algo realmente ruim no vídeo, verifique novamente. Então procure outra perspectiva, outra imagem. Tire uma foto e coloque-a na pesquisa de imagens do Google. Porque se está realmente acontecendo, definitivamente há mais do que o vídeo que você vê. E também preste atenção ao áudio. Muitos vídeos de IA são feitos sem som ou têm uma voz de IA bastante clara.
Então, sua lista de verificação: física, recorte, anatomia, redação e bom senso. E agora que você sabe de tudo isso, poderá adivinhar todos os nossos 15 clipes corretamente, certo? Sim, nossos três avaliadores erraram em todos os vídeos. Chris tem duas faltas e Sahin e Keno têm três faltas. É Chris DeBolle. OK! Eu não aceito isso. Obrigado, obrigado. Aceito. Parabéns. Obrigado. Que bom que Keno não ganhou. Sim, eu também. o que? Sim, assustador.
Então, o resto do ano. sim, já. Então temos um problema. Tive problemas com pessoas normais sendo mais propensas a reconhecer essas pistas óbvias. Também aconteceu comigo nas redes sociais que pensei que os vídeos gerados por IA eram reais. Em todo o caso. Isso aconteceu comigo, então estou surpreso que não esteja aqui, a filmagem da câmera de segurança. Ou algo assim… uma câmera de painel. Sim, câmera de painel. Esta é a câmera de painel de classe mais alta que existe. Mas exatamente, este visualizador de porta e câmera Fitton Hole. Anel, esta câmera Ring. Exatamente, já fiz isso muitas vezes. Aí de repente é assim… Bom, no começo eu pensei que era real, depois de repente tinha um gato se comportando, sei lá, como uma banda de mariachis. Também gosto de mandar vídeos de animais como esse para o meu namorado, e ele diz: “Ei, é assim que você sabe”. Você viu esses três coelhinhos na cama elástica? Não. Mas isso é um gênero. Primeiro houve um canguru ou algo assim e depois… Mas foi a primeira vez que as massas realmente se apaixonaram. Foi assim que tive a impressão. Então, com a imagem gerada pela IA, aqui está uma foto do Papa com isto… Bem, isso não está em itálico. E no vídeo está esse animal na cama elástica. Também acho que Sam Altman foi pego roubando. Isso realmente me animou porque era isso que eu queria. Esse é o problema desse conteúdo político que é deturpado. Se é isso que as pessoas querem acreditar, a tendência deveria ser maior. Sim, mas o que podemos fazer agora? Falaremos sobre isso com mais detalhes no podcast. Você pode esperar?
É isso para o nosso teste de IA. No próximo podcast 4004, Chris e Keno falam com mais detalhes sobre esse experimento de IA que estamos fazendo aqui. Certifique-se de ouvir. E se não, escreva nos comentários como você se saiu neste quiz. Você saberá tudo ou onde você se enquadra na IA? E, claro, fique à vontade para se inscrever e conferir nossa newsletter. Vejo você novamente. Tchau!
c’t 3003 é o canal de c’t no YouTube. Os vídeos da c’t 3003 são conteúdos independentes e independentes dos artigos da revista c’t. Os editores Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil e Pascal Schewe publicam vídeos todas as semanas.
(rum)