Tecnología

Cómo descubrir si una imagen o video es real o está realizado por AI

Martes, 12 de noviembre de 2024

El avance imparable de la inteligencia artificial crea varios desafíos, entre los que se encuentra, cómo saber si un contenido es real o está creado por la AI generativa.

En un breve lapso, la inteligencia artificial generativa ha adquirido gran robustez, destacando en la creación de imágenes y videos de alta fidelidad a partir de simples instrucciones escritas. Para el año 2024, ya no es imprescindible ser un artista destacado, diseñador o programador experto para crear contenido realista. Sin embargo, esto presenta un desafío creciente a medida que estos sistemas incrementan sus capacidades: ¿cómo diferenciar el contenido sintético del creado por humanos o capturado del mundo real?

La implementación de estas tecnologías emergentes no solo nos incentiva a comprender su funcionamiento para utilizarlas adecuadamente, sino que también nos obliga a examinar sus mecanismos para lograr una identificación precisa del contenido sintético.

Entre los objetivos que persigue son

Eludir la desinformación: Si vemos una imagen creada con IA que muestra a una figura de la política ahorcando a un representante del partido opositor, es bueno (y necesario, en muchos sentidos) saber si se trata de una foto editada con IA.

Reconocer los intentos de difamación: Las deepfakes están a la orden del día y son cada vez más convincentes. Si encontramos un video que muestra a una celebridad participando en escenas sexuales, es importante identificar si se trata de una campaña que busca atormentar a esa persona.
La manipulación digital puede tener consecuencias reales: El hecho de que un contenido sea digital no implica que no tenga influencia en aquello que llamamos "realidad".

Las claves para identificar fotos y videos creados con AI

Los generadores de imágenes no solo pueden crear caricaturas o dibujos como el siguiente, cuya influencia en la realidad es inofensiva.

La cuestión no termina en las imágenes. Pronto, los principales actores del sector -OpenAI, Google y Meta- lanzarán generadores de video que crearán secuencias audiovisuales en movimiento a partir de simples instrucciones escritas. Además, esta complejidad aumentará con el tiempo, a medida que los desarrolladores añadan más capacidades a sus modelos.

En este marco, resulta útil conseguir habilidades para distinguir contenido el contenido real del sintético. Si bien no existen fórmulas mágicas para eso, la astucia, el ojo atento y ciertas pistas son útiles.

Entonces, ¿cuáles son las claves para reconocer fotos y videos creados con IA?

La alfabetización en Inteligencia Artificial

Siwei Lyu, profesor de Ciencias de la Computación e Ingeniería en la Universidad de Buffalo, en Nueva York, señaló en diálogo con Mashable que el primer paso para identificar el contenido sintético es "entender que las tecnologías están creciendo y tener esa idea central de que ‘algo de lo que estoy viendo podría haber sido generado con IA'". De acuerdo al experto, esa propensión es más importante que algunas señas específicas que podemos encontrar en los contenidos sintéticos.

En este contexto, aunque las creaciones de IA presentan ciertas señales que revelan su naturaleza -como la dificultad de muchos modelos para generar manos humanas de manera convincente-, es crucial reconocer que incluso si una foto o video parece perfecto, podría haber sido generado por un modelo automatizado.

En esencia, la alusión a la alfabetización en Inteligencia Artificial se refiere a la tendencia de los consumidores a adoptar una actitud crítica ante el contenido. No es necesario desconfiar de todo, pero tampoco conviene ser completamente crédulos.¿Qué pasa con los videos manipulados con IA?

Otra pata de la mencionada alfabetización en IA es conocer las particularidades de los contenidos sintéticos. En el caso de los videos, hay dos vertientes:

Clips con "impostores"

Son deepfakes en las que la edición consiste en cambiar el rostro de una persona, en un video. En muchos casos se usa esta técnica para crear falsificaciones porno: se usa el cuerpo de un desconocido y colocan encima el rostro de una celebridad, por ejemplo. El nivel de realismo dependerá de la "costura" en la zona del cuello.

También son conocidos los casos en los que se manipula con sutileza la boca de una persona y se reemplaza el audio para que "digan" algo que nunca dijeron. En estos ejemplos, el contenido no se crea desde cero, sino que se edita material existente.

En este tipo de videos manipulados, la clave para reconocerlos radica en prestar atención a los márgenes de los rostros, porque hay incongruencias cuando se mueven. Además, es habitual que las miradas sean "extrañas", es decir, que no resulten naturales o sincronizadas con el resto de los movimientos. En las ediciones de labios, se notan algunas inconsistencias en los dientes.

Videos generados a partir de texto

En este terreno incipiente a OpenAI Sora, Google Veo y Meta Movie Gen. Se trata de sistemas que se anunciaron, aunque aún no se lanzaron debido a los riesgos asociados a su uso. Como fuere, lo cierto es que, con movimiento, profundizarán la problemática que aquí nos convoca: la capacidad de identificar lo sintético y lo real.

En las muestras preliminares, en los tres modelos, los detalles son impresionantes y el fotorrealismo es de tal grado que encanta y a la vez asusta. Por ejemplo, el siguiente video fue creado con Google Veo con el prompt "primerísimo plano de brochetas de pollo y pimiento verde asadas en una barbacoa con llamas. Enfoque superficial y humo ligero. Colores vivos".

Para identificar videos que parecen reales, una clave es la duración. La brevedad puede ser motivo de sospecha, ya que los generadores actuales solo pueden crear clips cortos. Con piezas más largas, surgen dificultades. Sin embargo, se espera que con el tiempo mejoren y puedan manejar videos más extensos.

Es crucial observar las inconsistencias y comportamientos ilógicos, como cambios de color repentinos o eventos que desafían las leyes de la física.

Un método para detectar videos generados por IA es fijarse en el fondo. A menudo, el sistema y el espectador se centran en los elementos principales, pero las inconsistencias suelen aparecer en segundo plano, como objetos demasiado suaves o deformados de manera extraña.

La habilidad más relevante es el sentido común

Como hemos visto, existen algunos detalles que delatan que un video fue creado con generadores de IA. Por ejemplo, prestá atención a las manos de la señora en el siguiente video: son claramente artificiales.

Pero los expertos coinciden en que la habilidad clave para reconocer el contenido sintético es el sentido común. Es una capacidad más vinculada al contexto, al mundo real, al conocimiento de aquello que nos circunda; que a una alfabetización de orden tecnológico.

A medida que la inteligencia artificial evoluciona y las fronteras entre lo real y lo artificial se vuelven difusas, las empresas que desarrollan estos modelos prometen implementar mecanismos para definir los límites que se están desvaneciendo. Entre los métodos más conocidos se encuentran las marcas de agua, indicadores visibles que verifican la naturaleza sintética del contenido, así como metadatos "ocultos" en el material que también señalan la intervención de la automatización.

Para identificar creaciones de IA, es útil aplicar estrategias comunes para cualquier contenido en plataformas digitales que pueda ser falso. Esto incluye verificar la reputación de quien comparte la información, examinar qué otras fuentes la difunden y evitar compartir contenido que podría resultar en desinformación o difamación.

tn tecno

Esta nota habla de: