Tecnología contra la desinformación: IA detecta imágenes falsas en minutos
Tecnología contra la desinformación: IA detecta imágenes falsas en minutos
Categoría

Un equipo de investigadores de la Washington University in St. Louis presentó SimLBR, un nuevo modelo de inteligencia artificial diseñado para identificar contenidos visuales generados artificialmente a partir de una estrategia distinta: en lugar de aprender primero cómo lucen las creaciones sintéticas, el sistema se entrena reconociendo las características de fotografías auténticas.

De acuerdo con el portal tecnológico TechXplore, esta propuesta surge en medio de una carrera tecnológica cada vez más compleja, en la que los generadores de contenido visual avanzan con tanta rapidez que, en el futuro, podría ser prácticamente imposible para una persona diferenciar a simple vista una fotografía real de una creada por computadora.

Una de las principales ventajas de SimLBR es su rapidez. El sistema requiere menos de tres minutos de entrenamiento utilizando una sola GPU, mientras que el método más avanzado disponible necesita alrededor de dos horas y ocho GPU. Para Aayush Dhakal, estudiante de doctorado en el laboratorio de Nathan Jacobs, profesor de ciencias de la computación e ingeniería en la McKelvey School of Engineering, esta diferencia representa una mejora computacional significativa y una reducción importante en los costos del proceso.

Dhakal desarrolló el modelo junto con colaboradores del Oak Ridge National Laboratory. La propuesta fue presentada en la IEEE/CVF Conference on Computer Vision and Pattern Recognition y sus resultados fueron publicados en el servidor de prepublicaciones arXiv.

El funcionamiento de SimLBR se basa en el llamado espacio latente. En términos sencillos, el sistema toma los píxeles de alta dimensionalidad de una fotografía y los transforma en una representación más compacta mediante un modelo fundacional. Como resultado, cada contenido visual se convierte en un vector de 1.024 dimensiones, y el aprendizaje se realiza únicamente dentro de ese espacio reducido.

Este enfoque permite evitar el costo de entrenar el sistema sobre todos los píxeles de una imagen completa. Además, plantea un cambio de lógica frente a otros detectores: en vez de perseguir las señales particulares que dejan los generadores sintéticos, SimLBR intenta establecer su criterio a partir de la distribución de las fotografías reales.

Según TechXplore, esta decisión busca responder a un problema práctico: muchos detectores pierden eficacia cuando aparece una nueva herramienta generativa, porque fueron entrenados con ejemplos anteriores y no reconocen las características de modelos más recientes.

Dhakal explicó que enfocarse únicamente en detectar contenidos generados por sistemas artificiales deja a los usuarios un paso atrás, ya que la tecnología cambia cada vez que aparecen versiones más avanzadas. El problema, afirmó, no está solo en la calidad de las creaciones visuales, sino también en la velocidad con la que cambia su origen.

El investigador señaló que, cuando se lanza un nuevo modelo generativo, no siempre se tiene acceso inmediato a los contenidos que produce. Para cuando esos ejemplos están disponibles y pueden usarse en entrenamiento, las publicaciones ya circulan en redes sociales o internet, y el detector podría no clasificarlas correctamente porque nunca las había visto antes.

Para evaluar si un sistema puede mantener su desempeño frente a nuevos generadores, el equipo diseñó dos métricas: fiabilidad y rendimiento en el peor caso. Una puntuación alta de fiabilidad indica que el detector combina precisión elevada con baja incertidumbre, lo que permite estimar con mayor confianza cómo funcionará ante herramientas futuras.

El rendimiento en el peor caso mide qué tan bien respondería el modelo cuando se enfrente a un generador que se aleja de aquello con lo que fue entrenado. Con ello, los investigadores no buscan medir únicamente si el sistema acierta en el presente, sino cuánto puede resistir cuando cambian las condiciones del problema.

Dhakal resumió la idea señalando que, cuando un contenido se desvía lo suficiente de la distribución real, el sistema lo clasifica como artificial. Esta estrategia fortalece el detector porque no depende de encontrar patrones específicos de un solo modelo generativo, sino de reconocer cuándo una creación visual se aparta de lo que normalmente produce el mundo real.

Este artículo fue publicado originalmente en Infobae y está protegido por derechos de autor. Todos los derechos reservados a Infobae. Puedes consultar el artículo original en su (https://www.infoabe.com).