Alchemylabs

¿Qué son las redes antagónicas generativas (GAN's)?

Escrito por Product Specialist | May 12, 2022 7:00:00 PM

Una red antagónica generativa (GAN) es un modelo de aprendizaje automático (ML) en el que dos redes neuronales compiten entre sí para ser más precisas en sus predicciones. Las GAN generalmente se ejecutan sin supervisión y utilizan un marco de juego cooperativo de suma cero para aprender.

 

Las dos redes neuronales que componen una GAN se denominan generador y discriminador. El generador es una red neuronal convolucional y el discriminador es una red neuronal deconvolucional. El objetivo del generador es fabricar artificialmente resultados que podrían confundirse fácilmente con datos reales. El objetivo del discriminador es identificar qué salidas que recibe se han creado artificialmente.

 

 

Básicamente, las GAN crean sus propios datos de entrenamiento. A medida que continúa el ciclo de retroalimentación entre las redes antagónicas, el generador comenzará a producir resultados de mayor calidad y el discriminador mejorará al marcar los datos que se han creado artificialmente.

 

 

Cómo funcionan las GAN

 

El primer paso para establecer una GAN es identificar el resultado final deseado y recopilar un conjunto de datos de entrenamiento inicial basado en esos parámetros. Luego, estos datos se aleatorizan y se ingresan en el generador hasta que adquieren una precisión básica en la producción de resultados.

 

Después de esto, las imágenes generadas se introducen en el discriminador junto con puntos de datos reales del concepto original. El discriminador filtra la información y devuelve una probabilidad entre 0 y 1 para representar la autenticidad de cada imagen (1 se correlaciona con real y 0 se correlaciona con falso). Luego, estos valores se verifican manualmente para verificar el éxito y se repiten hasta que se alcanza el resultado deseado.

 

Casos de uso populares para GAN

 

Las GAN se están convirtiendo en un modelo de ML popular para las ventas minoristas en línea debido a su capacidad para comprender y recrear contenido visual con una precisión cada vez más notable. Los casos de uso incluyen:

 

 

 

  • Relleno de imágenes a partir de un esquema.
  • Generación de una imagen realista a partir de texto.
  • Producir representaciones fotorrealistas de prototipos de productos.
  • Conversión de imágenes en blanco y negro a color.

En la producción de video, las GAN se pueden usar para:

 

  • Modele patrones de comportamiento y movimiento humano dentro de un marco.
  • Predecir fotogramas de vídeo posteriores.
  • Crear una falsificación profunda
  •