Glosario

IA Generativa

Descubre cómo la IA generativa crea contenido original como texto, imágenes y audio, transformando industrias con aplicaciones innovadoras.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La Inteligencia Artificial (IA) Generativa es un subconjunto de la inteligencia artificial (IA) centrado en crear sistemas que puedan generar contenidos novedosos, como texto, imágenes, audio, código o datos sintéticos. A diferencia de los modelos de IA discriminativa, que aprenden a clasificar o predecir basándose en los datos de entrada (por ejemplo, identificando objetos en una imagen), los modelos generativos aprenden los patrones y distribuciones subyacentes en un conjunto de datos para producir resultados nuevos y originales que se parezcan a los datos de entrenamiento. Los avances recientes, en particular con modelos como los Transformadores Generativos Preentrenados (GPT) y los modelos de difusión, han permitido crear contenidos muy realistas y complejos.

Cómo funciona la IA Generativa

Los modelos generativos de IA suelen funcionar aprendiendo una representación de la distribución de probabilidad de los datos de entrenamiento. A continuación, pueden muestrear a partir de esta distribución aprendida para generar nuevos puntos de datos. Las arquitecturas más comunes son:

  • Redes Generativas Adversariales (GAN): Consisten en dos redes neuronales, una generadora y otra discriminadora, que compiten entre sí para mejorar la calidad de las salidas generadas.
  • Transformadores: Muy utilizados en los Grandes Modelos Lingüísticos (LLM ) como el GPT-4, estos modelos utilizan mecanismos de atención para generar secuencias coherentes y contextualmente relevantes, principalmente texto.
  • Autocodificadores variacionales (VAE): Aprenden representaciones comprimidas de los datos y pueden generar nuevos datos descodificando puntos muestreados del espacio latente.
  • Modelos de difusión: Estos modelos funcionan añadiendo gradualmente ruido a los datos y aprendiendo después a invertir el proceso, lo que permite una generación de alta fidelidad, especialmente para las imágenes (por ejemplo, la Difusión Estable).

IA Generativa vs. Visión por Computador

Aunque ambas son ramas de la IA, la IA Generativa y la Visión por Computador (VC) tienen propósitos fundamentalmente distintos.

  • Enfoque de la IA Generativa: Creación de nuevos contenidos (por ejemplo, generar imágenes a partir de descripciones de texto, escribir artículos, componer música).
  • Enfoque de Visión por Computador: Análisis y comprensión de los datos visuales existentes (por ejemplo, detección de objetos, clasificación de imágenes, segmentación de instancias utilizando modelos como Ultralytics YOLO).

Como se debatió durante YOLO Vision 2024, los modelos de IA Generativa suelen ser significativamente mayores (miles de millones de parámetros) en comparación con los modelos CV eficientes diseñados para el análisis en tiempo real (como Ultralytics YOLOv8con modelos a partir de unos pocos millones de parámetros). La IA Generativa requiere importantes recursos informáticos para el entrenamiento y la inferencia, mientras que muchos modelos de CV están optimizados para su despliegue en hardware estándar o dispositivos de borde.

Sin embargo, estos campos se entrecruzan cada vez más. La IA Generativa puede ayudar a la CV creando datos sintéticos para entrenar modelos de detección o segmentación, especialmente para escenarios poco frecuentes, mejorando potencialmente la solidez y el rendimiento del modelo.

Aplicaciones y ejemplos reales

La IA Generativa tiene numerosas aplicaciones en diversos ámbitos:

  1. Creación de contenidos: Generar artículos, textos de marketing, guiones(generación de texto), crear imágenes o arte originales(texto aimagen), componer música o generar vídeo(texto a vídeo). Herramientas como ChatGPT para texto y Midjourney para imágenes son ejemplos populares.
  2. Aumento de datos: Creación de muestras de datos artificiales para ampliar conjuntos de datos limitados. Por ejemplo, generar imágenes sintéticas de afecciones médicas raras para mejorar la precisión de los sistemas de IA de diagnóstico utilizados en el análisis de imágenes médicas. Esto ayuda a superar la escasez de datos y mejora la generalización de los modelos.
  3. Descubrimiento y desarrollo de fármacos: Simular estructuras moleculares y predecir sus propiedades para acelerar la búsqueda de nuevos medicamentos, como exploran empresas como DeepMind.
  4. Personalización: Potenciando sofisticados chatbots y asistentes virtuales, creando materiales de aprendizaje personalizados o generando recomendaciones de productos a medida.

Consideraciones éticas

El poder de la IA Generativa también conlleva importantes retos éticos. Entre ellos se incluyen la posibilidad de generar información errónea o contenidos perjudiciales, la creación de falsificaciones profundas convincentes, cuestiones relacionadas con los derechos de autor y la propiedad intelectual de los contenidos generados, y los sesgos inherentes aprendidos de los datos de entrenamiento. Abordar estas cuestiones requiere una cuidadosa consideración de la ética de la IA, la transparencia y unos marcos reguladores sólidos. Desarrollar y desplegar estas tecnologías de forma responsable es crucial. Para gestionar y entrenar tus propios modelos de IA, considera plataformas como Ultralytics HUB.

Leer todo