Descubre cómo los modelos básicos revolucionan la IA con arquitecturas escalables, un amplio preentrenamiento y adaptabilidad para diversas aplicaciones.
Un Modelo de Base es un modelo de Inteligencia Artificial (IA) a gran escala preentrenado en grandes cantidades de datos amplios y sin etiquetar, diseñado para ser adaptado o afinado para una amplia gama de tareas posteriores. Estos modelos, a menudo basados en arquitecturas como el Transformador, aprenden patrones, estructuras y representaciones generales a partir de los datos, formando una base versátil para diversas aplicaciones especializadas sin necesidad de entrenarlos desde cero para tareas específicas. El desarrollo de modelos de base representa un importante cambio de paradigma en el Aprendizaje Automático (AM), que avanza hacia la construcción de modelos de propósito general que pueden especializarse de forma eficiente.
Los modelos de cimentación se definen por varios atributos básicos:
La creación y el uso de modelos de cimentación suelen implicar dos etapas:
Los modelos de fundación abarcan varios ámbitos:
El preentrenamiento de los modelos básicos es caro desde el punto de vista computacional, y a menudo requiere clusters masivos de GPUs o TPUs y un importante esfuerzo de ingeniería, normalmente realizado por grandes laboratorios de investigación o corporaciones como GoogleMeta AI y OpenAI. Sin embargo, una vez preentrenados, estos modelos pueden adaptarse de forma más eficiente. Plataformas comoUltralytics HUB proporcionan herramientas para entrenar modelos personalizados, gestionar conjuntos de datosUltralytics Datasets) y desplegar soluciones(Model Deployment Options), a menudo aprovechando pesos preentrenados que incorporan conocimientos fundacionales. Una adaptación eficaz sigue requiriendo un cuidadoso ajuste de los hiperparámetros y, potencialmente, un aumento de los datos.
Los modelos de base están cambiando el panorama de la IARoboflow sobre los modelos de base). Aceleran el desarrollo, permiten nuevas aplicaciones y plantean importantes consideraciones en torno a la ética de la IA, la parcialidad y el acceso computacional. Instituciones de investigación como el Centro de Investigación sobre Modelos de Fundación (CRFM) de Stanford se dedican a estudiar sus capacidades e impacto social. Es probable que el futuro implique modelos de cimentación más potentes, eficientes y potencialmente multimodales que impulsen la innovación en la ciencia, la industria y la vida cotidiana(Casos de uso de la IA).