Glosario

Transformador

Explora el impacto de los modelos Transformer en la IA con Ultralytics. Descubre su arquitectura, componentes clave y aplicaciones en PNL y visión.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El modelo Transformer se ha convertido en una piedra angular en el campo de la inteligencia artificial, especialmente en el procesamiento del lenguaje natural (PLN) y, más recientemente, en tareas de visión por ordenador. Presentada por primera vez en el artículo "Attention is All You Need" de Vaswani et al. en 2017, la arquitectura Transformer cambió fundamentalmente la forma en que las máquinas procesan y comprenden el lenguaje aprovechando los mecanismos de autoatención.

Comprender los transformadores

Los Transformadores están diseñados para manejar datos secuenciales con más flexibilidad que los modelos anteriores, como las redes neuronales recurrentes (RNN) y las redes neuronales convolucionales (CNN). A diferencia de las RNN, que procesan los datos secuencialmente, los Transformadores permiten una paralelización mucho mayor, lo que reduce enormemente el tiempo de entrenamiento y mejora el rendimiento en grandes conjuntos de datos.

Un elemento central del modelo Transformer es el mecanismo de autoatención. Esto permite al modelo sopesar la importancia de las distintas palabras de una frase, ofreciendo una comprensión y una generación del lenguaje conscientes del contexto. Lee más sobre la autoatención en la página del glosario sobre Autoatención.

Componentes clave

  1. Estructura codificador-decodificador: El Transformer está construido sobre una estructura codificador-decodificador, en la que el codificador procesa el texto de entrada y el decodificador genera el de salida. Cada uno de ellos consta de varias capas que contienen un mecanismo de autoatención y una red neuronal feed-forward.

  2. Codificación posicional: Como los Transformadores no comprenden intrínsecamente el orden de las secuencias, se añade la codificación posicional a las incrustaciones de entrada para ayudar a codificar la posición de las palabras dentro de la secuencia.

  3. Mecanismo de atención: En el corazón del Transformador está el mecanismo de atención que asigna diferentes niveles de importancia a cada parte de la secuencia de entrada, lo que le permite centrarse en las partes relevantes mientras genera las salidas.

Aplicaciones en el mundo real

Procesamiento del Lenguaje Natural

Los Transformers han impulsado importantes avances en la PNL. Los modelos basados en la arquitectura Transformer, como GPT-3 y BERT, han establecido nuevos puntos de referencia en tareas que van desde la generación de textos al análisis de sentimientos y la traducción automática. Estos modelos manejan las tareas mejor que sus predecesores al comprender el contexto a un nivel matizado.

  • El BERT es conocido por tareas que requieren comprender tanto el contexto izquierdo como el derecho de las palabras gracias a su mecanismo de atención bidireccional.

Visión por ordenador

Aunque inicialmente se diseñaron para la PNL, los Transformadores se aplican cada vez más a tareas de visión por ordenador. Modelos como ViT (Vision Transformer) utilizan Transformadores para lograr resultados de vanguardia en clasificación de imágenes, segmentación y mucho más. Profundiza en el papel de los Transformadores en los modelos de visión para comprender su impacto en la visión por ordenador.

Para los interesados, el Ultralytics HUB ofrece herramientas para integrar modelos Transformer en una serie de proyectos, mejorando el rendimiento y la escalabilidad. Obtén más información sobre el despliegue de modelos en aplicaciones del mundo real con Ultralytics HUB.

Distinciones con los modelos relacionados

  • RNNs y LSTMs: A diferencia de las RNN y las LSTM, los Transformadores pueden procesar secuencias en paralelo, lo que permite un entrenamiento más rápido y una mayor eficacia en la captura de dependencias de largo alcance.

  • CNNs: Aunque las CNN se utilizan tradicionalmente para datos de imagen, los Transformadores están demostrando su eficacia debido a su capacidad para captar las relaciones contextuales de los datos sin verse limitados por jerarquías espaciales.

Exploración adicional

Explora el potencial de los Transformadores en la IA leyendo el artículo "La atención es todo lo que necesitas" y la bibliografía relacionada. Para saber más sobre la evolución de estas arquitecturas, considera la posibilidad de conocer variaciones del modelo como Transformer-XL y Longformer, que abordan las limitaciones de secuencia de los diseños originales de Transformer.

Los Transformers siguen impulsando la innovación en todos los ámbitos de la IA, con aplicaciones que van desde la PNL a campos como la sanidad, las finanzas y otros. Mantente al día con Ultralytics' blog para conocer las últimas tendencias y avances en la tecnología Transformer.

Leer todo