Glossário

YAML

Descobre o poder do YAML em IA/ML! Simplifica as configurações, agiliza os fluxos de trabalho e melhora a legibilidade com este formato de dados versátil.

YAML Ain't Markup Language (YAML) é uma linguagem de serialização de dados legível por humanos, frequentemente utilizada para ficheiros de configuração e em aplicações onde os dados são armazenados ou transmitidos. Concebida para ser simples e legível, a YAML é particularmente valiosa em Inteligência Artificial (IA) e Aprendizagem Automática (ML) para gerir configurações complexas relacionadas com modelos, processos de formação e pipelines de implementação. A sua sintaxe simples torna os fluxos de trabalho de IA/ML mais compreensíveis, fáceis de manter e reproduzíveis.

Principais caraterísticas do YAML

O YAML dá prioridade à legibilidade humana. A sua estrutura baseia-se fortemente na indentação para denotar hierarquia, semelhante ao Pythono que resulta em ficheiros mais limpos em comparação com formatos como XML ou JSON. As principais caraterísticas incluem:

Sintaxe legível por humanos: A utilização mínima de parênteses ou etiquetas torna os ficheiros fáceis de ler e editar.
Estrutura através de indentação: Usa espaços (e não tabulações) para definir estruturas aninhadas, aumentando a clareza.
Suporte para estruturas de dados: Suporta nativamente tipos de dados comuns como escalares (strings, números, booleanos), listas (seqüências) e dicionários (mapeamentos/pares de valores chave).
Comentários: Permite adicionar comentários utilizando o # para documentação dentro do ficheiro.
Versatilidade: Pode representar estruturas de dados complexas adequadas a várias necessidades de configuração.

Podes saber mais sobre a sua estrutura na especificação oficial do YAML.

YAML em aplicações de IA e ML

Os ficheiros YAML são amplamente utilizados no panorama da IA e do ML para definir e gerir vários aspectos do ciclo de vida de um projeto, promovendo a consistência e a colaboração ao separar a configuração do código. As principais áreas de aplicação incluem:

Configuração do modelo: Define a arquitetura das redes neuronais (NN), incluindo camadas, funções de ativação como ReLU ou SiLU e ligações. Frameworks como PyTorch e TensorFlow usam frequentemente o YAML para configurar modelos. Por exemplo, Ultralytics YOLO do Ultralytics, como o YOLOv8 e YOLO11utilizam ficheiros YAML para especificar a estrutura do modelo, incluindo a espinha dorsal e a cabeça de deteção.
Definição do conjunto de dados: Especifica caminhos para dados de treino, dados de validação, nomes de classes e outros parâmetros específicos do conjunto de dados. Isto é comum para tarefas como a deteção de objectos utilizando conjuntos de dados como COCO ou VOC. Ultralytics utiliza extensivamente ficheiros YAML para definir conjuntos de dados.
Configuração do pipeline de treinamento: Especifica os hiperparâmetros e as definições para o processo de formação de modelos. Isto inclui parâmetros como tamanhos dos lotes, taxas de aprendizagem, número de épocas, algoritmos de otimização (por exemplo, Adão), e aumento de dados estratégias. Exemplo: Um ficheiro YAML pode especificar epochs: 100, batch_size: 16, learning_rate: 0.001e técnicas de aumento de listas, como inversões ou rotações aleatórias. Isto permite aos investigadores e engenheiros acompanhar e modificar facilmente as experiências de formação.
Pipelines de MLOps: Define fluxos de trabalho em plataformas de operações de aprendizagem automática (MLOps). Ferramentas como Kubeflow Pipelines e MLflow Projects utilizam YAML para descrever a sequência de passos num pipeline de ML, desde o pré-processamento de dados até à implementação e monitorização de modelos.
Configuração de implantação: Especifica as definições para a implantação de modelos, tais como requisitos de recursos (por exemplo CPU/GPU alocação), parâmetros de dimensionamento e variáveis de ambiente, geralmente usados em conjunto com tecnologias de conteinerização como o Docker. Exemplifica: Um YAML de implantação para um cluster Kubernetes pode definir o número de réplicas para um ponto de extremidade de atendimento de modelo, limites de memória e a imagem do Docker a ser usada. Consulte o Ultralytics Docker Quickstart para ver as configurações relacionadas.

YAML vs. Outros formatos

Embora o YAML sirva para fins semelhantes a outros formatos de serialização de dados, tem caraterísticas distintas:

YAML vs. JSON (JavaScript Object Notation): Ambos são legíveis por humanos e suportam estruturas de dados semelhantes. O JSON é mais rigoroso, exigindo aspas à volta das cadeias de caracteres e utilizando chaves {} e parênteses []. O YAML é frequentemente considerado mais legível para configurações complexas devido à sua utilização de indentação e sintaxe mínima. No entanto, o JSON é mais amplamente utilizado para APIs da Web. Podes encontrar mais detalhes em JSON.org.
YAML vs. XML (Extensible Markup Language): XML é uma linguagem de marcação definida pelo W3C que utiliza etiquetas (<tag>...</tag>) para definir elementos. É mais detalhado do que YAML e JSON. Embora seja poderoso para a estruturação e validação de documentos (por exemplo, em anotação de dados), o XML é geralmente menos preferido para ficheiros de configuração onde a legibilidade é primordial em comparação com o estilo mais limpo do YAML.

O foco do YAML na legibilidade humana torna-o uma excelente escolha para ficheiros de configuração em projectos de IA/ML, simplificando a gestão e melhorando a colaboração, especialmente em plataformas como o Ultralytics HUB, que simplificam o ciclo de vida do ML.

YAML

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Principais caraterísticas do YAML

YAML em aplicações de IA e ML

YAML vs. Outros formatos

Lê mais blogues

Junta-te à comunidade Ultralytics

YAML

Treina os modelos YOLO simplesmentecom Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Principais caraterísticas do YAML

YAML em aplicações de IA e ML

YAML vs. Outros formatos

Lê mais blogues

Junta-te à comunidade Ultralytics

Treina os modelos YOLO simplesmente
com Ultralytics HUB