Glossário

Kubernetes

Descobre como o Kubernetes simplifica as cargas de trabalho de IA/ML com implementação de modelos escaláveis, formação distribuída e gestão eficiente de recursos.

O Kubernetes, frequentemente abreviado como K8s, é uma plataforma de código aberto concebida para automatizar a implementação, o dimensionamento e a gestão de aplicações em contentores. Originalmente desenvolvida pela Google e agora mantido pela Cloud Native Computing Foundation (CNCF), o Kubernetes fornece uma estrutura robusta para executar sistemas distribuídos de forma resiliente. Para aqueles que trabalham com Inteligência Artificial (IA) e Aprendizado de Máquina (ML), o Kubernetes oferece ferramentas poderosas para gerenciar o complexo ciclo de vida dos modelos, desde o treinamento até a implantação e inferência. Ajuda a colmatar a lacuna entre o desenvolvimento de modelos de ML e a sua execução fiável em ambientes de produção.

Conceitos fundamentais simplificados

O Kubernetes orquestra contentores, que são pacotes leves e autónomos que contêm software e as suas dependências. Os principais conceitos incluem:

Pods: As menores unidades implantáveis no Kubernetes, normalmente contendo um ou mais contêineres que compartilham recursos e rede. Pensa num Pod como um invólucro em torno da tua aplicação de ML ou do contentor do servidor de inferência.
Nós: Máquinas de trabalho (virtuais ou físicas) onde os Pods são executados. O Kubernetes gerencia a distribuição de Pods pelos nós disponíveis.
Serviços: Uma abstração que define um conjunto lógico de Pods e uma política para lhes aceder, fornecendo frequentemente um endereço IP estável ou um nome DNS para Pods dinâmicos. Essencial para expor pontos finais de inferência de ML.
Implantações: Descreve o estado desejado para a tua aplicação, gerindo ReplicaSets (grupos de Pods idênticos) para garantir a disponibilidade e lidar com actualizações. Útil para lançar novas versões de modelos sem tempo de inatividade.

A compreensão destes blocos de construção ajuda a conceber sistemas de ML escaláveis e resilientes.

Relevância na IA e na aprendizagem automática

O Kubernetes tornou-se uma pedra angular das operações modernas de aprendizagem automática (MLOps) devido a várias vantagens:

Escalabilidade: As tarefas de ML, como treinar modelos grandes ou atender a solicitações de inferência, geralmente têm demandas flutuantes de recursos. O Kubernetes pode escalar automaticamente o número de contentores (Pods) para cima ou para baixo com base na carga, garantindo uma utilização eficiente de recursos como as GPUs.
Gestão de recursos: Permite um controlo fino sobre CPU e a alocação de memória para containers, evitando a contenção de recursos e garantindo o desempenho, especialmente crítico ao gerenciar recursos caros GPU em vários experimentos ou serviços.
Portabilidade e consistência: O Kubernetes proporciona um ambiente consistente em diferentes infra-estruturas, quer se trate de servidores locais ou de várias plataformas de computação em nuvem, como o Amazon EKS, Google GKE ou o Azure AKS. Isto simplifica a transferência de fluxos de trabalho de ML entre desenvolvimento, teste e produção. Muitas vezes, podes começar com uma configuração do Docker e aumentar a escala com o Kubernetes.
Automação e orquestração: Automatiza tarefas complexas como a descoberta de serviços, o equilíbrio de carga, a auto-regeneração (reiniciar contentores com falhas) e a gestão da configuração, reduzindo as despesas manuais das equipas de ML.

Aplicações de IA/ML do mundo real

Treinamento de modelo distribuído: Treina grandes modelos de aprendizagem profunda (DL), tais como modelos complexos de Ultralytics YOLO do Ultralytics para deteção de objetos, geralmente requer um imenso poder computacional. O Kubernetes pode gerenciar um cluster de máquinas para treinamento distribuído usando estruturas como o Kubeflow ou integrações nativas com o PyTorch ou TensorFlow. Trata do agendamento de trabalhos de formação, da gestão do acesso aos dados e da atribuição eficiente de GPUs entre nós.
Serviços de inferência escaláveis: A implantação de modelos de ML como aqueles para inferência em tempo real requer alta disponibilidade e baixa latência. O Kubernetes pode hospedar servidores de inferência (por exemplo, usando o Servidor de InferênciaNVIDIA Triton , que se integra aos modelos Ultralytics - consulte o guiaTriton ) atrás de um balanceador de carga. Ele dimensiona automaticamente o número de pods do servidor de inferência com base no tráfego de entrada, garantindo a capacidade de resposta mesmo durante picos de carga para tarefas como classificação de imagens ou processamento de linguagem natural (PNL).

Kubernetes vs. tecnologias relacionadas

Kubernetes vs. Docker: O Docker é uma ferramenta para criar, enviar e executar contêineres individuais(conteinerização). O Kubernetes é um orquestrador para contêineres, gerenciando potencialmente milhares de contêineres em muitas máquinas. Trabalham em conjunto: normalmente, cria imagens de contentores com o Docker e, em seguida, implementa-as e gere-as com o Kubernetes. Consulta o guia de início rápido do Docker para saberes o básico sobre contentores.
Kubernetes vs. computação sem servidor: As plataformas sem servidor (como o AWS Lambda ou Google Cloud Functions) abstraem totalmente o gerenciamento do servidor, concentrando-se em funções orientadas a eventos. O Kubernetes fornece mais controle sobre a infraestrutura subjacente e é mais adequado para aplicativos de longa duração ou serviços complexos com estado, embora as estruturas sem servidor possam ser executadas no Kubernetes (por exemplo, Knative).

Ferramentas e ecossistema

O ecossistema Kubernetes inclui muitas ferramentas para simplificar a gestão:

Helm: Um gestor de pacotes para Kubernetes, que ajuda a definir, instalar e atualizar aplicações complexas.
Prometheus e Grafana: Ferramentas populares de código aberto para monitorizar clusters e aplicações Kubernetes.
Integrações de provedores de nuvem: Os serviços Kubernetes gerenciados (EKS, GKE, AKS) simplificam a configuração e a manutenção do cluster.
Plataformas de ML: Ferramentas como o Kubeflow baseiam-se no Kubernetes para fornecer fluxos de trabalho específicos de ML. Plataformas como o Ultralytics HUB visam simplificar o pipeline de implantação, às vezes abstraindo as complexidades do Kubernetes para facilitar a implantação do modelo.

O Kubernetes fornece uma base poderosa para criar, implantar e gerenciar aplicativos de IA/ML escalonáveis e confiáveis em diversos ambientes, tornando-o uma habilidade crucial no cenário de MLOps.

Kubernetes

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Conceitos fundamentais simplificados

Relevância na IA e na aprendizagem automática

Aplicações de IA/ML do mundo real

Kubernetes vs. tecnologias relacionadas

Ferramentas e ecossistema

Lê mais blogues

Junta-te à comunidade Ultralytics

Kubernetes

Treina os modelos YOLO simplesmentecom Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Conceitos fundamentais simplificados

Relevância na IA e na aprendizagem automática

Aplicações de IA/ML do mundo real

Kubernetes vs. tecnologias relacionadas

Ferramentas e ecossistema

Lê mais blogues

Junta-te à comunidade Ultralytics

Treina os modelos YOLO simplesmente
com Ultralytics HUB