Descobre os modelos OpenAI o1 recentemente lançados e o que os torna especiais. Veremos também como funcionam e qual o seu impacto no futuro da IA.
A comunidade de IA tem estado a fervilhar com especulações sobre o próximo passo para os modelos GPT da OpenAI, com muitos a referirem-se a ele como "Projeto Morango". A razão por detrás disto é que se perguntares ao GPT-4o quantos R's há na palavra "morango", ele dir-te-á que há dois R's na palavra"morango". Pode parecer estranho, considerando o quão poderoso é o GPT-4o. No entanto, o modelo foi concebido para processar o subtexto, não as palavras exactas. Há rumores de que o próximo modelo terá como objetivo resolver este problema. Sam Altman alimentou ainda mais estes rumores ao publicar fotografias de morangos na sua conta X (anteriormente conhecida como Twitter).
Com o último anúncio da OpenAI na quinta-feira, 12 de setembro, temos finalmente uma resposta à especulação! O OpenAI o1, uma nova série de modelos de IA concebidos para abrandar e pensar antes de responder, foi lançado. Curiosamente, o OpenAI o1 consegue raciocinar melhor e responder corretamente à pergunta sobre morangos! Neste artigo, vamos discutir o que é o OpenAI o1, como funciona, onde pode ser utilizado e o que significa para o futuro da IA. Toca a começar!
Em julho de 2024, os executivos da OpenAI partilharam que a investigação da OpenAI está a aproximar-se de um nível humano de resolução de problemas, referido como nível 2 da IA. É evidente que este nível se centra no raciocínio, uma vez que a OpenAI apresenta a sua nova série de modelos, o OpenAI o1, como um modelo que pensa antes de responder. O OpenAI o1 é um novo LLM (large language model), um modelo de IA que compreende e gera texto semelhante ao humano, aprendendo padrões a partir de grandes quantidades de dados linguísticos. Foi concebido para lidar com problemas complexos que exigem um raciocínio aprofundado.
O modelo foi treinado utilizando a aprendizagem por reforço, uma técnica em que o modelo aprende a tomar melhores decisões através de tentativa e erro, recebendo recompensas ou penalizações pelas suas acções. O algoritmo de aprendizagem por reforço ajuda o modelo a pensar de forma mais eficaz, seguindo uma cadeia de pensamento. A OpenAI também partilhou que o desempenho do o1 continua a melhorar com mais aprendizagem por reforço durante o treino e com mais tempo passado a "pensar" durante a resolução de problemas, mostrando que tanto o treino prolongado como o processamento cuidadoso ajudam a aumentar as capacidades do modelo.
Embora o OpenAI o1 seja um avanço significativo para o raciocínio complexo, ainda é um modelo inicial e carece de algumas caraterísticas que tornam o ChatGPT útil, como navegar na Web ou carregar ficheiros e imagens. Para muitas tarefas comuns, o GPT-4o pode ainda ser mais capaz por enquanto. No entanto, o OpenAI o1 representa um grande passo em frente na capacidade da IA para lidar com raciocínios complexos, razão pela qual a OpenAI está a iniciar uma nova série e a chamar-lhe OpenAI o1.
O OpenAI o1 pode ser utilizado para tarefas como descodificar cifras, resolver desafios de programação, responder a problemas de matemática, resolver palavras cruzadas e até lidar com tópicos complexos em ciência, segurança e cuidados de saúde. Numa divertida alusão ao nome de código do projeto, o OpenAI mostrou as capacidades de raciocínio do modelo ao decifrar uma cifra que revelava a mensagem "HÁ TRÊS R'S EM MORANGO".
Para além de resolver cifras, o OpenAI o1 também é hábil na codificação. Tem um bom desempenho em desafios competitivos de programação como os do Codeforces, uma plataforma onde os programadores resolvem problemas complexos de codificação em condições de tempo. Nestes desafios, o modelo atinge elevadas classificações Elo (um sistema de pontuação que mede os níveis de competência com base no desempenho em relação a outros concorrentes) e supera os modelos anteriores. Também se destaca em matemática e tem um bom desempenho em exames como o American Invitational Mathematics Examination (AIME).
Estes avanços posicionam o OpenAI o1 como uma atualização significativa em relação a modelos anteriores como o GPT-4o. Abre novas possibilidades para a IA em áreas como o negócio, o desenvolvimento, a investigação e os cuidados de saúde. Por exemplo, na investigação genética, o OpenAI o1 pode analisar rapidamente um grande número de artigos de investigação, selecionando as principais conclusões e ligações entre marcadores genéticos e doenças. Compreende a linguagem científica complexa e pode resumir pontos importantes, ajudando os investigadores a concentrarem-se nas informações mais relevantes.
Vimos anteriormente que o OpenAI o1 introduz um processo de raciocínio de "Cadeia de Pensamento". Permite que o modelo resolva problemas complexos de uma forma semelhante às estratégias cognitivas humanas. O modelo pode dividir os desafios em passos mais pequenos e geríveis e refinar iterativamente a sua abordagem. Ao contrário dos modelos anteriores que se baseavam no reconhecimento imediato de padrões, o o1 optimiza a sua tomada de decisões explorando múltiplos caminhos de raciocínio, aprendendo com os sucessos e os erros através da aprendizagem por reforço.
A OpenAI decidiu manter estas cadeias de pensamento em bruto escondidas dos utilizadores, oferecendo em vez disso resumos que fornecem uma visão do raciocínio do modelo sem expor cada passo. Esta decisão ajuda a evitar o uso indevido do processo de pensamento do modelo, ao mesmo tempo que permite aos programadores monitorizar e aperfeiçoar a segurança e o alinhamento da IA. Ao observar as cadeias ocultas internamente, os programadores podem garantir que o o1 adere às diretrizes éticas e evita comportamentos prejudiciais.
O OpenAI o1 mostra grandes melhorias em relação ao GPT-4o em vários testes que testam o raciocínio e a capacidade de resolução de problemas. No American Invitational Mathematics Examination (AIME) 2024, um exame de matemática desafiante para os melhores alunos do ensino secundário, o o1 alcançou uma taxa de precisão de 74% com apenas uma amostra por problema, em comparação com os 12% do GPT-4o. Com o consenso de 64 amostras, a sua precisão aumentou para 83% e, utilizando um método refinado de reclassificação com 1.000 amostras, atingiu 93%, colocando-o entre os 500 melhores alunos a nível nacional.
Para além da matemática, o o1 também teve um desempenho excecional em testes de conhecimentos científicos, como o GPQA Diamond, que abrange questões de nível de doutoramento em química, física e biologia. De forma notável, o o1 superou os especialistas humanos com doutoramento neste teste, tornando-se o primeiro modelo de IA a fazê-lo. Também superou o GPT-4o em 54 das 57 categorias do teste de referência MMLU, que testa a compreensão de um conjunto diversificado de assuntos, incluindo história, direito e ciência.
A OpenAI introduziu dois novos modelos de IA na série o1: o1-preview e o1-mini. O modelo o1-preview foi concebido para pensar mais profundamente antes de responder, destacando-se em tarefas de raciocínio complexas em ciência, codificação e matemática. Oferece capacidades avançadas de resolução de problemas para os utilizadores que enfrentam projectos desafiantes. Por outro lado, o o1-mini é um modelo mais pequeno, mais rápido e mais económico, optimizado especificamente para o raciocínio STEM, em particular matemática e programação. Embora possa ter um conhecimento menos amplo do mundo, o o1-mini quase iguala o desempenho do o1-preview nas principais avaliações, como a competição de matemática AIME e os desafios de codificação Codeforces, tudo a um custo 80% menor.
Podes experimentar estes modelos através de várias plataformas OpenAI. ChatGPT Os utilizadores Plus e Team podem aceder ao o1-preview e ao o1-mini através do seletor de modelos, experimentando capacidades de raciocínio melhoradas diretamente em ChatGPT. Os programadores com acesso ao nível 5 de utilização da API podem começar a criar protótipos com estes modelos, embora algumas funcionalidades avançadas ainda estejam em desenvolvimento. A OpenAI também planeia disponibilizar o o1-mini a todos os utilizadores do ChatGPT Free em breve. Ao explorar estes modelos, podes experimentar em primeira mão os avanços no raciocínio da IA e escolher o que melhor se adapta às tuas necessidades.
A OpenAI concentrou-se na ética e na segurança ao desenvolver a série de modelos o1. Antes de lançarem os modelos o1-preview e o1-mini, realizaram avaliações exaustivas, incluindo testes externos e verificações internas de riscos como conteúdos não permitidos, alucinações e preconceitos. Os modelos foram concebidos com capacidades de raciocínio avançadas para melhor compreender e seguir as regras de segurança.
A OpenAI também implementou salvaguardas como listas de bloqueio e classificadores de segurança para gerir os riscos. O modelo o1 tem uma classificação de risco global média. Apresenta riscos baixos em áreas como a cibersegurança e a autonomia do modelo e riscos médios em áreas como o conteúdo CBRN (Químico, Biológico, Radiológico e Nuclear) e a persuasão. O Grupo Consultivo de Segurança e o Conselho de Administração da OpenAI analisaram estas medidas de segurança para garantir que o modelo é seguro e ético de utilizar.
O OpenAI o1 é um grande passo em frente no raciocínio da IA, transformando alguns dos primeiros rumores em realidade. Ao contrário do GPT-4o, a série o1 pensa mais profundamente utilizando uma abordagem de "Cadeia de Pensamento", dividindo problemas complexos em passos mais pequenos para obter melhores respostas. Atualmente disponível como uma pré-visualização em ChatGPT e na API, a OpenAI planeia adicionar funcionalidades como a navegação na Web e o carregamento de ficheiros e imagens. A OpenAI também partilhou que planeia continuar a desenvolver e a lançar modelos da série GPT, juntamente com a nova série OpenAI o1. À medida que a IA continua a evoluir, avanços como estes estão a preparar o caminho para sistemas de IA mais poderosos, intuitivos e versáteis que podem ajudar e compreender melhor as necessidades humanas.
Mantém-te a par das últimas novidades em IA juntando-te à nossa comunidade! Vai ao nosso repositório GitHub para veres como estamos a ser pioneiros em soluções de IA em sectores como o fabrico e os cuidados de saúde. 🚀
Começa a tua viagem com o futuro da aprendizagem automática