Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

OpenAI o1: Một loạt mô hình OpenAI mới cho lý luận AI

Tìm hiểu về các mô hình OpenAI o1 mới ra mắt và điều gì làm cho chúng trở nên đặc biệt. Chúng ta cũng sẽ xem xét cách chúng hoạt động và tác động của chúng đến tương lai của AI.

Cộng đồng AI đang xôn xao suy đoán về bước tiếp theo cho các mô hình GPT của OpenAI , nhiều người gọi đó là "Dự án Strawberry". Lý do đằng sau điều này là nếu bạn nhắc GPT-4o bằng cách hỏi có bao nhiêu chữ R trong từ "strawberry", nó sẽ cho bạn biết có hai chữ R trong từ " berries ". Điều này có vẻ lạ, xét đến sức mạnh của GPT-4o. Tuy nhiên, mô hình được xây dựng để xử lý văn bản ẩn, không phải các từ chính xác. Có tin đồn rằng mô hình tiếp theo sẽ hướng đến mục tiêu giải quyết vấn đề này. Sam Altman tiếp tục thổi bùng những tin đồn này bằng cách đăng tải hình ảnh dâu tây trên tài khoản X (trước đây gọi là Twitter) của mình.

Với thông báo mới nhất của OpenAI vào thứ năm, ngày 12 tháng 9, cuối cùng chúng ta cũng có câu trả lời cho suy đoán này! OpenAI o1, một loạt mô hình AI mới được thiết kế để làm chậm và suy nghĩ trước khi phản hồi, đã được phát hành. Thật thú vị, OpenAI o1 có thể lý luận tốt hơn và trả lời câu hỏi về dâu tây một cách chính xác! Trong bài viết này, chúng ta sẽ thảo luận về OpenAI o1 là gì, nó hoạt động như thế nào, nó có thể được sử dụng ở đâu và nó có ý nghĩa gì đối với tương lai của AI. Hãy bắt đầu thôi!

Hình 1. Ví dụ về việc nhắc nhở OpenAI o1 về dâu tây.

Những tiến bộ mới trong AI của OpenAI

Vào tháng 7 năm 2024, các giám đốc điều hành của OpenAI đã chia sẻ rằng nghiên cứu của OpenAI đang tiến gần đến cấp độ giải quyết vấn đề của con người, được gọi là cấp độ 2 của AI . Rõ ràng là cấp độ này tập trung vào lý luận, vì OpenAI giới thiệu loạt mô hình mới của mình, OpenAI o1, như suy nghĩ trước khi trả lời. OpenAI o1 là LLM (mô hình ngôn ngữ lớn) mới, một mô hình AI hiểu và tạo ra văn bản giống con người bằng cách học các mẫu từ lượng lớn dữ liệu ngôn ngữ. Nó được thiết kế để xử lý các vấn đề phức tạp đòi hỏi lý luận sâu sắc. 

Hình 2. Quan điểm của OpenAI về các giai đoạn của AI.

Mô hình đã được đào tạo bằng cách sử dụng học tăng cường , một kỹ thuật mà mô hình học cách đưa ra quyết định tốt hơn thông qua thử nghiệm và sai sót bằng cách nhận được phần thưởng hoặc hình phạt cho hành động của mình. Thuật toán học tăng cường giúp mô hình suy nghĩ hiệu quả hơn bằng cách tuân theo một chuỗi suy nghĩ. OpenAI cũng chia sẻ rằng hiệu suất của o1 tiếp tục được cải thiện với nhiều học tăng cường hơn trong quá trình đào tạo và với nhiều thời gian hơn dành cho "suy nghĩ" trong quá trình giải quyết vấn đề, cho thấy cả đào tạo mở rộng và xử lý chu đáo đều giúp tăng cường khả năng của mô hình.

Mặc dù OpenAI o1 là một tiến bộ đáng kể cho lý luận phức tạp, nhưng nó vẫn là một mô hình ban đầu và thiếu một số tính năng tạo nên ChatGPT hữu ích, chẳng hạn như duyệt web hoặc tải lên tệp và hình ảnh. Đối với nhiều tác vụ thông thường, GPT-4o vẫn có thể có khả năng hơn vào lúc này. Tuy nhiên, OpenAI o1 đánh dấu bước tiến lớn về khả năng xử lý lý luận phức tạp của AI, đó là lý do tại sao OpenAI đang bắt đầu một loạt bài mới và gọi là OpenAI o1.

Các mô hình OpenAI mới cải thiện khả năng suy luận của AI như thế nào

OpenAI o1 có thể được sử dụng cho các nhiệm vụ như giải mã mật mã, giải quyết các thách thức lập trình, trả lời các bài toán, giải ô chữ và thậm chí xử lý các chủ đề phức tạp trong khoa học , an toànchăm sóc sức khỏe . Để thể hiện sự thú vị về tên mã của dự án, OpenAI đã cho thấy kỹ năng suy luận của mô hình bằng cách giải mã một mật mã tiết lộ thông điệp "CÓ BA CHỮ R TRONG DÂU TÂY". 

Ngoài việc giải mã, OpenAI o1 còn có kỹ năng về mã hóa. Nó hoạt động tốt trong các thử thách lập trình cạnh tranh như trên Codeforces, một nền tảng nơi các lập trình viên giải quyết các vấn đề mã hóa phức tạp trong điều kiện giới hạn thời gian. Trong các thử thách này, mô hình đạt được xếp hạng Elo cao (một hệ thống tính điểm đo lường mức độ kỹ năng dựa trên hiệu suất so với các đối thủ khác) và vượt trội hơn các mô hình trước đó. Nó cũng xuất sắc về toán học và hoạt động tốt trong các kỳ thi như Kỳ thi Toán học mời của Hoa Kỳ (AIME). 

Hình 3. So sánh khả năng mã hóa của o1.

Những tiến bộ này định vị OpenAI o1 là một bản nâng cấp đáng kể từ các mô hình trước đó như GPT-4o. Nó mở ra những khả năng mới cho AI trong các lĩnh vực như kinh doanh , phát triển, nghiên cứuchăm sóc sức khỏe . Ví dụ, trong nghiên cứu di truyền , OpenAI o1 có thể nhanh chóng xem qua một số lượng lớn các bài báo nghiên cứu, chọn ra những phát hiện và kết nối quan trọng giữa các dấu hiệu di truyền và bệnh tật . Nó hiểu ngôn ngữ khoa học phức tạp và có thể tóm tắt các điểm quan trọng, giúp các nhà nghiên cứu tập trung vào thông tin có liên quan nhất. 

Nhìn kỹ hơn vào Chuỗi suy nghĩ

Chúng ta đã thấy trước đó rằng OpenAI o1 giới thiệu một quy trình lý luận "Chuỗi suy nghĩ". Nó cho phép mô hình giải quyết các vấn đề phức tạp theo cách tương tự như các chiến lược nhận thức của con người. Mô hình có thể chia nhỏ các thách thức thành các bước nhỏ hơn, dễ quản lý và tinh chỉnh phương pháp tiếp cận của mình theo từng bước. Không giống như các mô hình trước đó dựa trên nhận dạng mẫu ngay lập tức, o1 tối ưu hóa quá trình ra quyết định của mình bằng cách khám phá nhiều con đường lý luận, học hỏi từ cả thành công và sai lầm thông qua học tăng cường.

OpenAI đã quyết định giữ những chuỗi suy nghĩ thô sơ này ẩn khỏi người dùng, thay vào đó cung cấp các bản tóm tắt cung cấp thông tin chi tiết về lý luận của mô hình mà không tiết lộ từng bước. Quyết định này giúp ngăn chặn việc sử dụng sai quy trình suy nghĩ của mô hình trong khi vẫn cho phép các nhà phát triển theo dõi và tinh chỉnh tính an toàn và sự liên kết của AI. Bằng cách quan sát các chuỗi ẩn bên trong, các nhà phát triển có thể đảm bảo rằng o1 tuân thủ các nguyên tắc đạo đức và tránh hành vi có hại.

Đánh giá chuẩn OpenAI o1

OpenAI o1 cho thấy những cải tiến lớn so với GPT-4o trong một số chuẩn mực kiểm tra khả năng lý luận và giải quyết vấn đề. Trong Kỳ thi Toán học mời của Mỹ (AIME) năm 2024, một kỳ thi toán đầy thử thách dành cho học sinh trung học hàng đầu, o1 đạt tỷ lệ chính xác 74% chỉ với một mẫu cho mỗi bài toán, so với 12% của GPT-4o. Với sự đồng thuận trên 64 mẫu, độ chính xác của nó tăng lên 83% và bằng cách sử dụng phương pháp xếp hạng lại tinh chỉnh với 1.000 mẫu, nó đạt 93%, đưa nó vào top 500 học sinh trên toàn quốc. 

Ngoài toán học, o1 cũng đạt kết quả cực kỳ tốt trong các chuẩn mực kiểm tra kiến thức khoa học, như GPQA Diamond, bao gồm các câu hỏi cấp độ tiến sĩ về hóa học, vật lýsinh học . Đáng chú ý, o1 đã vượt trội hơn các chuyên gia con người có bằng tiến sĩ trong bài kiểm tra này, khiến nó trở thành mô hình AI đầu tiên làm được như vậy. Nó cũng vượt qua GPT-4o ở 54 trong số 57 hạng mục trong chuẩn mực MMLU, kiểm tra sự hiểu biết trên nhiều môn học khác nhau, bao gồm lịch sử , luật và khoa học.

Hình 4. Đánh giá chuẩn OpenAI o1.

Thực hành với OpenAI o1

OpenAI đã giới thiệu hai mô hình AI mới trong loạt o1: o1-preview và o1-mini. Mô hình o1-preview được thiết kế để suy nghĩ sâu sắc hơn trước khi phản hồi, vượt trội trong các nhiệm vụ lý luận phức tạp trong khoa học, mã hóa và toán học. Nó cung cấp khả năng giải quyết vấn đề nâng cao cho người dùng giải quyết các dự án đầy thách thức. Ngược lại, o1-mini là một mô hình nhỏ hơn, nhanh hơn và tiết kiệm chi phí hơn được tối ưu hóa dành riêng cho lý luận STEM, đặc biệt là toán học và mã hóa. Mặc dù có thể có ít kiến thức rộng hơn về thế giới, nhưng o1-mini gần như ngang bằng với hiệu suất của o1-preview trong các đánh giá chính như cuộc thi toán AIME và các thử thách mã hóa Codeforces, tất cả đều có chi phí thấp hơn 80%.

Hình 5. So sánh các mô hình OpenAI.

Bạn có thể thử nghiệm các mô hình này thông qua nhiều nền tảng OpenAI khác nhau. ChatGPT Người dùng Plus và Team có thể truy cập cả o1-preview và o1-mini thông qua trình chọn mô hình, trải nghiệm khả năng suy luận nâng cao trực tiếp trong ChatGPT . Các nhà phát triển có quyền truy cập cấp độ 5 sử dụng API có thể bắt đầu tạo nguyên mẫu với các mô hình này, mặc dù một số tính năng nâng cao vẫn đang được phát triển. OpenAI cũng có kế hoạch cung cấp o1-mini cho tất cả ChatGPT Sẽ sớm có người dùng miễn phí. Bằng cách khám phá các mô hình này, bạn có thể trực tiếp trải nghiệm những tiến bộ trong lý luận AI và chọn mô hình phù hợp nhất với nhu cầu của mình.

Những cân nhắc về AI có đạo đức được OpenAI đưa ra

OpenAI đã tập trung vào đạo đức và an toàn trong khi phát triển loạt mô hình o1. Trước khi phát hành các mô hình o1-preview và o1-mini, họ đã tiến hành đánh giá kỹ lưỡng, bao gồm các thử nghiệm bên ngoài và kiểm tra nội bộ để tìm các rủi ro như nội dung không được phép, ảo giác và thiên vị. Các mô hình được thiết kế với khả năng lý luận nâng cao để hiểu rõ hơn và tuân thủ các quy tắc an toàn. 

OpenAI cũng đã triển khai các biện pháp bảo vệ như danh sách chặn và phân loại an toàn để quản lý rủi ro. Mô hình o1 có xếp hạng rủi ro tổng thể trung bình. Mô hình này có rủi ro thấp trong các lĩnh vực như an ninh mạng và tính tự chủ của mô hình và rủi ro trung bình trong các lĩnh vực như nội dung và tính thuyết phục CBRN (Hóa học, Sinh học, Phóng xạ và Hạt nhân). Nhóm cố vấn an toàn và Hội đồng quản trị của OpenAI đã xem xét các biện pháp an toàn này để đảm bảo mô hình an toàn và có đạo đức khi sử dụng.

Hình 6. Bảng điểm OpenAI o1.

Từ tin đồn đến thực tế: OpenAI o1 bước lên sân khấu

OpenAI o1 là một bước tiến lớn trong lý luận AI, biến một số tin đồn ban đầu thành hiện thực. Không giống như GPT-4o, loạt o1 suy nghĩ sâu sắc hơn bằng cách sử dụng phương pháp "Chuỗi suy nghĩ", chia nhỏ các vấn đề phức tạp thành các bước nhỏ hơn để có phản hồi tốt hơn. Hiện có sẵn dưới dạng bản xem trước sớm trong ChatGPT và API, OpenAI có kế hoạch bổ sung các tính năng như duyệt web và tải tệp và hình ảnh. OpenAI cũng chia sẻ rằng họ có kế hoạch tiếp tục phát triển và phát hành các mô hình trong loạt GPT, cùng với loạt OpenAI o1 mới. Khi AI tiếp tục phát triển, những tiến bộ như thế này đang mở đường cho các hệ thống AI mạnh mẽ hơn, trực quan hơn và linh hoạt hơn có thể hỗ trợ và hiểu nhu cầu của con người tốt hơn.

Hãy theo dõi những thông tin mới nhất về AI bằng cách tham gia cộng đồng của chúng tôi ! Truy cập kho lưu trữ GitHub của chúng tôi để xem cách chúng tôi tiên phong trong các giải pháp AI trong các lĩnh vực như sản xuấtchăm sóc sức khỏe . 🚀

Logo FacebookBiểu trưng TwitterBiểu trưng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning