Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Bản cập nhật OpenAI mới nhất: Canvas, Vision Fine-Tuning và nhiều hơn nữa

Hãy tham gia cùng chúng tôi khi chúng tôi xem xét kỹ hơn những điều gần đây ChatGPT bản cập nhật do OpenAI phát hành. Chúng tôi sẽ khám phá Canvas, tinh chỉnh khả năng thị giác và tính năng Tìm kiếm mới nhất.

Sau lần cuối chúng tôi xem xét các mô hình o1 của OpenAI vào tháng 9 (được thiết kế để cải thiện khả năng suy luận), nhiều tính năng mới và thú vị đã được thêm vào ChatGPT . Một số bản phát hành này hướng đến các nhà phát triển và một số khác được thiết kế để tinh chỉnh trải nghiệm của người dùng. Nhìn chung, mỗi bản nâng cấp giúp tạo ra các tương tác với ChatGPT trực quan và hiệu quả hơn.

Các bản cập nhật như Canvas, được thiết kế để viết và mã hóa cộng tác, và tinh chỉnh khả năng thị giác giúp cải thiện cách ChatGPT làm việc với hình ảnh , đã khơi dậy rất nhiều sự quan tâm, khuyến khích người dùng khám phá nhiều khả năng sáng tạo hơn. Trong khi đó, các nâng cấp kỹ thuật, như API mới và báo cáo kiểm tra tính công bằng, giải quyết các khía cạnh như tích hợp mô hình và các hoạt động AI có đạo đức . Hãy cùng tìm hiểu sâu hơn về những ChatGPT tính năng từ OpenAI!

Tổng quan về tính năng Canvas của OpenAI

Canvas là bản cập nhật lớn đầu tiên ChatGPT Giao diện người dùng (UI) của 's kể từ khi phát hành. Đây là giao diện mới với bố cục hai màn hình, lời nhắc ở thanh bên trái và phản hồi ở cửa sổ bên phải. UI mới loại bỏ quy trình làm việc thông thường của cấu trúc một màn hình giống như trò chuyện và chuyển sang bố cục hai màn hình phù hợp với mục đích đa nhiệm để tăng năng suất.

Hình 1. Canvas mang đến các bản cập nhật giao diện người dùng ChatGPT .

Trước khi Canvas được giới thiệu, làm việc với các tài liệu dài trên ChatGPT có nghĩa là phải cuộn lên và xuống khá nhiều. Trong bố cục mới, các lời nhắc được hiển thị trên thanh bên trái và tài liệu văn bản hoặc đoạn chiếm phần lớn màn hình. Nếu cần, bạn thậm chí có thể tùy chỉnh kích thước của thanh bên trái và màn hình đầu ra. Ngoài ra, bạn có thể chọn một phần văn bản hoặc một phần mã và chỉnh sửa phần cụ thể mà không cần thay đổi toàn bộ tài liệu.

Hình 2. Chỉnh sửa các phần văn bản cụ thể bằng Canvas.

Nếu bạn sử dụng Canvas, bạn sẽ nhận thấy không có nút hoặc nút chuyển đổi cụ thể nào để mở nó trên ChatGPT giao diện. Thay vào đó, khi bạn làm việc với mô hình GPT-4o, Canvas sẽ tự động mở nếu phát hiện bạn đang chỉnh sửa , viết hoặc mã hóa . Đối với các lời nhắc đơn giản hơn, nó sẽ không hoạt động. Nếu bạn muốn mở thủ công, bạn có thể sử dụng các lời nhắc như "Mở Canvas" hoặc "Cho tôi bố cục Canvas".

Hiện tại, Canvas đang trong giai đoạn beta và chỉ khả dụng với GPT-4o. Tuy nhiên, OpenAI đã đề cập rằng Canvas sẽ khả dụng cho tất cả người dùng miễn phí khi hết giai đoạn beta.

ChatGPT Cập nhật API của 's

OpenAI đã phát hành ba sản phẩm mới ChatGPT Các bản cập nhật API nhằm mục đích cải thiện hiệu quả, khả năng mở rộng và tính linh hoạt. Chúng ta hãy xem xét kỹ hơn từng bản cập nhật này.

Mô hình chưng cất

Sử dụng tính năng Model Distillation thông qua API OpenAI, các nhà phát triển có thể sử dụng đầu ra của các mô hình tiên tiến như GPT-4o hoặc o1-preview để nâng cao hiệu suất của các mô hình nhỏ hơn, tiết kiệm chi phí như GPT-4o mini . Model distillation là một quá trình liên quan đến việc đào tạo các mô hình nhỏ hơn để bắt chước hành vi của các mô hình tiên tiến hơn, giúp chúng hiệu quả hơn cho các tác vụ cụ thể .

Trước khi tính năng này được giới thiệu, các nhà phát triển phải phối hợp thủ công nhiều tác vụ khác nhau bằng các công cụ khác nhau. Các tác vụ này bao gồm tạo tập dữ liệu , đo lường hiệu suất mô hìnhtinh chỉnh mô hình, thường khiến quy trình trở nên phức tạp và dễ xảy ra lỗi. Bản cập nhật Model Distillation cho phép các nhà phát triển sử dụng Stored Completions, một công cụ cho phép họ tự động tạo tập dữ liệu bằng cách thu thập và lưu trữ các cặp đầu vào-đầu ra do các mô hình nâng cao tạo ra thông qua API.

Một tính năng khác của Model Distillation, Evals (hiện đang trong giai đoạn beta), giúp đo lường mức độ hiệu quả của một mô hình đối với các tác vụ cụ thể, mà không cần phải tạo các tập lệnh đánh giá tùy chỉnh hoặc sử dụng các công cụ riêng biệt. Sử dụng các tập dữ liệu được tạo bằng Stored Completions và đánh giá hiệu suất bằng Evals, các nhà phát triển có thể tinh chỉnh các mô hình GPT tùy chỉnh của riêng họ.

Hình 3. Bạn có thể sử dụng Evals để đo hiệu suất của mô hình.

Bộ nhớ đệm nhắc nhở

Thông thường khi xây dựng các ứng dụng AI , đặc biệt là chatbot , cùng một ngữ cảnh (thông tin nền hoặc lịch sử hội thoại trước đó cần thiết để hiểu yêu cầu hiện tại) sẽ được sử dụng nhiều lần cho nhiều cuộc gọi API. Bộ nhớ đệm nhắc nhở giúp các nhà phát triển có thể sử dụng lại các mã thông báo đầu vào được sử dụng gần đây (các đoạn văn bản mà mô hình xử lý để hiểu lời nhắc và tạo phản hồi), giúp giảm chi phí và độ trễ.

Từ ngày 1 tháng 10, OpenAI đã tự động áp dụng Prompt Caching cho các mô hình của mình như GPT-4o, GPT-4o mini, o1-preview và o1-mini. Điều này có nghĩa là khi các nhà phát triển sử dụng API để tương tác với một mô hình có lời nhắc dài (hơn 1.024 mã thông báo), hệ thống sẽ lưu các phần đã xử lý. 

Theo cách này, nếu các lời nhắc giống nhau hoặc tương tự được sử dụng lại, nó có thể bỏ qua việc tính toán lại các phần đó. Hệ thống tự động lưu trữ phần dài nhất của lời nhắc mà nó đã gặp trước đó, bắt đầu với 1.024 mã thông báo và thêm vào các phần gồm 128 mã thông báo khi lời nhắc dài hơn.

API thời gian thực

Việc tạo trợ lý giọng nói thường liên quan đến việc cần chuyển âm thanh thành văn bản , xử lý văn bản, sau đó chuyển đổi lại thành âm thanh để phát phản hồi. API thời gian thực của OpenAI nhằm mục đích xử lý toàn bộ quá trình này bằng một yêu cầu API duy nhất. Bằng cách đơn giản hóa quá trình, API cho phép trò chuyện thời gian thực với AI. 

Ví dụ, trợ lý giọng nói tích hợp với Realtime API có thể thực hiện các hành động cụ thể, như đặt hàng hoặc tìm thông tin , dựa trên yêu cầu của người dùng. API giúp trợ lý giọng nói phản hồi nhanh hơn và có thể thích ứng nhanh với nhu cầu của người dùng. Realtime API đã có sẵn thông qua bản beta công khai vào ngày 1 tháng 10, với sáu giọng nói. Vào ngày 30 tháng 10, năm giọng nói nữa đã được thêm vào, nâng tổng số giọng nói khả dụng lên mười một.

Hình 4. Ví dụ về việc sử dụng API thời gian thực để thực hành hội thoại bằng ngôn ngữ mới.

Tinh chỉnh ChatGPT cho Nhiệm vụ Tầm nhìn

Ban đầu, mô hình ngôn ngữ thị giác GPT-4o chỉ có thể được tinh chỉnh và tùy chỉnh bằng cách sử dụng các tập dữ liệu chỉ có văn bản. Bây giờ, với việc phát hành API tinh chỉnh thị giác, các nhà phát triển có thể đào tạo và tùy chỉnh GPT-4o bằng cách sử dụng các tập dữ liệu hình ảnh. Kể từ khi phát hành, tinh chỉnh thị giác đã trở thành chủ đề chính được các nhà phát triển và kỹ sư thị giác máy tính quan tâm.

Để tinh chỉnh khả năng thị giác của GPT-4o, các nhà phát triển có thể sử dụng các tập dữ liệu hình ảnh có phạm vi từ ít nhất 100 hình ảnh đến nhiều nhất là 50.000 hình ảnh. Sau khi đảm bảo tập dữ liệu khớp với định dạng mà OpenAI yêu cầu, nó có thể được tải lên nền tảng Openai và mô hình có thể được tinh chỉnh cho các ứng dụng cụ thể. 

Ví dụ, Automat, một công ty tự động hóa, đã sử dụng một tập dữ liệu ảnh chụp màn hình để đào tạo GPT-4o có thể xác định các thành phần UI trên màn hình dựa trên mô tả. Điều này giúp hợp lý hóa Tự động hóa quy trình bằng robot (RPA) bằng cách giúp bot dễ dàng tương tác với giao diện người dùng hơn. Thay vì dựa vào tọa độ cố định hoặc các quy tắc chọn phức tạp, mô hình có thể xác định các thành phần UI dựa trên các mô tả đơn giản, giúp thiết lập tự động hóa dễ thích ứng hơn và dễ bảo trì hơn khi giao diện thay đổi.

Hình 5. Sử dụng phiên bản tinh chỉnh của mô hình GPT-4o để phát hiện các thành phần UI.

ChatGPT Phát hiện sự công bằng và thiên vị

Những lo ngại về đạo đức xung quanh các ứng dụng AI là chủ đề thảo luận nổi bật khi AI ngày càng tiên tiến hơn. Bởi vì ChatGPT Phản hồi của 's dựa trên lời nhắc do người dùng cung cấp và dữ liệu có sẵn trên Internet, có thể rất khó để tinh chỉnh ngôn ngữ của nó để có trách nhiệm mọi lúc. Các báo cáo nêu rằng câu trả lời của ChatGPT thiên vị về tên, giới tính và chủng tộc. Để giải quyết vấn đề này, nhóm nội bộ của OpenAI đã tiến hành một bài kiểm tra công bằng ở góc nhìn thứ nhất.

Tên thường mang theo những gợi ý tinh tế về văn hóa và các yếu tố địa lý của chúng ta . Trong hầu hết các trường hợp, ChatGPT sẽ bỏ qua những gợi ý tinh tế trong tên. Tuy nhiên, trong một số trường hợp, tên phản ánh chủng tộc hoặc văn hóa dẫn đến những phản ứng khác nhau từ ChatGPT , với khoảng 1% trong số này phản ánh ngôn ngữ có hại . Việc loại bỏ thành kiến và ngôn ngữ có hại là một nhiệm vụ đầy thách thức đối với một mô hình ngôn ngữ . Tuy nhiên, bằng cách chia sẻ những phát hiện này một cách công khai và thừa nhận những hạn chế của mô hình, OpenAI giúp người dùng tinh chỉnh lời nhắc của họ để đạt được câu trả lời trung lập và khách quan hơn. 

Hình 6. Một ví dụ về các phản hồi khác nhau tùy theo tên người dùng.

Hiểu biết ChatGPT Tìm kiếm

Khi ChatGPT lần đầu tiên được ra mắt, đã có những cuộc thảo luận trong cộng đồng AI về việc liệu nó có thể thay thế trình duyệt web truyền thống hay không. Hiện nay, nhiều người dùng đang sử dụng ChatGPT thay vì Google Search

Bản cập nhật mới của OpenAI, tính năng Tìm kiếm, đưa điều này tiến xa hơn một bước. Với Tìm kiếm, ChatGPT tạo ra các phản hồi cập nhật và bao gồm các liên kết đến các nguồn có liên quan. Tính đến ngày 31 tháng 10, tính năng Tìm kiếm có sẵn cho tất cả ChatGPT Người dùng Plus và Team, tạo ChatGPT hoạt động giống như một công cụ tìm kiếm được hỗ trợ bởi AI.

Hình 7. Một ví dụ về việc sử dụng ChatGPT Tính năng tìm kiếm mới của.

Con Đường Phía Trước

ChatGPT Các bản cập nhật gần đây của 'tập trung vào việc làm cho AI hữu ích hơn, linh hoạt hơn và công bằng hơn. Tính năng Canvas mới giúp người dùng làm việc hiệu quả hơn, trong khi tinh chỉnh tầm nhìn cho phép các nhà phát triển tùy chỉnh các mô hình để xử lý tốt hơn các tác vụ trực quan. Giải quyết vấn đề công bằng và giảm thiên vị cũng là những ưu tiên chính, đảm bảo AI hoạt động tốt cho mọi người, bất kể họ là ai. Cho dù bạn là nhà phát triển tinh chỉnh các mô hình hay chỉ sử dụng các tính năng mới nhất, ChatGPT đang phát triển để đáp ứng nhiều nhu cầu khác nhau. Với khả năng thời gian thực, tích hợp trực quan và tập trung vào việc sử dụng có trách nhiệm, những bản cập nhật này xây dựng trải nghiệm AI đáng tin cậy hơn cho mọi người.

Khám phá thêm về AI bằng cách truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Tìm hiểu thêm về các ứng dụng AI trong xe tự láichăm sóc sức khỏe .

Logo FacebookBiểu trưng TwitterBiểu trưng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning