top of page
搜尋

OpenAI 推出 o1 預覽版:提升 AI 推理能力的新模型

Chatgpt
(圖片來源: OpenAI)

OpenAI 宣布推出全新 o1 系列 AI 模型,專門用於更深入的推理過程,幫助解決科學、數學和編程等領域的複雜問題。這些模型已經在 ChatGPT 和 API 中提供,並將持續進行更新和改進。


推理模型的工作原理

這些新模型的訓練目標是模擬人類的思考過程,讓 AI 在回答問題前花更多時間進行思考,從而改進其推理能力。在訓練過程中,模型學會了優化其思維策略,嘗試不同的方法,並識別自身錯誤。


在我們的測試中,新一代模型在物理、化學和生物學等領域的挑戰性基準測試中表現出色,其表現與博士生相當。特別是在數學和編程領域,新模型的表現尤為優秀。例如,在國際數學奧林匹克預選賽中,GPT-4o 僅解答了 13% 的問題,而 o1 系列推理模型成功解答了 83% 的問題。此外,這些模型在 Codeforces 編程競賽中的表現達到了 89 百分位。


安全性提升

為了確保這些新模型在推理過程中的安全性,OpenAI 開發了一種新的安全訓練方法,利用模型的推理能力來更好地遵守安全和對齊準則。在我們的安全測試中,o1 預覽版模型在防止「越獄」測試中的表現大幅超越了 GPT-4o。


為了進一步提升模型的安全性,我們加強了內部治理,並與聯邦政府合作進行深入測試。我們與美國和英國的 AI 安全研究機構達成了正式協議,允許他們提前訪問研究版的 o1 模型,這是確保未來模型在公開發佈前後進行研究、評估和測試的重要步驟。


誰適合使用 o1 模型?

這些強化推理能力的模型特別適合需要解決複雜問題的專業領域,如科學、編程、數學等。例如,o1 模型可以幫助醫療研究人員註釋細胞排序數據,幫助物理學家生成量子光學所需的數學公式,或幫助各領域的開發人員構建和執行多步驟的工作流。


推出 OpenAI o1-mini

為了滿足開發人員對更高效編程的需求,我們還推出了 OpenAI o1-mini,這是一個速度更快、成本更低的推理模型,專門用於生成和調試複雜的代碼。o1-mini 的運行成本比 o1 預覽版低 80%,是應用於需要推理但不需廣泛世界知識場景中的高效選擇。


如何使用 OpenAI o1

ChatGPT Plus 和 Team 用戶今天即可在 ChatGPT 中手動選擇 o1 預覽版和 o1-mini 模型。起步階段,每周訊息數量限制為 30 條(o1-preview)和 50 條(o1-mini)。我們正在努力提升這些限制,並計劃讓 ChatGPT 自動選擇最適合的模型來回應提示。


ChatGPT 企業和 Edu 用戶將於下週獲得這兩個模型的使用權限。開發人員可以立即在 API 中使用這些模型,並且 API 的速率限制為 20 RPM。我們也正在測試提升這些限制,API 目前尚不支持函數調用、流式傳輸或系統消息等功能。


接下來的計劃

這是 o1 系列推理模型在 ChatGPT 和 API 中的早期預覽版。隨著模型的更新,我們預計將增加瀏覽功能、文件和圖片上傳等功能,使其對用戶更加有用。


此外,我們還計劃繼續開發和推出 GPT 系列的新模型,並同時推出更多 o1 系列的更新和改進。


0 次查看0 則留言

Comments


bottom of page