搜尋

OpenAI 推出 o1 預覽版：提升 AI 推理能力的新模型

2024年9月18日
讀畢需時 3 分鐘

OpenAI 宣布推出全新 o1 系列 AI 模型，專門用於更深入的推理過程，幫助解決科學、數學和編程等領域的複雜問題。這些模型已經在 ChatGPT 和 API 中提供，並將持續進行更新和改進。

推理模型的工作原理

這些新模型的訓練目標是模擬人類的思考過程，讓 AI 在回答問題前花更多時間進行思考，從而改進其推理能力。在訓練過程中，模型學會了優化其思維策略，嘗試不同的方法，並識別自身錯誤。

在我們的測試中，新一代模型在物理、化學和生物學等領域的挑戰性基準測試中表現出色，其表現與博士生相當。特別是在數學和編程領域，新模型的表現尤為優秀。例如，在國際數學奧林匹克預選賽中，GPT-4o 僅解答了 13% 的問題，而 o1 系列推理模型成功解答了 83% 的問題。此外，這些模型在 Codeforces 編程競賽中的表現達到了 89 百分位。

安全性提升

為了確保這些新模型在推理過程中的安全性，OpenAI 開發了一種新的安全訓練方法，利用模型的推理能力來更好地遵守安全和對齊準則。在我們的安全測試中，o1 預覽版模型在防止「越獄」測試中的表現大幅超越了 GPT-4o。

為了進一步提升模型的安全性，我們加強了內部治理，並與聯邦政府合作進行深入測試。我們與美國和英國的 AI 安全研究機構達成了正式協議，允許他們提前訪問研究版的 o1 模型，這是確保未來模型在公開發佈前後進行研究、評估和測試的重要步驟。

誰適合使用 o1 模型？

這些強化推理能力的模型特別適合需要解決複雜問題的專業領域，如科學、編程、數學等。例如，o1 模型可以幫助醫療研究人員註釋細胞排序數據，幫助物理學家生成量子光學所需的數學公式，或幫助各領域的開發人員構建和執行多步驟的工作流。

推出 OpenAI o1-mini

為了滿足開發人員對更高效編程的需求，我們還推出了 OpenAI o1-mini，這是一個速度更快、成本更低的推理模型，專門用於生成和調試複雜的代碼。o1-mini 的運行成本比 o1 預覽版低 80%，是應用於需要推理但不需廣泛世界知識場景中的高效選擇。

如何使用 OpenAI o1

ChatGPT Plus 和 Team 用戶今天即可在 ChatGPT 中手動選擇 o1 預覽版和 o1-mini 模型。起步階段，每周訊息數量限制為 30 條（o1-preview）和 50 條（o1-mini）。我們正在努力提升這些限制，並計劃讓 ChatGPT 自動選擇最適合的模型來回應提示。

ChatGPT 企業和 Edu 用戶將於下週獲得這兩個模型的使用權限。開發人員可以立即在 API 中使用這些模型，並且 API 的速率限制為 20 RPM。我們也正在測試提升這些限制，API 目前尚不支持函數調用、流式傳輸或系統消息等功能。

接下來的計劃

這是 o1 系列推理模型在 ChatGPT 和 API 中的早期預覽版。隨著模型的更新，我們預計將增加瀏覽功能、文件和圖片上傳等功能，使其對用戶更加有用。

此外，我們還計劃繼續開發和推出 GPT 系列的新模型，並同時推出更多 o1 系列的更新和改進。

資料來源: https://openai.com/index/introducing-openai-o1-preview/

OpenAI 推出 o1 預覽版：提升 AI 推理能力的新模型

推理模型的工作原理

安全性提升

誰適合使用 o1 模型？

推出 OpenAI o1-mini

如何使用 OpenAI o1

接下來的計劃

最新文章

留言

文章分類

熱門標籤

推理模型的工作原理

安全性提升

誰適合使用 o1 模型？

推出 OpenAI o1-mini

如何使用 OpenAI o1

接下來的計劃

留言

​文章分類

​熱門標籤

文章分類

熱門標籤