搜尋

解析Google Gemini API費用結構：最佳選擇與成本優化

Kevin Chou
2024年10月4日
讀畢需時 3 分鐘

已更新：2024年11月5日

隨著 Google 的 Gemini API 發布，開發者和企業可以利用多模態 AI 模型來構建智慧應用程式。理解 Gemini API 的費用結構是選擇最合適的模型並有效控制成本的關鍵。最新版本的 Gemini 1.5 系列，不僅在性能上有重大提升，還在費用上進行了優化，尤其是加入了「內容快取費用」（Context Caching Cost）這一創新費用選項。以下將為你詳細解析 Gemini API 的費用結構，以及如何選擇適合的模型並進行成本優化。

Gemini API 模型費用概覽
內容快取費用
費用優化建議
結論

Gemini API 模型費用概覽

Gemini API 提供多種模型，以應對不同的應用需求。以下是主要模型的費用結構：

Gemini 1.5 Pro：這是高性能的多模態模型，擁有 200 萬個上下文 token 窗口，非常適合處理長文本、代碼或視頻等多模態應用。費用為每百萬個輸入 token $3.50 美元，輸出 token 為 $10.50 美元。如果輸入 token 超過 12.8 萬，價格會增加至每百萬輸入 token $7.00 美元，輸出 token 為 $21.00 美元。
Gemini 1.5 Flash：這是一款更輕量級的模型，適合更快速且低複雜度的應用。標準費用為每百萬輸入 token $0.075 美元，輸出 token 為 $0.30 美元。但當輸入 token 超過 12.8 萬時，費用會增加至每百萬輸入 token $0.15 美元，輸出 token 為 $0.60 美元。

內容快取費用

Gemini API 提供的「內容快取費用」（Context Caching Cost）是一項新功能，旨在降低處理重複上下文時的費用。當模型需要在多次請求中處理相同的上下文時，這些內容可以被快取起來，以避免每次都重新計算。這樣的設計在處理大型文檔、多輪對話等重複性高的應用中，能顯著減少費用。

內容快取的優點：

降低成本：針對已快取的上下文，重新使用時的費用比正常 token 使用費用低。例如，在 Gemini 1.5 Pro 中，針對 128K token 以下的請求，快取費用可以降低 64%。
提升效率：快取的上下文能加快處理速度，尤其是在多次相似請求中，能避免每次重新處理所有上下文資料。

適用場景：

多輪對話：在多輪對話中，對話的上下文信息會被多次引用，快取功能可以減少重複計算的成本。
大型文檔分析：在處理多頁文檔或長文本時，快取可以減少對相同部分的重複計算，提升效能。

費用優化建議

選擇合適的模型：根據應用場景選擇模型。對於簡單任務，如基礎文本生成或小型應用，選擇 Gemini 1.5 Flash 能顯著節省成本。而對於需要高性能的應用，如代碼生成或多模態應用，Gemini 1.5 Pro 是更好的選擇。
優化 Token 使用量：減少輸入和輸出 token 的使用量，並精簡請求的長度，可以有效控制費用。尤其是針對輸出 token，這是費用的主要來源。
利用內容快取：對於需要多次引用相同上下文的應用，啟用內容快取可以顯著降低總體費用，特別是在大型文檔或多輪對話的應用場景中。