Amazon Bedrock 費用全解析:六大模式怎麼選?
- 奇軒 李
- 4月21日
- 讀畢需時 5 分鐘
已更新:4月26日

隨著生成式 AI 蓬勃發展,Amazon Bedrock 成為企業與開發者導入生成式 AI 的熱門選擇。除了整合了多家頂尖 Foundation Model(如 Anthropic Claude、Meta Llama、Stability AI、Cohere),它也提供了多種部署與費用模式,讓你依照實際需求取得最佳性價比。
本文將帶你一次看懂 Amazon Bedrock 的 六大模型部署模式,並搭配實際費用資訊,協助你做出明智選擇。
文章導覽:
一、Amazon Bedrock 是什麼 ?
Amazon Bedrock 是 Amazon 所推出的一種生成式 AI 服務平台,其就好像是你手機的app store,
他提供了眾多 AI 軟體,讓你透過平台,使用不同種 AI 服務,像是文本生成、影像圖片生成等服務
如想更了解關於Amazon Bedrock 資訊,參考我們詳細文章
二、 Amazon Bedrock 計價方式
Amazon Bedrock 利用 6 項計價模式來計算用戶使用其平台的服務,六項模式適用於不同的情境當中,彼此為分開計算,最終會列入amazon 帳單內
(一)模式一:隨需模式(On-Demand Inference)
介紹: 使用隨需模式,這就像叫計程車一樣,想用的時候就打開 App 叫車,用多少付多少。你不需要事先準備資源,直接呼叫 API 就能立刻拿到結果。其費用是依「輸入Token + 輸出 Token」來計價。
針對文字生成模型: 處理的每個輸入字符和生成的每個輸出字符都會向您收費。
針對嵌入模型: 處理的每個輸入字符都會向您收費。
針對影像生成模型: 每個生成的影像都會向您收費。
適用情境:適合快速開發與低頻需求
為什麼會有這個模式?因為很多人剛開始做專案,不知道用量多少、也不想綁長期計畫,這種模式最方便、最靈活。
📌 小提醒:1K token 約 750 英文單字,中文約 500~700 字。
延伸學習- Amazon Bedrock Token計算
(二)模式二:批次推論(Batch Inference)
介紹: 使用批次模式,就像把一堆文件交給助理說:「幫我分析一下,等你忙完一次給我結果」,很適合大量資料分析但不急著要的情境。
適用情境:適合大規模離線處理
客戶評論批次分析
文件分類與比對
資料備份後端 AI 加值分析
為什麼會有這個模式? 很多公司會有成千上萬筆資料需要 AI 幫忙分類、分析、摘要,這些不用即時完成,用批次來做省時又省錢。
隨需 & 批次模式費用計算(以 Anthropic 模型為例)
Anthropic 模型 | 每 1,000 個輸入字符的定價 | 每 1,000 個輸出字符的定價 | 每 1,000 個輸入字符的定價 (批次) | 每 1,000 個輸出字符的定價 (批次) |
Claude Instant | 0.0008 USD | 0.0024 USD | 0.0004 USD | 0.0012 USD |
Claude 2.0/2.1 | 0.008 USD | 0.024 USD | 0.004 USD | 0.012 USD |
Claude 3 Haiku | 0.00025 USD | 0.00125 USD | 0.000125 USD | 0.000625 USD |
Claude 3.5 Sonnet | 0.003 USD | 0.015 USD | 無 | 無 |
<註❗️> 因台灣地區尚未支援,故以新加坡作為範例,其他地區詳細資訊參考Amazon Bedrock官網
(三)模式三:延遲最佳化模式(Latency Optimized Inference)
介紹:這種模式的目標就是「越快越好」,類似高速公路的快車道。適合需要即時反應的應用程式,像聊天機器人,不能讓使用者等太久。
適用情境: 快速回應
即時對話型服務
語意搜尋引擎
調用頻率不穩定的應用
為什麼會有這個模式?有些應用(像客服機器人、即時搜尋)如果等太久,使用者體驗會變差,所以就需要特別優化速度。
費用計算:(以 Anthropic 模型為例)
| 每 1,000 個輸入字符的定價 | 每 1,000 個輸出字符的定價 |
Claude 3.5 Haiku | 0.001 USD | 0.005 USD |
<註❗️> 因台灣地區尚未支援,故以美國東部 (俄亥俄)作為範例,其他地區詳細資訊參考Amazon Bedrock官網
(四)模式四:佈建輸送量(Provisioned Throughput)
介紹:這就像你跟 Amazon 說:「我每天都要跑這個模型,你給我保留一台專屬的跑車,不管人多不多我都要能跑。」換句話說,這是預約制,你每個小時都有固定的資源配給你,不用跟別人搶!
適用情境:適合高頻商業應用,用得越多越省
企業內建 AI 功能(如 CRM 自動回覆)
高併發用戶服務
金融或醫療應用場景
為什麼會有這個模式?企業級應用不能出錯、不能延遲,要很穩定的處理大量請求,這時就需要這種保證輸送量的模式。
費用計算:(以 Anthropic 模型為例)
Anthropic 模型 | 每個模型單元每小時定價,1 個月承諾模式六:Marketplace 模型 | 每個模型單元每小時定價,6 個月承諾 |
Claude Instant | 53.00 USD | 29.00 USD |
Claude 2.0/2.1 | 86.00 USD | 48.00 USD |
<註❗️> 因台灣地區尚未支援,故以東京作為範例,其他地區詳細資訊參考Amazon Bedrock官網
(五)模式五:自訂模型匯入(Bring Your Own Model, BYOM)
介紹:這個就像你不買別人的模型,而是自己訓練一台超會理解你公司語言的 AI,然後帶到 Amazon 的平台上來使用。Amazon 幫你託管、提供運算資源,但模型是你的!將自訂模型導入 Bedrock 無需費用。匯入模型後,您即可隨需存取模型,而無需執行任何控制平面動作。
情境適用:適合擁有專屬語料、自建語言模型的企業
為什麼會有這個模式? 很多大公司會用自家語料訓練專屬模型(例如內部專業術語),這些模型不會公開,只適合自家使用,這時就要匯入來用。
費用計算:在上傳模型時Amazon 不會跟你收取任何費用,但在當你使用時,會根據你模型的副本數&持續時間(以 5 分鐘時段計費)來來向你收取模型推論費用
(六)模式六:Marketplace 模型
介紹:Amazon Bedrock Marketplace 可讓您在 Bedrock 中探索、測試和使用超過 100 種熱門、新興和專業的基礎模型。
適用情境:多模型測試的天堂,價格由提供者定義
為什麼會有這個模式?每家公司訓練出來的模型特色都不同,使用者想要比價、測試、挑最適合自己的,而不是只靠 Amazon。
費用計算:對於專有模型,系統會根據您選取的執行個體收取模型供應商設定的軟體價格 (按每小時、每秒增量或要求計費),以及收取基礎設施價格。您可以在訂閱供應商模型之前查看這些價格,也可以從 AWS Marketplace 中的模型清單中查看這些價格
三、結論
透過Amazon Bedrock 上各模式的應用,不管你是正在開發 AI 原型的創業者,還是尋求擴展 AI 功能的企業 CTO,你可以放心地從小規模開始測試,再擴展到高輸送量應用,Amazon Bedrock 提供從靈活到企業級的完整解決方案,加上精細的費用結構將會協助你完成你所想的任何事
Comments