搜尋

Amazon Bedrock 費用全解析：六大模式怎麼選？

2025年4月21日
讀畢需時 5 分鐘

已更新：2025年4月26日

隨著生成式 AI 蓬勃發展，Amazon Bedrock 成為企業與開發者導入生成式 AI 的熱門選擇。除了整合了多家頂尖 Foundation Model（如 Anthropic Claude、Meta Llama、Stability AI、Cohere），它也提供了多種部署與費用模式，讓你依照實際需求取得最佳性價比。

本文將帶你一次看懂 Amazon Bedrock 的 六大模型部署模式，並搭配實際費用資訊，協助你做出明智選擇。

文章導覽：

Amazon Bedrock 是什麼？
Amazon Bedrock計價方式
結論

一、Amazon Bedrock 是什麼？

Amazon Bedrock 是 Amazon 所推出的一種生成式 AI 服務平台，其就好像是你手機的app store,

他提供了眾多 AI 軟體，讓你透過平台，使用不同種 AI 服務，像是文本生成、影像圖片生成等服務

如想更了解關於Amazon Bedrock 資訊，參考我們詳細文章

二、 Amazon Bedrock 計價方式

Amazon Bedrock 利用 6 項計價模式來計算用戶使用其平台的服務，六項模式適用於不同的情境當中，彼此為分開計算，最終會列入amazon 帳單內

（一）模式一：隨需模式（On-Demand Inference）

介紹： 使用隨需模式，這就像叫計程車一樣，想用的時候就打開 App 叫車，用多少付多少。你不需要事先準備資源，直接呼叫 API 就能立刻拿到結果。其費用是依「輸入Token + 輸出 Token」來計價。

針對文字生成模型: 處理的每個輸入字符和生成的每個輸出字符都會向您收費。
針對嵌入模型: 處理的每個輸入字符都會向您收費。
針對影像生成模型: 每個生成的影像都會向您收費。

適用情境：適合快速開發與低頻需求
為什麼會有這個模式？因為很多人剛開始做專案，不知道用量多少、也不想綁長期計畫，這種模式最方便、最靈活。

📌 小提醒：1K token 約 750 英文單字，中文約 500～700 字。

延伸學習- Amazon Bedrock Token計算

（二）模式二：批次推論（Batch Inference）

介紹： 使用批次模式，就像把一堆文件交給助理說：「幫我分析一下，等你忙完一次給我結果」，很適合大量資料分析但不急著要的情境。

適用情境：適合大規模離線處理

客戶評論批次分析
文件分類與比對
資料備份後端 AI 加值分析

為什麼會有這個模式？ 很多公司會有成千上萬筆資料需要 AI 幫忙分類、分析、摘要，這些不用即時完成，用批次來做省時又省錢。
隨需＆批次模式費用計算（以 Anthropic 模型為例）

Anthropic 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價	每 1,000 個輸入字符的定價 (批次)	每 1,000 個輸出字符的定價 (批次)
Claude Instant	0.0008 USD	0.0024 USD	0.0004 USD	0.0012 USD
Claude 2.0/2.1	0.008 USD	0.024 USD	0.004 USD	0.012 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	無	無

<註❗️> 因台灣地區尚未支援，故以新加坡作為範例，其他地區詳細資訊參考Amazon Bedrock官網

(三）模式三：延遲最佳化模式（Latency Optimized Inference）

介紹：這種模式的目標就是「越快越好」，類似高速公路的快車道。適合需要即時反應的應用程式，像聊天機器人，不能讓使用者等太久。

適用情境： 快速回應

即時對話型服務
語意搜尋引擎
調用頻率不穩定的應用

為什麼會有這個模式？有些應用（像客服機器人、即時搜尋）如果等太久，使用者體驗會變差，所以就需要特別優化速度。
費用計算：（以 Anthropic 模型為例）

	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Claude 3.5 Haiku	0.001 USD	0.005 USD

<註❗️> 因台灣地區尚未支援，故以美國東部 (俄亥俄)作為範例，其他地區詳細資訊參考Amazon Bedrock官網

(四）模式四：佈建輸送量（Provisioned Throughput）

介紹：這就像你跟 Amazon 說：「我每天都要跑這個模型，你給我保留一台專屬的跑車，不管人多不多我都要能跑。」換句話說，這是預約制，你每個小時都有固定的資源配給你，不用跟別人搶！
適用情境：適合高頻商業應用，用得越多越省

企業內建 AI 功能（如 CRM 自動回覆）
高併發用戶服務
金融或醫療應用場景

為什麼會有這個模式？企業級應用不能出錯、不能延遲，要很穩定的處理大量請求，這時就需要這種保證輸送量的模式。
費用計算：（以 Anthropic 模型為例）

Anthropic 模型	每個模型單元每小時定價，1 個月承諾模式六：Marketplace 模型	每個模型單元每小時定價，6 個月承諾
Claude Instant	53.00 USD	29.00 USD
Claude 2.0/2.1	86.00 USD	48.00 USD

<註❗️> 因台灣地區尚未支援，故以東京作為範例，其他地區詳細資訊參考Amazon Bedrock官網

(五）模式五：自訂模型匯入（Bring Your Own Model, BYOM）

介紹：這個就像你不買別人的模型，而是自己訓練一台超會理解你公司語言的 AI，然後帶到 Amazon 的平台上來使用。Amazon 幫你託管、提供運算資源，但模型是你的！將自訂模型導入 Bedrock 無需費用。匯入模型後，您即可隨需存取模型，而無需執行任何控制平面動作。

情境適用：適合擁有專屬語料、自建語言模型的企業

為什麼會有這個模式？ 很多大公司會用自家語料訓練專屬模型（例如內部專業術語），這些模型不會公開，只適合自家使用，這時就要匯入來用。
費用計算：在上傳模型時Amazon 不會跟你收取任何費用，但在當你使用時，會根據你模型的副本數＆持續時間（以 5 分鐘時段計費)來來向你收取模型推論費用

（六）模式六：Marketplace 模型

介紹：Amazon Bedrock Marketplace 可讓您在 Bedrock 中探索、測試和使用超過 100 種熱門、新興和專業的基礎模型。

適用情境：多模型測試的天堂，價格由提供者定義

為什麼會有這個模式？每家公司訓練出來的模型特色都不同，使用者想要比價、測試、挑最適合自己的，而不是只靠 Amazon。
費用計算：對於專有模型，系統會根據您選取的執行個體收取模型供應商設定的軟體價格 (按每小時、每秒增量或要求計費)，以及收取基礎設施價格。您可以在訂閱供應商模型之前查看這些價格，也可以從 AWS Marketplace 中的模型清單中查看這些價格

三、結論

透過Amazon Bedrock 上各模式的應用，不管你是正在開發 AI 原型的創業者，還是尋求擴展 AI 功能的企業 CTO，你可以放心地從小規模開始測試，再擴展到高輸送量應用，Amazon Bedrock 提供從靈活到企業級的完整解決方案，加上精細的費用結構將會協助你完成你所想的任何事

Amazon Bedrock 費用全解析：六大模式怎麼選？

一、Amazon Bedrock 是什麼？