top of page

Amazon Bedrock 費用全解析:六大模式怎麼選?

  • 作家相片: 奇軒 李
    奇軒 李
  • 4月21日
  • 讀畢需時 5 分鐘

已更新:4月26日


amazon bedrock 費用說明

隨著生成式 AI 蓬勃發展,Amazon Bedrock 成為企業與開發者導入生成式 AI 的熱門選擇。除了整合了多家頂尖 Foundation Model(如 Anthropic Claude、Meta Llama、Stability AI、Cohere),它也提供了多種部署與費用模式,讓你依照實際需求取得最佳性價比。

本文將帶你一次看懂 Amazon Bedrock 的 六大模型部署模式,並搭配實際費用資訊,協助你做出明智選擇。


文章導覽:


一、Amazon Bedrock 是什麼 ?

Amazon Bedrock 是 Amazon 所推出的一種生成式 AI 服務平台,其就好像是你手機的app store,

他提供了眾多 AI 軟體,讓你透過平台,使用不同種 AI 服務,像是文本生成、影像圖片生成等服務

如想更了解關於Amazon Bedrock 資訊,參考我們詳細文章

二、 Amazon Bedrock 計價方式

Amazon Bedrock 利用 6 項計價模式來計算用戶使用其平台的服務,六項模式適用於不同的情境當中,彼此為分開計算,最終會列入amazon 帳單內


(一)模式一:隨需模式(On-Demand Inference)


  1. 介紹: 使用隨需模式,這就像叫計程車一樣,想用的時候就打開 App 叫車,用多少付多少。你不需要事先準備資源,直接呼叫 API 就能立刻拿到結果。其費用是依「輸入Token + 輸出 Token」來計價。


  • 針對文字生成模型:  處理的每個輸入字符和生成的每個輸出字符都會向您收費。

  • 針對嵌入模型:         處理的每個輸入字符都會向您收費。

  • 針對影像生成模型: 每個生成的影像都會向您收費。


  1. 適用情境:適合快速開發與低頻需求

  2. 為什麼會有這個模式?因為很多人剛開始做專案,不知道用量多少、也不想綁長期計畫,這種模式最方便、最靈活。

📌 小提醒:1K token 約 750 英文單字,中文約 500~700 字。

(二)模式二:批次推論(Batch Inference)


  1. 介紹: 使用批次模式,就像把一堆文件交給助理說:「幫我分析一下,等你忙完一次給我結果」,很適合大量資料分析但不急著要的情境。


  1. 適用情境:適合大規模離線處理


  • 客戶評論批次分析

  • 文件分類與比對

  • 資料備份後端 AI 加值分析


  1. 為什麼會有這個模式? 很多公司會有成千上萬筆資料需要 AI 幫忙分類、分析、摘要,這些不用即時完成,用批次來做省時又省錢。


  2. 隨需 & 批次模式費用計算(以 Anthropic 模型為例)

Anthropic 模型

每 1,000 個輸入字符的定價

每 1,000 個輸出字符的定價

每 1,000 個輸入字符的定價 (批次)

每 1,000 個輸出字符的定價 (批次)

Claude Instant

0.0008 USD

0.0024 USD

0.0004 USD

0.0012 USD

Claude 2.0/2.1

0.008 USD

0.024 USD

0.004 USD

0.012 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

Claude 3.5 Sonnet

0.003 USD

0.015 USD

<註❗️> 因台灣地區尚未支援,故以新加坡作為範例,其他地區詳細資訊參考Amazon Bedrock官網


(三)模式三:延遲最佳化模式(Latency Optimized Inference


  1. 介紹:這種模式的目標就是「越快越好」,類似高速公路的快車道。適合需要即時反應的應用程式,像聊天機器人,不能讓使用者等太久。


  1. 適用情境 快速回應


  • 即時對話型服務

  • 語意搜尋引擎

  • 調用頻率不穩定的應用


  1. 為什麼會有這個模式?有些應用(像客服機器人、即時搜尋)如果等太久,使用者體驗會變差,所以就需要特別優化速度。


  2. 費用計算:(以 Anthropic 模型為例)

 

每 1,000 個輸入字符的定價

每 1,000 個輸出字符的定價

Claude 3.5 Haiku

0.001 USD

0.005 USD

<註❗️> 因台灣地區尚未支援,故以美國東部 (俄亥俄)作為範例,其他地區詳細資訊參考Amazon Bedrock官網


(四)模式四:佈建輸送量(Provisioned Throughput)


  1. 介紹:這就像你跟 Amazon 說:「我每天都要跑這個模型,你給我保留一台專屬的跑車,不管人多不多我都要能跑。」換句話說,這是預約制,你每個小時都有固定的資源配給你,不用跟別人搶!


  2. 適用情境適合高頻商業應用,用得越多越省

  • 企業內建 AI 功能(如 CRM 自動回覆)

  • 高併發用戶服務

  • 金融或醫療應用場景


  1. 為什麼會有這個模式?企業級應用不能出錯、不能延遲,要很穩定的處理大量請求,這時就需要這種保證輸送量的模式。


  2. 費用計算(以 Anthropic 模型為例)

Anthropic 模型

每個模型單元每小時定價,1 個月承諾模式六:Marketplace 模型

每個模型單元每小時定價,6 個月承諾

Claude Instant

53.00 USD

29.00 USD

Claude 2.0/2.1

86.00 USD

48.00 USD

<註❗️> 因台灣地區尚未支援,故以東京作為範例,其他地區詳細資訊參考Amazon Bedrock官網


(五)模式五:自訂模型匯入(Bring Your Own Model, BYOM)


  1. 介紹:這個就像你不買別人的模型,而是自己訓練一台超會理解你公司語言的 AI,然後帶到 Amazon 的平台上來使用。Amazon 幫你託管、提供運算資源,但模型是你的!將自訂模型導入 Bedrock 無需費用。匯入模型後,您即可隨需存取模型,而無需執行任何控制平面動作。


  1. 情境適用:適合擁有專屬語料、自建語言模型的企業


  1. 為什麼會有這個模式? 很多大公司會用自家語料訓練專屬模型(例如內部專業術語),這些模型不會公開,只適合自家使用,這時就要匯入來用。


  2. 費用計算:在上傳模型時Amazon 不會跟你收取任何費用,但在當你使用時,會根據你模型的副本數&持續時間(以 5 分鐘時段計費)來來向你收取模型推論費用


(六)模式六:Marketplace 模型


  1. 介紹:Amazon Bedrock Marketplace 可讓您在 Bedrock 中探索、測試和使用超過 100 種熱門、新興和專業的基礎模型。


  1. 適用情境多模型測試的天堂,價格由提供者定義


  1. 為什麼會有這個模式?每家公司訓練出來的模型特色都不同,使用者想要比價、測試、挑最適合自己的,而不是只靠 Amazon。


  2. 費用計算:對於專有模型,系統會根據您選取的執行個體收取模型供應商設定的軟體價格 (按每小時、每秒增量或要求計費),以及收取基礎設施價格。您可以在訂閱供應商模型之前查看這些價格,也可以從 AWS Marketplace 中的模型清單中查看這些價格


三、結論

透過Amazon Bedrock 上各模式的應用,不管你是正在開發 AI 原型的創業者,還是尋求擴展 AI 功能的企業 CTO,你可以放心地從小規模開始測試,再擴展到高輸送量應用,Amazon Bedrock 提供從靈活到企業級的完整解決方案,加上精細的費用結構將會協助你完成你所想的任何事


Comments


​文章分類
熱門標籤
bottom of page