☰

大模型廠商捲起“價格戰”，折射怎樣AI新風向？

21世紀經濟報道記者雷晨北京報道

近期，國內多家大模型廠商紛紛宣佈降價策略，推動大模型從“以分計價”的定價模式向更“以釐計價”新時代邁進。

5月21日，阿里雲通義千問的主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens，降幅達97%。這意味着，1元可以買200萬tokens。

阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示：“作爲中國第一大雲計算公司，阿里雲這次大幅降低大模型推理價格，就是希望加速AI應用的爆發。預計未來大模型API的調用量會有成千上萬倍的增長。”

同日，百度智能雲也宣佈其文心大模型的兩大主力模型ERNIE Speed和ERNIE Lite全面免費。

此前，字節跳動、智譜AI等廠商也紛紛推出了各自的降價方案。“豆包主力模型的推理輸入定價只有0.0008元/千Tokens，0.8釐就能處理1500多個漢字，比行業便宜99.3%。”火山引擎總裁譚待5月15日公開表示。

受訪人士認爲，這場價格戰的背後，是各家廠商對於優先做大市場的共識，各家旨在通過降低使用成本，吸引更多企業和個人開發者使用其技術，從而推動生態繁榮。

大模型廠商打響價格戰

5月以來，國內廠商紛紛開啓了大模型推理端的價格戰。

5月6日，幻方量化官微宣佈，旗下深度求索（DeepSeek）正式開源第二代MoE模型DeepSeek-V2。據介紹，DeepSeek-V2API的定價爲：每百萬tokens輸入1元、輸出2元，價格爲GPT-4-Turbo的近百分之一。

智譜AI大模型開放平臺於5月11日上線了新的價格體系，新註冊用戶可以獲得額度從500萬tokens提升至2500萬tokens，並且個人版GLM-3Turbo模型產品的調用價格從5元/百萬tokens降低至1元/百萬tokens。

5月15日，在火山引擎原動力發佈會上，字節跳動豆包大模型家族、火山方舟2.0、AI應用及AI雲基礎設施等一系列最新產品正式發佈。

火山引擎是字節跳動旗下雲服務平臺，據譚待介紹，經過一年時間的迭代和市場驗證，字節跳動自研的豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一，目前日均處理1200億Tokens文本，生成3000萬張圖片。

“豆包主力模型的推理輸入定價只有0.0008元/千Tokens，0.8釐就能處理1500多個漢字，比行業便宜99.3%。”火山引擎總裁譚待表示，大模型從以分計價到以釐計價，將助力企業以更低成本加速業務創新。

譚待強調，降價是用技術優化成本來實現的。如果只是補貼，用虧損換收入是不可持續的，火山引擎不會走這條路。

海外方面，自2023年3月，OpenAI已經進行了多次降價。在今年1月25日夜間的更新中，OpenAI 新推出了2個嵌入模型，更新了3種模型的版本，並降低了多個模型及 API 的使用價格。其中，GPT-3.5 Turbo 模型的輸入價格降低了50%，至0.0005美元/1000 tokens，輸出價格降低了25%，至0.0015美元/1000 tokens。

5月13日，OpenAI發佈新一代大模型GPT-4o，GPT-4o能夠接受文本、音頻、圖像和視頻的任意組合作爲輸入，並生成文本、音頻和圖像輸出的任意組合。GPT-4o可以在最短232毫秒內響應音頻輸入，平均爲320毫秒，與人類正常對話的響應時間接近。與GPT-4Turbo相比，GPT-4o的速度快2倍，價格減半，速率限制高出5倍。

在機構分析師看來，GPT-4o的誕生進一步驗證了大模型廠商API的降價趨勢，其技術路徑對國內大模型產業也具備積極的映射作用。

隨着國內外大模型廠商技術角逐進一步激烈，華龍證券分析師孫伯文認爲，大模型行業開啓價格戰信號明顯。通過降低價格門檻，大模型廠商有望吸引更廣泛的企業用戶羣體，從而進一步平衡收入和成本。

“同時，更多C端用戶有望免費使用基礎AI應用，龐大的訪問量有助於企業進一步提升模型服務能力，完成良性循環。對下游企業來說，推理成本進一步降低，AI應用行業有望迎來成本拐點。”其表示。

AI應用有望加速普及

在業內看來，此輪大模型降價潮是各家廠商爲了搶佔市場份額，加速AI應用的商業化落地而採取的策略。

談及字節跳動大模型降價原因，譚待近期指出，今年大模型技術顯著提升，應用環節至關重要。繁榮生態是推廣應用的關鍵。市場上，許多客戶都渴望嘗試大模型，但創新風險高，尤其是AI風險。

“要減少不確定性，我們必須大幅降低試錯成本，使大模型能被廣泛採用，無論大企業還是個人開發者。市場呼籲我們提供更低成本的核心技術。”他表示。

據悉，目前火山引擎的生態包括了IaaS（基礎設施即服務）、PaaS（平臺即服務）、SaaS（軟件即服務）。

談及用戶場景落地情況時，譚待對21世紀經濟報道記者舉例道，隨着汽車與手機的交互日益自然，如在駕駛中導航、查詢周邊信息，無需分心操作手機，車載系統可即時響應需求。手機助手AI的應用受限於技術，未充分滿足用戶需求。

他還表示，在其他場景如消費營銷、金融服務中，智能體也展現出巨大潛力。

“爲實現AI技術的廣泛應用，需提升技術並構建豐富的應用生態。這需要低代碼生態的支持，降低開發門檻，激發羣體智慧。同時，降低AI技術成本，使更多初創企業和小規模項目得以實施，促進AI時代的創新與發展。”譚待告訴記者。

北京一位人工智能行業人士告訴記者，此輪大模型價格戰的開啓，對於AI應用的普及具有積極的推動作用，將使得更多企業和個人開發者能夠負擔得起AI技術的使用成本，從而更加積極地投入到AI技術的研發和應用中來。

“價格戰的競爭將促進AI技術的不斷創新和優化，推動整個行業的技術水平不斷提升。隨着AI應用的普及，將帶動相關產業鏈的發展，形成更加完善的AI生態系統，爲整個社會的數字化轉型提供有力支撐。”該人士表示。

華創證券研報認爲，整體來看，降低成本是推動大模型快進到“價值創造階段”的關鍵要素，更低的成本價格才能真正滿足企業的複雜業務場景需求，充分驗證大模型的應用價值。儘管模型終端的價格壓降或將促使大模型企業對上游加強成本管控，但目前我國企業正處於AI轉型的關鍵時期，低成本下AI模型生態將進一步完善，終端應用亦將涌現出一批覈心的創新應用。

大模型廠商捲起“價格戰”，折射怎樣AI新風向？

相關資訊