大模型廠商捲起“價格戰”,折射怎樣AI新風向?

21世紀經濟報道記者雷晨 北京報道

近期,國內多家大模型廠商紛紛宣佈降價策略,推動大模型從“以分計價”的定價模式向更“以釐計價”新時代邁進。

5月21日,阿里雲通義千問的主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達97%。這意味着,1元可以買200萬tokens。

阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示:“作爲中國第一大雲計算公司,阿里雲這次大幅降低大模型推理價格,就是希望加速AI應用的爆發。預計未來大模型API的調用量會有成千上萬倍的增長。”

同日,百度智能雲也宣佈其文心大模型的兩大主力模型ERNIE Speed和ERNIE Lite全面免費。

此前,字節跳動、智譜AI等廠商也紛紛推出了各自的降價方案。“豆包主力模型的推理輸入定價只有0.0008元/千Tokens,0.8釐就能處理1500多個漢字,比行業便宜99.3%。”火山引擎總裁譚待5月15日公開表示。

受訪人士認爲,這場價格戰的背後,是各家廠商對於優先做大市場的共識,各家旨在通過降低使用成本,吸引更多企業和個人開發者使用其技術,從而推動生態繁榮。

大模型廠商打響價格戰

5月以來,國內廠商紛紛開啓了大模型推理端的價格戰。

5月6日,幻方量化官微宣佈,旗下深度求索(DeepSeek)正式開源第二代MoE模型DeepSeek-V2。據介紹,DeepSeek-V2API的定價爲:每百萬tokens輸入1元、輸出2元,價格爲GPT-4-Turbo的近百分之一。

智譜AI大模型開放平臺於5月11日上線了新的價格體系,新註冊用戶可以獲得額度從500萬tokens提升至2500萬tokens,並且個人版GLM-3Turbo模型產品的調用價格從5元/百萬tokens降低至1元/百萬tokens。

5月15日,在火山引擎原動力發佈會上,字節跳動豆包大模型家族、火山方舟2.0、AI應用及AI雲基礎設施等一系列最新產品正式發佈。

火山引擎是字節跳動旗下雲服務平臺,據譚待介紹,經過一年時間的迭代和市場驗證,字節跳動自研的豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。

“豆包主力模型的推理輸入定價只有0.0008元/千Tokens,0.8釐就能處理1500多個漢字,比行業便宜99.3%。”火山引擎總裁譚待表示,大模型從以分計價到以釐計價,將助力企業以更低成本加速業務創新。

譚待強調,降價是用技術優化成本來實現的。如果只是補貼,用虧損換收入是不可持續的,火山引擎不會走這條路。

海外方面,自2023年3月,OpenAI已經進行了多次降價。在今年1月25日夜間的更新中,OpenAI 新推出了2個嵌入模型,更新了3種模型的版本,並降低了多個模型及 API 的使用價格。其中,GPT-3.5 Turbo 模型的輸入價格降低了50%,至0.0005美元/1000 tokens,輸出價格降低了25%,至0.0015美元/1000 tokens。

5月13日,OpenAI發佈新一代大模型GPT-4o,GPT-4o能夠接受文本、音頻、圖像和視頻的任意組合作爲輸入,並生成文本、音頻和圖像輸出的任意組合。GPT-4o可以在最短232毫秒內響應音頻輸入,平均爲320毫秒,與人類正常對話的響應時間接近。與GPT-4Turbo相比,GPT-4o的速度快2倍,價格減半,速率限制高出5倍。

在機構分析師看來,GPT-4o的誕生進一步驗證了大模型廠商API的降價趨勢,其技術路徑對國內大模型產業也具備積極的映射作用。

隨着國內外大模型廠商技術角逐進一步激烈,華龍證券分析師孫伯文認爲,大模型行業開啓價格戰信號明顯。通過降低價格門檻,大模型廠商有望吸引更廣泛的企業用戶羣體,從而進一步平衡收入和成本。

“同時,更多C端用戶有望免費使用基礎AI應用,龐大的訪問量有助於企業進一步提升模型服務能力,完成良性循環。對下游企業來說,推理成本進一步降低,AI應用行業有望迎來成本拐點。”其表示。

AI應用有望加速普及

在業內看來,此輪大模型降價潮是各家廠商爲了搶佔市場份額,加速AI應用的商業化落地而採取的策略。

談及字節跳動大模型降價原因,譚待近期指出,今年大模型技術顯著提升,應用環節至關重要。繁榮生態是推廣應用的關鍵。市場上,許多客戶都渴望嘗試大模型,但創新風險高,尤其是AI風險。

“要減少不確定性,我們必須大幅降低試錯成本,使大模型能被廣泛採用,無論大企業還是個人開發者。市場呼籲我們提供更低成本的核心技術。”他表示。

據悉,目前火山引擎的生態包括了IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)。

談及用戶場景落地情況時,譚待對21世紀經濟報道記者舉例道,隨着汽車與手機的交互日益自然,如在駕駛中導航、查詢周邊信息,無需分心操作手機,車載系統可即時響應需求。手機助手AI的應用受限於技術,未充分滿足用戶需求。

他還表示,在其他場景如消費營銷、金融服務中,智能體也展現出巨大潛力。

“爲實現AI技術的廣泛應用,需提升技術並構建豐富的應用生態。這需要低代碼生態的支持,降低開發門檻,激發羣體智慧。同時,降低AI技術成本,使更多初創企業和小規模項目得以實施,促進AI時代的創新與發展。”譚待告訴記者。

北京一位人工智能行業人士告訴記者,此輪大模型價格戰的開啓,對於AI應用的普及具有積極的推動作用,將使得更多企業和個人開發者能夠負擔得起AI技術的使用成本,從而更加積極地投入到AI技術的研發和應用中來。

“價格戰的競爭將促進AI技術的不斷創新和優化,推動整個行業的技術水平不斷提升。隨着AI應用的普及,將帶動相關產業鏈的發展,形成更加完善的AI生態系統,爲整個社會的數字化轉型提供有力支撐。”該人士表示。

華創證券研報認爲,整體來看,降低成本是推動大模型快進到“價值創造階段”的關鍵要素,更低的成本價格才能真正滿足企業的複雜業務場景需求,充分驗證大模型的應用價值。儘管模型終端的價格壓降或將促使大模型企業對上游加強成本管控,但目前我國企業正處於AI轉型的關鍵時期,低成本下AI模型生態將進一步完善,終端應用亦將涌現出一批覈心的創新應用。