首批8家大模型“持證上崗”,中國版OpenAI終將花落誰家?

作者|閆妍

出品|本站科技《態℃》欄目

今日凌晨,百度、百川智能等8家國產大模型通過首批備案,可面向全社會開放。

具體的企業機構包括:五家北京企業機構,百度(文心一言)、抖音(雲雀大模型)、智譜AI(GLM大模型)、中科院(紫東太初大模型)、百川智能(百川大模型)。以及三家上海企業機構,商湯(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能實驗室(書生通用大模型)。阿里通義千問、360智腦、訊飛星火等均不在首批獲批名單中。

產品獲批後,8月30日晚23點前後,文心一言的APP已經能公開使用,此前則需要排隊領取內測資格。隨後,王小川的百川智能和商湯日日新大模型旗下自然語言應用“商量SenseChat”也宣佈向全社會全面開放,有信心拿出強有力的大模型產品,接受C端消費者的“用腳投票”。

今年年初,由現象級產品ChatGPT引發的AIGC浪潮,讓人們看到了人工智能技術給千行百業帶來的巨大的革新潛力,尤其是通用大模型這個萬億賽道,被認爲是最值得長期深耕的賽道。

半年多時間,國產ChatGPT之爭,歷史被一次次刷新。

政策層面,4月11日,國家互聯網信息辦公室發佈的關於《生成式人工智能服務管理辦法(徵求意見稿)》提出。8月15日,《生成式人工智能服務管理暫行辦法》正式施行,這也是我國首個針對生成式人工智能產業的規範性政策,大力支持國產大模型爲代表的人工智能產業的發展。

技術層面,國內過去在移動互聯網時代所積累的雲計算、數據中心、算力中心等領先全球的數字化基礎設施,爲AIGC的落地運行提供了堅實基礎。在中國,互聯網科技公司迅速點燃了“百模大戰”的硝煙,對於大模型和生成式AI的技術突破,近乎達到了白熱化的程度。

AI賽道風雲再起,誰將抓住下一個時代?中國版OpenAI,又將花落誰家?

李彥宏、王小川交手二十年再度重相逢

面對AIGC巨浪,李彥宏和王小川兩位大佬都展現了非凡的行動力。

在國內互聯網大廠中,百度今年3月率先推出文心一言並開啓邀測。當時,李彥宏就表示,生成式AI代表着新的技術範式,是任何企業都不應錯過的大機會。

百度方面曾表示,近十年,百度累計研發投入超1400億元,是應用、模型、框架、芯片四層全棧佈局的AI公司,並在各個層面都有關鍵自研技術。2022年百度核心研發費用214.16億元,佔百度核心收入比例達到22.4%。李彥宏在近日的電話財報會上還談到,年底將推文心大模型4.0版。

據瞭解,百度智能雲已經和300多個合作伙伴,在400多個具體的場景中取得測試效果。同時,百度文心大模型已擁有規模龐大的產業落地合作伙伴,覆蓋政務、互聯網、能源電力、汽車、消費電子、金融、教育、辦公等衆多重點行業。

這次與文心一言同時獲批上線的,還有李彥宏20年的老對手王小川。在搜索引擎、輸入法、瀏覽器等領域交手多番後,雙方於2023年重逢大模型新戰場。

百川智能成立於2023年4月10日,由前搜狗公司CEO王小川創立。公司核心團隊由來自搜狗、百度、華爲、微軟、字節、騰訊等知名科技公司的AI人才組成。

王小川曾向本站科技《態℃》欄目等媒體表示,百模大戰下,一起起步的公司動輒5億美金估值,第二輪可能就是10億美金的狀態,這個競爭不是“小清新”狀態,而是要迅速投入到這場大戰役之中。“更多的大廠、更多的錢、更多人、更多的算力互相卷,這種情況下要迅速形成戰鬥力,因此優先把搜狗的老班底拉起來,大家能迅速磨合,才能適應這麼大的挑戰。”

成立僅四個月,百川智能便相繼發佈了三款通用大語言模型。此前6月和7月,先後發佈了70億參數的 baichuan-7B和130億參數的 baichuan-13B 後,在8月8日發佈了530億參數的大模型 baichuan-53B。

王小川談到,中國誰做了最好的大模型,還沒有結論。“我們跟美國不太一樣,美國通用大模型閉源模型頭部幾家已經定下來了,OpenAI的ChatGPT有了,Google有一張門票,在美國做通用大模型已經沒有懸念,投資也不會再去投。但是在中國不是,中國誰做出了最好的大模型並沒有結論,大家都在爭取的機會,且不一定落在大廠裡面。”

在他看來,歷史上每次發生大的變化,都有創業公司的機會。創業公司會比大公司跑得快,爲什麼會不行?

大模型能力誰優誰劣衆說紛紜

伴隨AI產業的火爆,國內AI相關模型、產品、平臺不斷涌現,據公開資料顯示,國內市場在半年時間裡已發佈近百個AI大模型,共同掀起一場“百模大戰”,但大模型能力誰優誰劣,各項評估報告給出的結果衆說紛紜。

近期,IDC發佈的《AI大模型技術能力評估報告,2023》,嘗試爲這個問題找到一些解決方案。該報告創建了一個AI大模型技術能力的評估模型,並對國內14家廠商的大模型能力進行了評估。

評估模型主要分爲三個維度,產品技術、服務生態以及行業應用三大維度。其中,產品技術又細分爲算法模型能力、通用能力、創新能力、平臺能力、安全可解釋;服務生態,細分爲服務能力和生態合作;行業應用則主要看行業覆蓋能力。

國內主流大模型,包括百度、阿里、騰訊、華爲、科大訊飛、360、商湯等14家廠商參與了本次評估。百度、阿里巴巴、科大訊飛、智譜AI的各項指標表現如下:

其中,百度文心大模型3.5拿下12項指標的7個滿分,並且綜合評分第一,算法模型第一,行業覆蓋第一。

文心一言自今年3月發佈至今快速成長,熟練掌握的創作體材超過200個,內容豐富度是發佈初期的1.6倍,思維鏈長度是初期的2.1倍,知識點覆蓋達到初期的8.3倍。效率方面,通過飛槳端到端自適應混合並行訓練技術以及壓縮、推理、服務部署的協同優化,文心大模型訓練速度達到原來的3倍,推理速度達到原來的30多倍。

而在SuperCLUE(中文通用大模型綜合性測評基準)公佈的8月榜單,百川智能的Baichuan-13B一舉拿下國內大模型評測榜首,緊隨其後的是Minimax-abab5和百度文心一言,三家大模型產品體現了高質量數據處理、算法優化方面的出色能力。

值得注意的是,Minimax也是如今國內估值最高的大模型初創公司之一。據路透6月報道,Minimax完成了新一輪2.5億美元融資後,整體估值超過12億美元。

Minimax成立於2021年,由前商湯科技副總裁、通用智能技術負責人閆俊傑成立。Minimax已經發布了包括文本到視覺/語音/文本三個基礎模型架構,推出自研通用大模型“ABAB”,以及虛擬聊天軟件Glow、生成式對話AI產品Inspo等。

在王小川看來,今天不管是十家、百家、千家參與,最後一定要看兩件事情:

第一個,是否能拿出足夠好的AGI來,能與GPT3.5、GPT4去比肩,這件事情大家都有相應的距離,我們現在也沒做到,往下看今年內有哪些企業能達到3.5甚至逼近4的能力。

第二個,是否能做出超級應用來。有可能中國的超級應用會比美國跑得快,中國做科學問題會差一些,但是應用是我們的強項,能夠優先達到國際水平。

創新與監管,ChatGPT被控侵權等六大罪

AIGC實現了人類的創造力從1提升到100的飛躍,但AIGC的發展與治理還有許多問題和風險仍待解決,包括算法缺陷、倫理問題、版權問題、信息安全等等。

大洋彼岸,人工智能研究公司OpenAI本週迴應了兩起幾乎相同的集體訴訟,這些訴訟的原告包括多位作家。他們聲稱,ChatGPT接受了他們被盜版書籍的培訓,侵犯了他們作品的版權。

對此,OpenAI聲稱,原告“誤解了版權覆蓋的範圍,沒有考慮到限制和例外(包括合理使用)情況。而這些限制和例外適當地爲創新留出了空間,比如現在處於人工智能前沿的大語言模型。”

根據OpenAI的說法,即使上述作家的書籍只是ChatGPT龐大數據集的“一小部分”,“創新者以變革方式使用受版權保護的材料也並未侵犯版權”。與那些試圖通過分發受版權保護的材料直接獲利的剽竊者不同,OpenAI辯稱,它的目標是“教會其大模型推導出人類語言背後的規則”,以此來幫助人們“節省工作時間”、“讓日常生活變得更輕鬆”,或者通過在ChatGPT中輸入提示來自娛自樂。

在此之前,OpenAI的CEO Sam Altman就AI監管問題還參加了美國國會聽證,討論的核心要點之一便是版權問題。對此,Sam Altman表示,OpenAI將會拿出保護地方新聞業的相關舉措,但也沒有具體迴應如何在AI模型訓練過程中保護內容創作者版權權益的問題。

Sam Altman還表示,目前 AI 技術處於早期階段,仍會出現錯誤。如果 AI 技術出了問題,後果會相當嚴重,尤其 AI 不是社交媒體,它需要不同的應對方式。他呼籲政府對 AI 技術應進行更嚴厲的監管,並表示OpenAI以及谷歌等同行都應當承受壓力。

但風險的另一面則是巨大的機遇。

ChatGPT在發佈之後至今七個多月的時間裡,一直維持着令人“頭暈目眩”的增長。在發佈後的短短第5天,ChatGPT就獲得了100萬用戶;又過了兩個月,ChatGPT邁過了1億用戶大關,成爲有史以來達成這兩項指標最快的產品。

雖然ChatGPT的流量在6月份環比下滑了10%,但其絕對值仍然高達16億次。在SimilarWeb的網站排名中,ChatGPT位列全球網站流量排行榜第17名。

國產ChatGPT面向公衆開放後,同樣引發了流量的狂飆。

百度文心一言APP宣佈對全社會開放後12小時,迅速登上Apple Store免費應用排行榜首位。該應用自凌晨開放下載後,海量用戶涌入,一度引發排隊等待。百度官方對此迴應稱,“流量超預期”。

對此次文心一言面向C端消費者正式開放,李彥宏表示,“當文心一言向數以億計互聯網用戶大規模開放服務後,能夠獲得大量真實世界中的人工反饋,這將進一步改進基礎模型,並以更快速度迭代文心一言,創造更好的用戶體驗。”

狂飆200天,隨着更多國產大模型通過備案面向全社會開放,這場如火如荼的大模型之戰又將重新開始加速,決定權還是在市場和技術本身,也需要交給時間去檢驗。