☰

首批8家大模型“持證上崗”，中國版OpenAI終將花落誰家？

作者｜閆妍

出品｜本站科技《態℃》欄目

今日凌晨，百度、百川智能等8家國產大模型通過首批備案，可面向全社會開放。

具體的企業機構包括：五家北京企業機構，百度（文心一言）、抖音（雲雀大模型）、智譜AI（GLM大模型）、中科院（紫東太初大模型）、百川智能（百川大模型）。以及三家上海企業機構，商湯（日日新大模型）、MiniMax（ABAB大模型）、上海人工智能實驗室（書生通用大模型）。阿里通義千問、360智腦、訊飛星火等均不在首批獲批名單中。

產品獲批後，8月30日晚23點前後，文心一言的APP已經能公開使用，此前則需要排隊領取內測資格。隨後，王小川的百川智能和商湯日日新大模型旗下自然語言應用“商量SenseChat”也宣佈向全社會全面開放，有信心拿出強有力的大模型產品，接受C端消費者的“用腳投票”。

今年年初，由現象級產品ChatGPT引發的AIGC浪潮，讓人們看到了人工智能技術給千行百業帶來的巨大的革新潛力，尤其是通用大模型這個萬億賽道，被認爲是最值得長期深耕的賽道。

半年多時間，國產ChatGPT之爭，歷史被一次次刷新。

政策層面，4月11日，國家互聯網信息辦公室發佈的關於《生成式人工智能服務管理辦法（徵求意見稿）》提出。8月15日，《生成式人工智能服務管理暫行辦法》正式施行，這也是我國首個針對生成式人工智能產業的規範性政策，大力支持國產大模型爲代表的人工智能產業的發展。

技術層面，國內過去在移動互聯網時代所積累的雲計算、數據中心、算力中心等領先全球的數字化基礎設施，爲AIGC的落地運行提供了堅實基礎。在中國，互聯網科技公司迅速點燃了“百模大戰”的硝煙，對於大模型和生成式AI的技術突破，近乎達到了白熱化的程度。

AI賽道風雲再起，誰將抓住下一個時代？中國版OpenAI，又將花落誰家？

李彥宏、王小川交手二十年再度重相逢

面對AIGC巨浪，李彥宏和王小川兩位大佬都展現了非凡的行動力。

在國內互聯網大廠中，百度今年3月率先推出文心一言並開啓邀測。當時，李彥宏就表示，生成式AI代表着新的技術範式，是任何企業都不應錯過的大機會。

百度方面曾表示，近十年，百度累計研發投入超1400億元，是應用、模型、框架、芯片四層全棧佈局的AI公司，並在各個層面都有關鍵自研技術。2022年百度核心研發費用214.16億元，佔百度核心收入比例達到22.4%。李彥宏在近日的電話財報會上還談到，年底將推文心大模型4.0版。

據瞭解，百度智能雲已經和300多個合作伙伴，在400多個具體的場景中取得測試效果。同時，百度文心大模型已擁有規模龐大的產業落地合作伙伴，覆蓋政務、互聯網、能源電力、汽車、消費電子、金融、教育、辦公等衆多重點行業。

這次與文心一言同時獲批上線的，還有李彥宏20年的老對手王小川。在搜索引擎、輸入法、瀏覽器等領域交手多番後，雙方於2023年重逢大模型新戰場。

百川智能成立於2023年4月10日，由前搜狗公司CEO王小川創立。公司核心團隊由來自搜狗、百度、華爲、微軟、字節、騰訊等知名科技公司的AI人才組成。

王小川曾向本站科技《態℃》欄目等媒體表示，百模大戰下，一起起步的公司動輒5億美金估值，第二輪可能就是10億美金的狀態，這個競爭不是“小清新”狀態，而是要迅速投入到這場大戰役之中。“更多的大廠、更多的錢、更多人、更多的算力互相卷，這種情況下要迅速形成戰鬥力，因此優先把搜狗的老班底拉起來，大家能迅速磨合，才能適應這麼大的挑戰。”

成立僅四個月，百川智能便相繼發佈了三款通用大語言模型。此前6月和7月，先後發佈了70億參數的 baichuan-7B和130億參數的 baichuan-13B 後，在8月8日發佈了530億參數的大模型 baichuan-53B。

王小川談到，中國誰做了最好的大模型，還沒有結論。“我們跟美國不太一樣，美國通用大模型閉源模型頭部幾家已經定下來了，OpenAI的ChatGPT有了，Google有一張門票，在美國做通用大模型已經沒有懸念，投資也不會再去投。但是在中國不是，中國誰做出了最好的大模型並沒有結論，大家都在爭取的機會，且不一定落在大廠裡面。”

在他看來，歷史上每次發生大的變化，都有創業公司的機會。創業公司會比大公司跑得快，爲什麼會不行？

大模型能力誰優誰劣衆說紛紜

伴隨AI產業的火爆，國內AI相關模型、產品、平臺不斷涌現，據公開資料顯示，國內市場在半年時間裡已發佈近百個AI大模型，共同掀起一場“百模大戰”，但大模型能力誰優誰劣，各項評估報告給出的結果衆說紛紜。

近期，IDC發佈的《AI大模型技術能力評估報告，2023》，嘗試爲這個問題找到一些解決方案。該報告創建了一個AI大模型技術能力的評估模型，並對國內14家廠商的大模型能力進行了評估。

評估模型主要分爲三個維度，產品技術、服務生態以及行業應用三大維度。其中，產品技術又細分爲算法模型能力、通用能力、創新能力、平臺能力、安全可解釋；服務生態，細分爲服務能力和生態合作；行業應用則主要看行業覆蓋能力。

國內主流大模型，包括百度、阿里、騰訊、華爲、科大訊飛、360、商湯等14家廠商參與了本次評估。百度、阿里巴巴、科大訊飛、智譜AI的各項指標表現如下：

其中，百度文心大模型3.5拿下12項指標的7個滿分，並且綜合評分第一，算法模型第一，行業覆蓋第一。

文心一言自今年3月發佈至今快速成長，熟練掌握的創作體材超過200個，內容豐富度是發佈初期的1.6倍，思維鏈長度是初期的2.1倍，知識點覆蓋達到初期的8.3倍。效率方面，通過飛槳端到端自適應混合並行訓練技術以及壓縮、推理、服務部署的協同優化，文心大模型訓練速度達到原來的3倍，推理速度達到原來的30多倍。

而在SuperCLUE（中文通用大模型綜合性測評基準）公佈的8月榜單，百川智能的Baichuan-13B一舉拿下國內大模型評測榜首，緊隨其後的是Minimax-abab5和百度文心一言，三家大模型產品體現了高質量數據處理、算法優化方面的出色能力。

值得注意的是，Minimax也是如今國內估值最高的大模型初創公司之一。據路透6月報道，Minimax完成了新一輪2.5億美元融資後，整體估值超過12億美元。

Minimax成立於2021年，由前商湯科技副總裁、通用智能技術負責人閆俊傑成立。Minimax已經發布了包括文本到視覺/語音/文本三個基礎模型架構，推出自研通用大模型“ABAB”，以及虛擬聊天軟件Glow、生成式對話AI產品Inspo等。

在王小川看來，今天不管是十家、百家、千家參與，最後一定要看兩件事情：

第一個，是否能拿出足夠好的AGI來，能與GPT3.5、GPT4去比肩，這件事情大家都有相應的距離，我們現在也沒做到，往下看今年內有哪些企業能達到3.5甚至逼近4的能力。

第二個，是否能做出超級應用來。有可能中國的超級應用會比美國跑得快，中國做科學問題會差一些，但是應用是我們的強項，能夠優先達到國際水平。

創新與監管，ChatGPT被控侵權等六大罪

AIGC實現了人類的創造力從1提升到100的飛躍，但AIGC的發展與治理還有許多問題和風險仍待解決，包括算法缺陷、倫理問題、版權問題、信息安全等等。

大洋彼岸，人工智能研究公司OpenAI本週迴應了兩起幾乎相同的集體訴訟，這些訴訟的原告包括多位作家。他們聲稱，ChatGPT接受了他們被盜版書籍的培訓，侵犯了他們作品的版權。

對此，OpenAI聲稱，原告“誤解了版權覆蓋的範圍，沒有考慮到限制和例外(包括合理使用)情況。而這些限制和例外適當地爲創新留出了空間，比如現在處於人工智能前沿的大語言模型。”

根據OpenAI的說法，即使上述作家的書籍只是ChatGPT龐大數據集的“一小部分”，“創新者以變革方式使用受版權保護的材料也並未侵犯版權”。與那些試圖通過分發受版權保護的材料直接獲利的剽竊者不同，OpenAI辯稱，它的目標是“教會其大模型推導出人類語言背後的規則”，以此來幫助人們“節省工作時間”、“讓日常生活變得更輕鬆”，或者通過在ChatGPT中輸入提示來自娛自樂。

在此之前，OpenAI的CEO Sam Altman就AI監管問題還參加了美國國會聽證，討論的核心要點之一便是版權問題。對此，Sam Altman表示，OpenAI將會拿出保護地方新聞業的相關舉措，但也沒有具體迴應如何在AI模型訓練過程中保護內容創作者版權權益的問題。

Sam Altman還表示，目前 AI 技術處於早期階段，仍會出現錯誤。如果 AI 技術出了問題，後果會相當嚴重，尤其 AI 不是社交媒體，它需要不同的應對方式。他呼籲政府對 AI 技術應進行更嚴厲的監管，並表示OpenAI以及谷歌等同行都應當承受壓力。

但風險的另一面則是巨大的機遇。

ChatGPT在發佈之後至今七個多月的時間裡，一直維持着令人“頭暈目眩”的增長。在發佈後的短短第5天，ChatGPT就獲得了100萬用戶；又過了兩個月，ChatGPT邁過了1億用戶大關，成爲有史以來達成這兩項指標最快的產品。

雖然ChatGPT的流量在6月份環比下滑了10%，但其絕對值仍然高達16億次。在SimilarWeb的網站排名中，ChatGPT位列全球網站流量排行榜第17名。

國產ChatGPT面向公衆開放後，同樣引發了流量的狂飆。

百度文心一言APP宣佈對全社會開放後12小時，迅速登上Apple Store免費應用排行榜首位。該應用自凌晨開放下載後，海量用戶涌入，一度引發排隊等待。百度官方對此迴應稱，“流量超預期”。

對此次文心一言面向C端消費者正式開放，李彥宏表示，“當文心一言向數以億計互聯網用戶大規模開放服務後，能夠獲得大量真實世界中的人工反饋，這將進一步改進基礎模型，並以更快速度迭代文心一言，創造更好的用戶體驗。”

狂飆200天，隨着更多國產大模型通過備案面向全社會開放，這場如火如荼的大模型之戰又將重新開始加速，決定權還是在市場和技術本身，也需要交給時間去檢驗。

首批8家大模型“持證上崗”，中國版OpenAI終將花落誰家？

相關資訊