原文來源:鯨選社pro
作者:楊曉鶴
圖片來源:由無界 AI生成
2023年,可能所有投資人都在問被投公司,“咱們能不能整個大模型?”
沒有互聯(lián)網(wǎng)公司想錯過這波大模型熱潮。在11月30日,ChatGPT迎來一周年之際,據(jù)百度CEO李彥宏先生所言,國內目前已經(jīng)涌現(xiàn)了230多個大模型。最直接的吸引力,就是OpenAI 公司估值瘋漲到900多億美金。
每家公司都在躍躍欲試,百億還是千億規(guī)模參數(shù),自研還是套殼技術,也許都沒那么重要,搞出來一個大模型開個發(fā)布會,還是非常必要的。
投資人催促,市場同行關注,客戶/用戶期待,這項CEO 1號工程從年初熱鬧到了年末,盡管李彥宏多次演講,重復造大模型是極大的資源浪費,都沒擋住國產(chǎn)大模型的數(shù)量,從年中到年底的數(shù)量翻了3倍。
這其中文心一言,通義千問,智譜ChatGLM等最早的大模型,還有混元/豆包等一系列重點項目,都吸引了大眾關注的目光。然而在輿論關注消退,一個現(xiàn)實問題擺在了企業(yè)面前,如何利用大模型賺錢?
“怎么來平衡技術和商業(yè)化中間的關系,也是投資人一直問的問題”。智譜AI CEO張鵬就在近期表達,“我們一直是堅持兩條腿在走,因為我們公司成立的第一天就有客戶、有收益,可能和我們的投入相比,目前還不夠自己覆蓋掉所有的成本?!?/p>
其實何止是創(chuàng)業(yè)公司,就是算已經(jīng)上市的大企業(yè),面對大模型長期投入,也在思考如何活下去?!个L選社Pro」根據(jù)市場上各大企業(yè)的大模型商業(yè)化選擇,歸納了賺錢4大流派??陀^說,大模型市場混沌時期,各種商業(yè)化探索都十分有益。
第一派:“自研派”vs“對標者”,生態(tài)是關鍵
前阿里巴巴CEO張勇曾指出,超萬億參數(shù)的大模型研發(fā)是一場“AI+云計算”的全方位競爭,囊括了算法、底層龐大算力、網(wǎng)絡、大數(shù)據(jù)、機器學習等諸多領域,是一項復雜的系統(tǒng)性工程。
因此,國內僅有BAT級別的超級玩家,通過自研千億乃至萬億參數(shù)的大模型,然后建立“AI+云計算”的生態(tài),輸出MaaS(平臺即服務)。
百度在3月份推出文心千帆平臺,業(yè)務內嵌在百度智能云生態(tài)。而文心一言則是文心千帆平臺上的大模型之一,此前數(shù)據(jù)顯示,文心千帆接入的第三方模型已經(jīng)達到45家。百度的目標是更多企業(yè)來到文心生態(tài)發(fā)展,就算不調用文心大模型API,也利用百度智能云的服務,百度通過這些底層服務能力做營收。
因此百度還設立獎金,組建了文心生態(tài)杯創(chuàng)業(yè)大賽。BuySmart等初創(chuàng)企業(yè)共同贏得了千萬獎金。
根據(jù)百度文心發(fā)布的公開數(shù)據(jù)顯示,截至今年8月,飛槳和文心生態(tài)已有800萬開發(fā)者。文心一言自8月31日面向全社會開放服務至今,用戶規(guī)模已超過7000萬。API是AI原生應用調用大模型的主要方式,其調用量比國內200多家大模型的調用量總和還要多。
國內另一大模型生態(tài)是阿里云魔搭社區(qū),據(jù)其運營人員成晨介紹,成立近一年,魔搭社區(qū)已有超過2300個模型,開發(fā)者超過280萬,模型下載次數(shù)也超過了1億多次。
據(jù)了解,文心大模型標準版收費0.8分/1000 tokens,對比OpenAI 看,每1,000個token收費0.002美元,據(jù)說ChatGPT每個問題付出的成本是0.03美元,收費遠不足覆蓋成本。
微軟小冰CEO李笛近期也介紹了類似案例,2018年,微軟小冰給羅森做了一個銷售助理,可以給2000萬的羅森用戶提供信息,“每次我們給羅森drive(調用)幾千萬次,但羅森只付我們10萬元人民幣,按照調用次數(shù)去計算價值?!?/p>
因此API的收入很難規(guī)?;?,尤其相比訓練等研發(fā)成本來說,API模式的收入杯水車薪。不過,API模式卻能促成平臺和生態(tài)企業(yè)的深度綁定,在此基礎上,百度阿里都有向客戶出售云服務的能力,這部分商業(yè)化更有前景。
與此同時,更多商業(yè)化路線也在對表OpenAI。國內很多公司也在基于ChatGPT的框架訓練,也在學習ChatGPT的C端規(guī)?;癄I收能力。
這其中李開復老師的零一大模型受到爭議較多,在被前阿里云首席科學家曝出“換名研發(fā)”后,很多人認為Yi-34B 大模型是套殼。零一公司內部有高管借助國外開源人士的反駁:架構是學術研究產(chǎn)物,數(shù)據(jù)集是自己從頭訓練的,這在開源領域是常見常規(guī)的事情。
字節(jié)此前被曝出違規(guī)使用OpenAI訓練自己的大模型,對此字節(jié)回應在4月公司引入GPT API 調用規(guī)范檢查后,這種做法已經(jīng)停止。
其實,國內從零開始研發(fā)大模型的也就只有三家公司——百度、阿里、智譜。其余皆在對標,這種對標程度深淺不一。不僅是研發(fā)對標學習,其實商業(yè)化也在對標學習。
文心一言的App,也有付費會員的選項,這部分是To C的營收。目前文心4.0的價格是連續(xù)包月49.9元,相比ChatGPT4 Plus每月20美元,價格僅為后者的3分之一左右,不過目前文心的會員數(shù)量還不詳,不清楚市場的付費意愿強度。
面向C端收費,這也是字節(jié)跳動在大模型領域的主要商業(yè)化模式,在云雀大模型的基礎上,瘋狂推出多款C端對話產(chǎn)品。字節(jié)在國內推出了對話產(chǎn)品「豆包」,海外上線 AI 產(chǎn)品「ChitChop」,同時豆包還有海外版本「 Cici 」。字節(jié)不同的事業(yè)部都在推出AI對話產(chǎn)品,其中豆包App 是抖音集團推出,所以目前在抖音上的投放很多。
無論純自研還是對標,未來二者都會贏得市場,最關鍵的是誰能建立商業(yè)化生態(tài),這才是下一階段淘汰賽中活下來的根本。
第二派:.開源VS閉源,如何殺出重圍?
移動操作系統(tǒng)中,最后僅剩兩家系統(tǒng):開源的安卓和閉源的蘋果。
而在大模型的競爭市場中,也存在開源和閉源之爭。相比ChatGPT 的閉源模式,一家公司建立研發(fā)到商業(yè)化的生態(tài)閉環(huán),開源大模型參與的玩家多來越多,聲量也越來越大。尤其年中 Llama 2宣布開源,更是將開源大模型推到輿論關注的前臺。
但在國外開源生態(tài)中,Llama2-70B和Falcon-180B等標桿模型為“有條件”開源,客戶的產(chǎn)品月活不能過億等,并因缺乏訓練數(shù)據(jù)在中文能力上有明顯短板。
這給了國外開源大模型的發(fā)展機會,智譜AI和百川智能是這類創(chuàng)業(yè)公司代表,阿里云則是大公司的代表。
智譜最早打起開源免費競賽,7 月 14 日,智譜 AI 和清華 KEG 宣布對 ChatGLM-6B 和 ChatGLM2-6B 完全開放,允許企業(yè)免費商業(yè)使用。根據(jù)智譜 AI 的官網(wǎng), ChatGLM2-6B 不限實例+不限推理或微調工具包的私有化報價為一年 30 萬。
王小川緊跟智譜打開源免費戰(zhàn)爭,百川智能相繼公布Baichuan-7B ?Baichuan-13B 開源免費可商用大模型。盡管市場上傳言百川基于LLM開源大模型,不過百川的數(shù)據(jù)訓練做得不錯,有企業(yè)評價中文環(huán)境下表現(xiàn)不錯。
綜合來看,創(chuàng)業(yè)大模型公司,免費開源是更明智的選擇。依靠開源這些參數(shù)規(guī)模較小的大模型,創(chuàng)業(yè)公司敲開客戶企業(yè)的大門以及市場的認知。
百川在服務一定企業(yè)的數(shù)量后,后續(xù)則推出閉源的大模型,王小川解釋稱:“模型變大之后沒有走開源的這樣一種方式,因為大家部署起來成本也會非常的高,就使用閉源模式讓大家在網(wǎng)上調用API”。
而智譜的商業(yè)化思考則比較獨辟蹊徑,“我最近也跟一些投資人在聊,國外真正的AI落地過程當中最明確的一個需求、一個場景就是代碼輔助,大概占整個付費意愿里面50%以上的場景?!睆堸i說道,“所以我們也在做類似的落地,我們有自己的代碼生成模型,目前在線上也向全球超過每天10萬的用戶去提供數(shù)千萬行代碼的生成能力?!?/p>
這相當于把大模型的某一方面能力鍛煉到極致,這一方面還正好是市場剛需,這樣大模型就具備了賺錢能力?!?strong>智譜AI在十分努力做商業(yè)化,可能籌備2025年登陸科創(chuàng)板。”一位投資人向AI鯨選社表示。
巨頭中,阿里扛起了開源的大旗。12 月 1 日,阿里云通義千問 720 億參數(shù)模型 Qwen-72B 宣布開源。至此,通義千問共開源 18 億、70 億、140 億、720 億參數(shù)的 4 款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,號稱實現(xiàn)了「全尺寸、全模態(tài)」開源。
根據(jù)公開數(shù)據(jù)顯示,阿里QWEN-7B開源一個多月下載量破100萬,9月25日升級了QWEN-14B;百川智能開源的Baichuan-7B、13B兩款開源大模型下載量目前已經(jīng)突破500萬,200多家企業(yè)申請部署開源大模型。
從以上數(shù)據(jù)看,開源大模型還是有不錯的潛力,市場還是比較認可。當然,核心的大模型產(chǎn)品,各家都選擇了閉源,這是個普遍的行業(yè)現(xiàn)狀。
唯一能改變這一現(xiàn)實的是,Meta正在加緊研發(fā)全新的開源大模型,支持免費商用,能力對標GPT-4,參數(shù)量比Llama 2還要大上數(shù)倍,計劃在2024年初開始訓練。
Meta之所以堅定的選擇開源,一方面按其安卓的開源思路繼續(xù)推進,另一方面也與其后發(fā)的大模型生態(tài),必須依靠開源生態(tài)推進,才可能挽回落后局面有關。
大模型中,閉源的蘋果,毫無疑問是Open AI,而開源的領軍人物是Meta還是其他企業(yè),還有待觀察。
第三派:通用VS垂直,誰才是未來?
當下看,通用大模型門檻高,沒有幾十億的資金體量很難做好自研和生態(tài)的工作。垂直大模型可以小到10億規(guī)模參數(shù),使用開源框架開發(fā)成本會更低,這給了初創(chuàng)公司機會。
所以在大模型火了半年時間后,行業(yè)就出現(xiàn)一個觀點爭論,那就是大模型是通用還是垂直才是未來。
近期,自媒體Will的統(tǒng)計數(shù)據(jù)顯示:目前國產(chǎn)188個大模型中:通用27個,金融16個,工業(yè)13個,媒體12個,客服11個,醫(yī)學10個,政務10個,教育9個,科研9個,大學28個,互聯(lián)網(wǎng)21個。
這意味著,研發(fā)難度較大的通用大模型屬于少數(shù),垂直大模型則占多數(shù)。比較知名的垂直大模型,例如京東發(fā)布了言犀大模型、京醫(yī)千詢大模型,攜程發(fā)布了攜程問道大模型,網(wǎng)易有道發(fā)布了基于教育的子曰大模型。
而在大模型垂直化路線中,沒想到最知名的企業(yè)是華為。
在世界人工智能大會上,華為輪值董事長胡厚崑闡述道:通過「5+N+X」的這三層大模型,華為云構建了自己的大模型底座。盤古 3.0 為客戶提供 100 億參數(shù)、380 億參數(shù)、710 參數(shù)和 1000 億參數(shù)的系列化基礎大模型。
由于外界沒有接觸到盤古大模型,所以對其真實能力,坊間有很多議論的聲音。華為沒有全部篤定在通用大模型,而是選擇與行業(yè)共同打造垂直行業(yè)大模型,目前已經(jīng)在盤古大模型基礎上,發(fā)布了7個垂直行業(yè)大模型。
有投資人表示,通用大模型可以用向量數(shù)據(jù)庫訓練,垂直領域表現(xiàn)就會出色。而垂直大模型,其實壁壘是用行業(yè)私有數(shù)據(jù)訓練大模型。
比如毫末智行推出了自己的自動駕駛大模型 DriveGPT。DriveGPT學習時長達到 103 萬小時,用戶使用輔助駕駛里程 8700 萬公里,正朝 1 億公里數(shù)據(jù)規(guī)模邁進。平臺將所有的真實道路駕駛數(shù)據(jù),并“翻譯”成統(tǒng)一的語言的DriveGPT雪湖·海若,利用這些數(shù)據(jù)訓練自動駕駛大模型,OpenAI 肯定不會喂給ChatGPT這么多道路數(shù)據(jù)。
當然,垂直大模型很難從頭做框架,這也是文心等平臺的另一塊重要收入,就是幫企業(yè)私有化大模型?!鞍賰|和千億兩個版本大模型,只要客戶方邏輯清晰,3個月測試,3-6個月即可落地,私有大模型部署成本在四五百萬元?!庇袃炔咳耸恐v述百度文心大模型的市場化。
朱嘯虎就提到,今年年初國內私有化部署大模型1000萬人民幣,年中500萬,現(xiàn)在不到100萬。私有化大模型和私有云一樣,是個買賣型生意。而因此誕生的垂直大模型,則可以在醫(yī)療、交通教育等等不同業(yè)務中落地。
對于垂直大模型,此前有人認為,做通用大模型能夠智能涌現(xiàn),垂直大模型則難以實現(xiàn)。而行業(yè)聲音則認為,垂直大模型利用獨有數(shù)據(jù)訓練,這是通用大模型再聰明也難以踏入的空白地帶。
其實這種通用和垂直大模型之爭,取決于ChatGPT等頭部玩家的進化速度。類似Q*的出現(xiàn),超級人工智能則不遠。超級人工智能可能會迅速覆蓋垂直大模型的能力,而如果大模型的進化速度不夠快,則是私有數(shù)據(jù)決定垂直大模型的效果更好。
第四派 ?大模型底座,支撐AIGC業(yè)務
過去的應用與產(chǎn)品,盡管已經(jīng)開始融入AI能力,但大模型帶來的AI能力,還是讓人眼前一亮。從2023年開始的這波AI熱潮中,借助AI升級的產(chǎn)品公司主要分為兩類。
第一類是巨頭公司,旗下?lián)碛卸鄠€數(shù)億用戶的互聯(lián)網(wǎng)產(chǎn)品。借助大模型升級,讓這些“傳統(tǒng)”的互聯(lián)網(wǎng)產(chǎn)品更性感。這類公司的代表是微軟、Adobe和百度等。
來源:《AI一年,人間10年》PPT
微軟由于一直投資OpenAI,在大模型應用領域也是近水樓臺先得月。率先將搜索應用Bing升級為大模型版的New bing,同時將大模型應用于edge瀏覽器和Office套件中,而且將copilot定義為未來系統(tǒng)級的AI 助手。
受AI繪畫沖擊明顯的Adobe,也在3月份的Adobe MAX 大會上,發(fā)布了3 款新一代的Firefly 模型:Adobe Firefly Image2 Model 、 Adobe Firefly Vector Model和Adobe Firefly Design Model,分別涉及圖像,矢量模型和設計領域。
自今年 3 月發(fā)布首個 Firefly 圖像模型以來,Adobe創(chuàng)意社區(qū)已使用該模型生成了 30 多億張圖像,其中僅上個月就生成了 10 億張。Adobe曾對外表示,不僅生成圖像的擴散模型是自研的,甚至文本生成的語言模型也是自研的。
不同于微軟垂直于對話和Adobe垂直于圖像領域,百度將其旗下幾乎所有業(yè)務都在通過AI重構,百度搜索、百度文庫、百度地圖、百度網(wǎng)盤等。盡管產(chǎn)品不同,本質上都是智能搜索,這是百度的起家領域。
綜合三家看,微軟受益大模型最明顯,在ChatGPT發(fā)布一周年之際,微軟過去一年市值增加了約8000億美元。而努力追趕AI浪潮的Adobe,過去一年,市值增加了約1700億美元。而百度市值則略降100億美元左右。
第二類是創(chuàng)業(yè)公司,他們本身擁有行業(yè)優(yōu)勢的AIGC業(yè)務,后續(xù)也推出了大模型業(yè)務,讓原本的AIGC業(yè)務更智能。
諸如數(shù)字人獨角獸公司硅基智能,在5月份發(fā)布了炎帝大模型,硅基智能將私有域知識用 LLM 大模型技術訓練,疊加硅基 AIGC 數(shù)字人技術。
近期,硅基還完成了首個AI化大V-知名科普作家嚴伯鈞。不同于常見的2D形象復制克隆人,本次將他以往發(fā)布的1400多條科普視頻、100多萬字的語料投喂給AI模型進行訓練,實現(xiàn)嚴伯鈞的肉體(形象、聲音、動作)+靈魂(知識、表達)的全部AI化,相當于形成了數(shù)字生命,并且這個生命還可以AI進化,這背后就是大模型的力量。
目前可以看到,AI嚴伯鈞每天可以高效地向全網(wǎng)1200萬粉絲傳播科普內容,而硅基的AIGC 數(shù)字人也已經(jīng)通過了圖靈測試,在不同領域做短視頻和直播。
美圖的修圖、設計等老本行,和AGI也十分相關。所以美圖在年中時候,發(fā)布了AI視覺大模型MiracleVision4.0版本,計劃2024年1月時期,將MiracleVision4.0版本將陸續(xù)應用于美圖旗下產(chǎn)品:美圖秀秀,美顏相機,Wink,美圖設計室,WHEE等App中。
美圖的視覺大模型,幾乎每兩三個月更新一代視覺大模型。通過體驗,實現(xiàn)了照片變漫畫、基礎海報AI設計等能力。但從Google的多模態(tài)大模型Gemini,被爆出宣傳效果實際經(jīng)過了剪輯造假,包括ChatGPT 4也在艱難地從語言大模型向多模態(tài)大模型能力進發(fā),可以看出視覺等大模型進化并不容易。
大模型并不是AIGC企業(yè)營收的關鍵,但卻是發(fā)展的必需品。正如國外的Jasper估值驟降為例,沒有大模型的AIGC將沒有壁壘,這在行業(yè)已經(jīng)形成了共識。
大模型商業(yè)化的征途上,各流派都在各顯身手。360公司曾經(jīng)公布,其公司大模型半年曾創(chuàng)造2000萬左右的營收。相比大模型的研發(fā)投入,其實這部分收入還比較小。各派的競爭,也沒有顯現(xiàn)出孰優(yōu)孰劣。
當然,商業(yè)化模式也不是最終壁壘,因為模式會很快被復制,只有能力是Copy不了的核心。