
「這個(gè)世界不愁錢,缺的是最好的創(chuàng)業(yè)者和最好的創(chuàng)業(yè)公司」
一年多來,宋春雨頻繁跟他見到的創(chuàng)業(yè)者說,「你們這些做人工智能的專家(包括工業(yè)界、學(xué)術(shù)界),如果這個(gè)時(shí)代不去做 AGI,就是枉費(fèi)人生!」
這位在聯(lián)想創(chuàng)投專門負(fù)責(zé)看 AI 的合伙人,旗幟鮮明地稱自己是「技術(shù)信仰派」,跟朱嘯虎這樣的「現(xiàn)實(shí)派」不是一類人:比如,他堅(jiān)信基礎(chǔ)大模型才是戰(zhàn)略制高點(diǎn),未來超級(jí)應(yīng)用 95% 的能力都來模型本身;他堅(jiān)信開源模型追不上閉源模型,用單一集群萬卡訓(xùn)出來的萬億參數(shù)多模態(tài)大模型才是通往 AGI 的最佳路徑;他并不太在意「商業(yè)化賺錢」,認(rèn)為 AI 公司的首要目標(biāo)應(yīng)該是跟上 AGI 的技術(shù)創(chuàng)新。
這種觀點(diǎn)在當(dāng)下的投資人里并不常見。大模型是難以算過賬的商業(yè)模式,前期資金消耗無止盡,但模型效果、領(lǐng)先性并不確定,且其商業(yè)化路徑還不明朗、成本收回遙遙無期。對(duì)于身處資本緊縮環(huán)境的投資機(jī)構(gòu)來說,它們很難支持這么昂貴、不確定的生意。宋春雨也承認(rèn)這一點(diǎn),他說多數(shù)人要算 revenue(營收),自己是絕對(duì)的「少數(shù)派」。
然而,一個(gè)矛盾不由得浮現(xiàn):既然信仰基礎(chǔ)大模型,為什么不出手?
在大模型火熱的這一年多時(shí)間,宋春雨沒有投任何一個(gè)基礎(chǔ)大模型公司,而是投了一些垂直模型、開源社區(qū)、上層應(yīng)用,以及算力芯片公司。對(duì)此,他的解釋是,需要時(shí)間看清楚,哪家大模型團(tuán)隊(duì)更有通向 AGI 的實(shí)力?!溉绻辞宄?,我們肯定會(huì)毫不猶豫地出手?!?/p>
那時(shí)間點(diǎn)會(huì)是什么時(shí)候?他說,2024 年中國大模型競(jìng)爭(zhēng)會(huì)迎來分水嶺,這會(huì)是出手的時(shí)機(jī)。這時(shí)昂貴的估值是否能接受?他說,沒有給錢的「上限」,回報(bào)也暫不考慮,「你只能相信它,星辰大海」。
作為投科技十余年、身處中國最老牌科技公司的技術(shù)向投資人,宋春雨累計(jì)投資超過 50 家 AI 相關(guān)企業(yè),包括寒武紀(jì)、第四范式、深城交、曠視等頭部公司。他說,自己對(duì)技術(shù)的相信一直是非共識(shí)。
2011 年他天使輪投資曠視時(shí),AI 還是冷門賽道,四年后 AlphaGo 才點(diǎn)燃風(fēng)口;2017 年投寒武紀(jì)時(shí),AI 芯片的前景尚不明朗;而 2020 年到 2022 年,中國 AI 迎來「至暗時(shí)刻」——資本不斷質(zhì)疑「AI 四小龍」做 ToB 難以規(guī)?;?、毛利差,市場(chǎng)上沒有人投 AI。但他卻加碼了 5、6 個(gè) AI 項(xiàng)目,包括思謀科技、瀾舟科技、摩爾線程、此芯科技等。
這是一種有趣的選擇:在 AI 的至暗時(shí)刻選擇加注,卻在 AI 的狂熱時(shí)刻選擇冷靜。在他身上,或許能看到那些懂技術(shù)、且信仰技術(shù)的中國科技投資人在當(dāng)下的選擇與顧慮。
用他自己的話說,技術(shù)出身(他最早是聯(lián)想集團(tuán)的一名工程師)給他帶來的影響是,他傾向于先把一個(gè)事看透、接著選擇最好的標(biāo)的。而身處一家資金充裕、對(duì)商業(yè)化回報(bào)更寬容的 CVC(企業(yè)風(fēng)險(xiǎn)投資),或許是他選擇的底氣。某種程度上,他的選擇也反映了聯(lián)想在 AI 時(shí)代的選擇。
不過他也認(rèn)為,技術(shù)信仰會(huì)越來越成為投資圈「共識(shí)」,「這個(gè)世界不愁錢,缺的是最好的創(chuàng)業(yè)者和最好的創(chuàng)業(yè)公司?!篃o論怎樣,他所講的技術(shù)信仰和理想主義,對(duì)中國的 AGI 之路來說并不是壞事。至少,它為創(chuàng)業(yè)者提供了最寶貴的信心、想象力和燃料。
以下是宋春雨對(duì)于基礎(chǔ)大模型的技術(shù)路線、AI 各賽道的機(jī)會(huì)、以及技術(shù)周期和資本等的看法,或許能為行業(yè)帶來一些思考、碰撞。
對(duì)話經(jīng)極客公園整理后發(fā)布:
通往 AGI 有多條路徑,最看好萬億參數(shù)多模態(tài)大模型
極客公園:聽說你最近一直在國外,能不能講一下你在國外看到的AI進(jìn)展或者動(dòng)態(tài)?
宋春雨:聯(lián)想是一家國際化公司,所以我們一直在全球看人工智能和大模型的演進(jìn)過程。其實(shí)我們看到,中國和美國都在分別組織整個(gè)產(chǎn)業(yè)界往 AGI 走,我們堅(jiān)信人類終會(huì)迎來硅基智能、新物種爆發(fā)的時(shí)刻。
從大模型的角度講,我們認(rèn)為下一代大模型突破的主線就是原生多模態(tài)。大家看到 OpenAI 發(fā)布的 Sora,它不只是文生文,而是創(chuàng)造了一個(gè)視覺、語言完全融合的新世界。我們認(rèn)為,視覺模型和語言模型會(huì)合二為一,形成一個(gè)統(tǒng)一的、最強(qiáng)大的基礎(chǔ)模型。
極客公園:所以你覺得,Sora 代表的多模態(tài)路線會(huì)比單純的語言文本路線更重要?
宋春雨:第一更加重要,第二更加復(fù)雜、門檻更高。
首先在數(shù)據(jù)層面,語言模型訓(xùn)練的數(shù)據(jù)集是有限的,就是互聯(lián)網(wǎng)上人類產(chǎn)生的所有文本,任何一家公司如果有資源都能觸及。但在多模時(shí)代,訓(xùn)練的樣本和訓(xùn)練的數(shù)據(jù)要靠大模型去生成,或者像自動(dòng)駕駛一樣讓機(jī)器去理解和吸收物理世界的數(shù)據(jù)。這個(gè)難度非常非常大。
其次在算力層面,多模態(tài)對(duì)算力的要求要 10 倍于文本。比如 GPT-3.5 這個(gè)水平,基本上千卡就可以了。但在多模大模型的時(shí)代,GPT-4 級(jí)別的訓(xùn)練需要單一集群萬卡,這是入門門檻。所謂單一物理集群萬卡,就是說你不能把各個(gè)地方,比如內(nèi)蒙、上海、西安等地的幾千塊卡集聯(lián)起來做萬卡集群,而是要一個(gè)地方的。這也非常非常難。
另外在算法方面,目前語言模型和視覺模型還是兩個(gè)框架的模型,而且多模模型沒有任何開源。這也導(dǎo)致它的實(shí)現(xiàn)難度非常大。
極客公園:你怎么看王小川說,他不看好 Sora、也不想走多模態(tài)路線?
宋春雨:我們認(rèn)為在中國的基礎(chǔ)大模型牌桌上,各家公司在 2024 年會(huì)圍繞自己的優(yōu)勢(shì)領(lǐng)域,做出分化和選擇。
比如有一類就主攻多模態(tài)、還有一類會(huì)圍繞行業(yè)的應(yīng)用去做垂域模型、還有一類企業(yè)圍繞 To C 迭代出字節(jié)抖音這類產(chǎn)品、還有一類就像小川這樣以語言模型為核心專注醫(yī)療垂直應(yīng)用領(lǐng)域等等。
極客公園:看好原生多模態(tài)這個(gè)觀點(diǎn),你們是不是還算比較獨(dú)特?
宋春雨:是。我跟你分享一下為什么,就是因?yàn)樘魬?zhàn)難度太大了,很多人提了可能做不出來。
極客公園:為什么對(duì)OpenAI來說,剛畢業(yè)的幾個(gè)博士生就可以做出 Sora?
宋春雨:因?yàn)樗呀?jīng)有一個(gè)萬億參數(shù)的大模型,它是在一個(gè)巨人的肩膀上做這件事。但它的對(duì)手 Pika 就沒有一個(gè)萬億模型,只能在一個(gè)小模型上去做,這個(gè)能力差距太大了。
Sora 生成的「咖啡里的海盜船」視頻|圖片來源:OpenAI 官網(wǎng)
極客公園:對(duì)多模態(tài)的相信,是不是跟你們投過上一波視覺模型(如曠視科技)有關(guān)系?
宋春雨:是。我們很早就意識(shí)到,雖然大模型是從語言模型開始,但未來一定是視覺和語言統(tǒng)一的新架構(gòu)。
包括在 Sora 出來之前,我們就知道 OpenAI 在做這個(gè)了。我們當(dāng)時(shí)就推測(cè),OpenAI 依靠萬億級(jí)超級(jí)大模型,最后肯定要秒殺 Pika 的。最后果然不出所料。
另外 OpenAI 有完整的多模態(tài)數(shù)據(jù)工具鏈,可以生成高質(zhì)量的多模態(tài)視頻數(shù)據(jù),同時(shí)其萬億參數(shù)大模型對(duì)于物理世界的理解更加真實(shí)和準(zhǔn)確,也會(huì)幫助 Sora 的視覺效果更加真實(shí)。
極客公園:你們內(nèi)部會(huì)有反對(duì)觀點(diǎn)嗎?
宋春雨:我們是通過去年一年的觀察,慢慢形成了這個(gè)觀點(diǎn)。內(nèi)部也有不同的聲音,但大家最后從各個(gè)維度討論、直到統(tǒng)一了思想。
極客公園:在多模態(tài)這條路線上,你們發(fā)現(xiàn)好的標(biāo)的了嗎?
宋春雨:有一些很好的標(biāo)的,我們都在做評(píng)估。
極客公園:你們會(huì)在目前排名前四的大模型公司中挑選,還是有更多可能?
宋春雨:不只是這些,比這些要多。我們那個(gè)圈子劃得還是挺大的。
2024 年中國基礎(chǔ)模型可能會(huì)迎來一個(gè)大的分水嶺——它的標(biāo)志是,誰會(huì)發(fā)萬億模型、誰代表了多模態(tài)、誰能跨過 GPT4 的水平。這是我們投資整個(gè)大模型領(lǐng)域的邏輯,聯(lián)想的 AI PC 戰(zhàn)略也是需要和這樣的公司合作。
基礎(chǔ)大模型「信仰派」,卻沒有出手任何一家
極客公園:你一直在提基礎(chǔ)大模型,你屬于「技術(shù)信仰派」嗎?
宋春雨:我是技術(shù)信仰派。前一段朱嘯虎談到,他不投大模型、只投應(yīng)用,我們的觀點(diǎn)跟他是不同的,我們認(rèn)為大模型就是最大的超級(jí)應(yīng)用。
Sora 給全球的創(chuàng)業(yè)者帶來了一個(gè)巨大啟示:它僅靠應(yīng)屆博士生帶領(lǐng)的小團(tuán)隊(duì),就打敗了 Pika 和 Runway,這是因?yàn)樗驹谌f億參數(shù)大模型的基礎(chǔ)上,才能更好地理解物理規(guī)律、生成的視頻才遠(yuǎn)超其他家。
我們認(rèn)為在未來的人工智能時(shí)代,基礎(chǔ)大模型才是戰(zhàn)略制高點(diǎn)。只有擁有一個(gè)超級(jí)強(qiáng)的大模型,才有可能誕生 Super APP,并構(gòu)建數(shù)據(jù)、模型、應(yīng)用的商業(yè)閉環(huán)。
極客公園:所以上層應(yīng)用的價(jià)值主要取決于基礎(chǔ)大模型的技術(shù)?
宋春雨:如果說互聯(lián)網(wǎng)時(shí)代應(yīng)用的本質(zhì)是「連接」,比如美團(tuán)是把線上和線下連接。那大模型時(shí)代的應(yīng)用是「智力」,它對(duì)外輸出的是硅基智能,它 95% 的能力都在大模型里,應(yīng)用只是起到表層交互的作用。大模型本身就是硅基智能時(shí)代的 Super APP。
在過去的移動(dòng)互聯(lián)網(wǎng)時(shí)代,字節(jié)跳動(dòng)依靠一個(gè)高維參數(shù)的推薦引擎,迭代出了今日頭條、抖音、TikTok 等超級(jí)應(yīng)用。那在今天的 AI 時(shí)代,我們也相信通過大模型的引擎,會(huì)出現(xiàn)下一個(gè)像今日頭條、TikTok 這樣的超級(jí)應(yīng)用。
AI1.0 時(shí)代即移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們有「TMD」(頭條、美團(tuán)、滴滴),其中頭條商業(yè)效率最高?,F(xiàn)在 AI2.0 時(shí)代的效率理論上還將更高。
極客公園:那你是不是不看好目前一些依靠開源模型做應(yīng)用的公司?
宋春雨:并非不看好,那些可能只是一個(gè)「業(yè)務(wù)」,等基礎(chǔ)大模型一升級(jí),它們可能馬上就沒有太多的價(jià)值了。因?yàn)閯?chuàng)業(yè)公司一旦收斂之后,根本跟不了萬億以上模型的創(chuàng)新能力。
開源模型的核心價(jià)值還是在垂直領(lǐng)域,開發(fā)者可以快速優(yōu)化,在其領(lǐng)域形成商業(yè)閉環(huán)和應(yīng)用價(jià)值,但其本質(zhì)并不是基礎(chǔ)大模型。
極客公園:開源模型一定比不上閉源模型嗎?
宋春雨:開源一定會(huì)比閉源落后。此開源非彼開源,之前所謂的開源就是代碼,運(yùn)行起來就完事了。但這一輪人工智能是,你要通過單集群萬卡把它(模型)和高質(zhì)量數(shù)據(jù)訓(xùn)一遍,一般的公司哪有這個(gè)能力?即使是開源模型,真正能駕馭的公司也是很少的。
所以為什么那些公司開源,因?yàn)樗篱_了也無所謂,能把開源復(fù)現(xiàn)、真正用起來的公司注定是少數(shù)。
極客公園:你這么相信基礎(chǔ)大模型,為什么卻一家都沒有投?
宋春雨:我們其實(shí)每一輪都在看,但我們確實(shí)需要時(shí)間去看清楚,哪家大模型團(tuán)隊(duì)更有通向 AGI 的實(shí)力。目前已經(jīng)在快速收斂中,2024 年會(huì)是中國大模型的分水嶺,能趕超 GPT-4 就有機(jī)會(huì)上 AGI 的牌桌,做不到的就會(huì)分化、下沉下來用開源做垂域大模型。
一旦這些公司中有誰能讓我們看到,它具備引領(lǐng)中國基礎(chǔ)大模型的研發(fā)實(shí)力,我們肯定會(huì)毫不猶豫地出手。有時(shí)候讓子彈飛一會(huì),也未嘗不是一件好事。
極客公園:這個(gè)時(shí)間點(diǎn)大概是什么時(shí)候?
宋春雨:2024 年大分水嶺出現(xiàn)的時(shí)候。
極客公園:但這時(shí)候這些公司已經(jīng)很貴了。
宋春雨:是很貴,估值體系非常顛覆原來的范式。當(dāng)年我們投資曠視才幾千萬人民幣的估值,但是現(xiàn)在大模型公司的天使輪可能都 3、5 億美金起,小川是 10 億美金起。確實(shí)沒辦法。
極客公園:你們有一個(gè)給錢的上限嗎?
宋春雨:我們沒有。
極客公園:那回報(bào)怎么辦?
宋春雨:目前依然是早期,但 AGI 前景,堪比第四次工業(yè)革命。你要說回報(bào)預(yù)期真的不敢說,你只能相信它,星辰大海。
非共識(shí)的投資觀:賺錢、商業(yè)化不是最重要的
極客公園:你投了「海納AI」這種 AI 應(yīng)用,背后的邏輯是什么?
宋春雨:我覺得這類應(yīng)用如果能在小模型的基礎(chǔ)上,快速構(gòu)建對(duì)一些行業(yè)的數(shù)據(jù)獨(dú)占,是有機(jī)會(huì)的。
海納的數(shù)據(jù)不是在互聯(lián)網(wǎng)上能拿到的,而是要一個(gè)客戶一個(gè)客戶地合作,比如順豐、沃爾瑪百萬級(jí)員工的面試都會(huì)用到它,這個(gè)數(shù)據(jù)壁壘就構(gòu)建起來了。在某些特定工種,如藍(lán)領(lǐng)、程序員的批量面試,海納 AI 已經(jīng)可以 100% 機(jī)器代替 HR 完成面試。
極客公園:怎么看目前的應(yīng)用生態(tài)?
宋春雨:從美國來看,大模型應(yīng)用正處于新物種大爆發(fā)的風(fēng)起云涌時(shí)代。A16Z 最新發(fā)布的報(bào)告顯示,按用戶使用時(shí)長、下載量排名的 AI 應(yīng)用榜上,已經(jīng)比半年多出了 40% 的新面孔。但由于基礎(chǔ)模型的原因,中國的應(yīng)用還沒有到大爆發(fā)階段。
2024 年 3 月,a16z 發(fā)布了排名前 50 的 Gen AI 產(chǎn)品榜單。與 2023 年 9 月相比,超過 40% 的上榜公司都是新公司|圖片來源:a16z
極客公園:現(xiàn)在很多投資人看好上層應(yīng)用,因?yàn)樗鼈兩虡I(yè)化很好。
宋春雨:我們更看重的是,這些公司是否能追趕、甚至能在硅基智能時(shí)代齊頭并進(jìn)。這一波的公司首先要能跟上硅基智能的創(chuàng)新,其次才是去考慮賺錢的事。短期的商業(yè)化只是一個(gè)參考。
極客公園:你相信技術(shù)一定能賺到錢嗎?
宋春雨:我們有信心。比如 OpenAI,它在發(fā)布 GPT3.5 之前根本沒有任何的商業(yè)化,它就一直在追趕這件事。但一旦突破那個(gè)技術(shù)點(diǎn),我堅(jiān)信就一定能賺錢。而且未來 AI 算力的成本會(huì)大幅下降,肯定會(huì)在其中找到一個(gè)(盈利)平衡點(diǎn)。
極客公園:你跟創(chuàng)業(yè)者也會(huì)這么講嗎?
宋春雨:我也會(huì)這么講。
極客公園:可以分享一段你跟創(chuàng)業(yè)者的講話嗎?
宋春雨:我跟大家都這么說。無論是在工業(yè)界還是在學(xué)術(shù)界,我說你們這些做人工智能的專家,如果這個(gè)時(shí)代不去做 AGI,就是枉費(fèi)人生。
極客公園:今天像你們這樣有著強(qiáng)烈技術(shù)信仰的大模型投資人,算是少數(shù)派還是多數(shù)派?
宋春雨:我們這么技術(shù)派的(投資人),可能還處于一個(gè)非共識(shí)狀態(tài)。
很多人都是要看 revenue(營收)。在美國也是一樣,公司一到 10 億、20 億美金(估值)就比較難,因?yàn)橥顿Y人的壓力很大,它們要考慮商業(yè)化這些問題。
極客公園:為什么你們會(huì)是少數(shù)派?
宋春雨:其實(shí)我做投資這么多年,包括投上一波 AI 也基本是非共識(shí)。比如 2012 年我投曠視的時(shí)候,產(chǎn)業(yè)界都沒有投的。2018 年我投寒武紀(jì)的時(shí)候,當(dāng)時(shí) GPU 還很少用在 AI 上。2022 年上半年往前數(shù)兩年,那是中國 AI 的至暗時(shí)刻,當(dāng)時(shí)所有的社會(huì)輿論、資本市場(chǎng)都質(zhì)疑中國的「AI 四小龍」,做 2B、毛利不好、燒錢,整個(gè)市場(chǎng)沒有人投 AI。但那兩三年,我們基本上投了 5、6 個(gè) AI 項(xiàng)目。
當(dāng)時(shí)我們堅(jiān)定投思謀,把 AI 和傳統(tǒng)行業(yè)深度整合起來;我們還投了周明;在大家對(duì)算力根本沒那么認(rèn)可的情況下,我們投了摩爾線程、此芯科技。都是在至暗時(shí)刻投的。
我們堅(jiān)信基礎(chǔ)大模型是關(guān)鍵的成功要素,它需要極高的人才密度、極強(qiáng)的算力儲(chǔ)備、創(chuàng)始人極大的產(chǎn)業(yè)號(hào)召力等等,所以必定也是技術(shù)少數(shù)派。
極客公園:你們的技術(shù)信仰來自于什么呢?
宋春雨:跟我們的技術(shù)背景有關(guān)系。
老賀(注:聯(lián)想創(chuàng)投總裁賀志強(qiáng))和我都是聯(lián)想研究院出身,他是聯(lián)想研究院的 CTO,我是聯(lián)想研究院的研究室主任、當(dāng)時(shí)負(fù)責(zé)虛擬化和信息安全。我們這種技術(shù)基因的傾向是,先把一個(gè)事看透、想明白了之后,就選擇最好的標(biāo)的。
極客公園:從本質(zhì)上說,CVC 對(duì)盈利性的寬容,是不是你們底氣的來源?
宋春雨:對(duì),因?yàn)槲覀儯?lián)想)的生態(tài)資源本身就是對(duì)創(chuàng)業(yè)公司最大的賦能,它一下就解決了商業(yè)化的大瓶頸,所以我們的考慮會(huì)更寬容。
擁有獨(dú)占數(shù)據(jù)的垂直模型和垂直應(yīng)用,也有機(jī)會(huì)
極客公園:你也投了瀾舟科技這樣的垂直模型公司,這是為什么?
宋春雨:我們認(rèn)為 2B 的垂域模型和 2C 的終端個(gè)人模型也同樣有價(jià)值。如果這些企業(yè)能圍繞模型和數(shù)據(jù),迭代出各自領(lǐng)域的超級(jí)應(yīng)用,我們也非常愿意投資。
瀾舟有自己獨(dú)占的數(shù)據(jù)。我覺得周明老師(注:瀾舟科技創(chuàng)始人)圍繞金融、互聯(lián)網(wǎng)營銷等的切入點(diǎn)是完全對(duì)的,他在這些領(lǐng)域的 know-how 也很深。對(duì)標(biāo)美國,垂域模型的創(chuàng)新也有非常多好的案例。我覺得他是能夠跑出來的。
極客公園:所以除了基礎(chǔ)大模型之外,你也相信其他模型的價(jià)值?
宋春雨:未來是基礎(chǔ)模型、垂域模型和個(gè)人大模型混合的一個(gè)時(shí)代。
比如 Mistral(歐洲模型公司)很典型,它做的是小模型和中模型,不是做超級(jí)大模型,它可能在垂直行業(yè)的閉環(huán)速度最快,最后會(huì)進(jìn)到自己的優(yōu)勢(shì)領(lǐng)域迭代。
極客公園:你也投了歐洲的垂直大模型公司,也是看重?cái)?shù)據(jù)嗎?
宋春雨:是的,因?yàn)闅W洲要求數(shù)據(jù)和 AI 訓(xùn)練的 infra 都要在歐盟內(nèi)。大模型是先進(jìn)生產(chǎn)力,我覺得未來大的地域都會(huì)有自己的大模型,歐洲會(huì)出,日韓也可能會(huì)出。
極客公園:你為什么會(huì)投兩個(gè)開源模型社區(qū)?
宋春雨:我們也是有非常戰(zhàn)略的考慮。那些垂直領(lǐng)域的中小模型可以通過開源模型做,而閉源是沖著超級(jí)大模型去的,沒必要做這部分長尾市場(chǎng)。
所以未來開源肯定會(huì)占一席之地。世界范圍內(nèi)這個(gè)比重是五五開,中國和其他國家有很大的區(qū)別,最終比重還沒定論。但我們堅(jiān)信中國肯定有 Hugging Face(美國開源社區(qū))的機(jī)會(huì)。
極客公園:阿里的魔搭、百度的千帆都想做開源模型社區(qū),創(chuàng)業(yè)公司的機(jī)會(huì)是什么?
宋春雨:比如 [JJR1] 要幫客戶部署模型的時(shí)候,它們(大廠)肯定偏向于用自家的模型。創(chuàng)業(yè)公司會(huì)更客觀。
極客公園:大廠可以通過算力掙錢,模型社區(qū)怎么賺錢?
宋春雨:戰(zhàn)略價(jià)值是最大的。你看 Hugging Face 的報(bào)表,它沒怎么賺錢,但它是百億美金級(jí)別的戰(zhàn)略性公司。你看微軟收購的 GitHub(開源的代碼管理公司),它也不賺錢,但它有 300 億美金的估值。
另外我對(duì)創(chuàng)始人還挺有信心的,他肯定能把公司變成賺錢的,就是不要太急。
算力是唯一確定性的賽道,看好計(jì)算架構(gòu)的創(chuàng)新
極客公園:算力是你投得最多的,這是因?yàn)樗拇_定性最大嗎?
宋春雨:確實(shí)算力是唯一確定性的要素,它是硅基智能時(shí)代的水、電、煤。這也是我們投資的核心關(guān)注點(diǎn)。
極客公園:由于英偉達(dá)芯片的限制問題,你對(duì)算力的投資是國產(chǎn)替代邏輯嗎?
宋春雨:倒不完全是。一方面,我們確實(shí)處于 AI 算力不足的階段,所以對(duì)于現(xiàn)在能提供和英偉達(dá)相等計(jì)算能力的芯片公司,我們是非常非常關(guān)注的。
但另一方面,圍繞現(xiàn)在大模型的特性,我們也會(huì)很關(guān)注計(jì)算架構(gòu)的創(chuàng)新:一是算力的加速,一是超低功耗。
極客公園:你們具體都投了哪些?
宋春雨:因?yàn)槲覀儓?jiān)信未來的智能計(jì)算會(huì)是多元異構(gòu)的架構(gòu),所以各種計(jì)算架構(gòu)我們都會(huì)投。包括傳統(tǒng)的 GPU(圖形處理器)、GPGPU(通用圖形處理單元);以寒武紀(jì)和華為為代表的 NPU(神經(jīng)網(wǎng)絡(luò)處理器)架構(gòu);RISC-V 架構(gòu)(知名的開源指令集架構(gòu));終端融合 NPU 算力架構(gòu)。這四點(diǎn)應(yīng)該都非常影響產(chǎn)業(yè)的演變,所以我們?nèi)纪顿Y。
另外,訓(xùn)練芯片、推理芯片、終端計(jì)算芯片,以及端邊云網(wǎng)芯片……只要覆蓋 AI 算力的,我們都會(huì)投資。因?yàn)槁?lián)想本質(zhì)是一個(gè)賣計(jì)算的公司,我們有以 GPU、NPU 為核心的新一代的人工智能超算集群,所以我們都會(huì)覆蓋。
極客公園:產(chǎn)業(yè)鏈有價(jià)值的你們都會(huì)投?有沒有什么特別的篩選標(biāo)準(zhǔn)?
宋春雨:第一,算力架構(gòu)能力可以對(duì)標(biāo)英偉達(dá)的 A 系列(A100 系列)、算力密度和能力相當(dāng)強(qiáng)、能支持人工智能大模型訓(xùn)練的芯片,肯定是我們想投的 No.1。
第二,在核心的 IT 和架構(gòu)方面有自獨(dú)到之處,能做出差異化,比如超低功耗是我們非??粗氐囊稽c(diǎn)。
第三,團(tuán)隊(duì)要具備智能算力的長期引領(lǐng)、創(chuàng)新能力。
第四,在行業(yè)里有過非常強(qiáng)的操盤能力,能夠做超級(jí)大芯片、而不是很小的芯片。這背后考驗(yàn)好的制程匹配,無論是用摩爾制程、還是用先進(jìn)制程。
另外,公司還要有很好的量產(chǎn)確定性。當(dāng)然,估值也是我們看重的一個(gè)點(diǎn)。
極客公園:最近行業(yè)里會(huì)提,芯片已經(jīng)從過去馮·諾伊曼時(shí)代的存算分離架構(gòu),變成了存算一體架構(gòu)?
宋春雨:存算一體已經(jīng)是共識(shí)了。那些填補(bǔ)國內(nèi)空白的下一代產(chǎn)品都已經(jīng)是存算一體,來提升計(jì)算效率和降低功耗。
極客公園:華為是去年唯一一個(gè)做出AI芯片的廠商,和大廠相比,創(chuàng)業(yè)公司有多大機(jī)會(huì)能跑出來?
宋春雨:首先我們認(rèn)為市場(chǎng)格局不會(huì)一家獨(dú)大。如果我們看全球份額,英偉達(dá) GPU 這么龐大了,谷歌的 TPU(張量處理器)還能在全球占 15% 的份額。現(xiàn)在 Altman(OpenAI 的 CEO)也要入場(chǎng)做芯片了,微軟也要做,所以 GPU 的份額會(huì)越來越少的,未來肯定是多種架構(gòu)并存。
而相較于英偉達(dá)在全球 AI 芯片的壟斷地位,中國遠(yuǎn)沒有形成這樣的格局。在國內(nèi),華為和其他 AI 算力芯片創(chuàng)業(yè)公司的起步時(shí)間點(diǎn)都差不多,現(xiàn)在就看誰能有產(chǎn)能,誰能夠構(gòu)建生態(tài),能在萬卡集群上訓(xùn)練大模型。
我堅(jiān)信有創(chuàng)業(yè)公司有機(jī)會(huì),未來兩年會(huì)是一個(gè)比較重要的紅利期,中國算力芯片市場(chǎng)會(huì)分化出格局。
極客公園:我們距離實(shí)現(xiàn)真正的芯片國產(chǎn)替代還有多久?
宋春雨:如果是有和無的問題,那差距已經(jīng)沒有那么大了。
比如最近英偉達(dá) GTC 大會(huì)發(fā)布了下一代 Blackwell 架構(gòu)的 GPU,宣稱算力提高了 30 倍,這是非常重要的技術(shù)點(diǎn)。但我們通過增加卡數(shù),它是 1 萬張最新的 GPU 卡,我們上 10 萬張,其實(shí)也能達(dá)到同樣的能力。這不是一個(gè)本質(zhì)差別了。
英偉達(dá)在 GTC 大會(huì)上發(fā)布的 Blackwell 芯片(左),與較舊的 H100 Hopper 架構(gòu)(右)對(duì)比| 圖片來源:英偉達(dá)
極客公園:Sora 這樣的多模態(tài)模型對(duì)算力考驗(yàn)更大了,我們?cè)撛趺磻?yīng)對(duì)?
宋春雨:多模態(tài)需要單集群萬卡,它考驗(yàn)超算集群本身的連接能力、網(wǎng)絡(luò)通訊能力、內(nèi)存管理能力等等。這個(gè)過程沒那么容易,要非常大的投資。不過國家也在重點(diǎn)支持整個(gè)產(chǎn)業(yè),這些都會(huì)幫助創(chuàng)業(yè)者。
不過,我認(rèn)為未來算力的成本不會(huì)像現(xiàn)在這么高。相當(dāng)于摩爾定律,過了一段時(shí)間它就會(huì)降低到一定程度。
極客公園:大概能降低多少?
宋春雨:目前還沒有一個(gè)數(shù)字預(yù)測(cè),有可能是現(xiàn)在成本的十分之一。未來算力或許像水、電、煤一樣,那是一個(gè)普惠智能的時(shí)代。
前所未有的變量涌現(xiàn),大模型是一次「人類超級(jí)科技工程」
極客公園:你投了上一波AI四小龍中的曠視,它們當(dāng)初的最大困境是模型通用性不高,導(dǎo)致 To B 交付基本是項(xiàng)目制,很難規(guī)?;⒚桓?。你覺得現(xiàn)在這一波的大模型公司能避免這個(gè)問題嗎?
宋春雨:這一輪大模型的泛化能力和通用性確實(shí)是好很多。從我們目前掌握的情況來看,它確實(shí)是可以跨客戶的。原來 AI 1.0 的小模型,每換一個(gè)客戶都需要針對(duì)客戶的數(shù)據(jù)和場(chǎng)景重新訓(xùn)練,現(xiàn)在不用了。
極客公園:聯(lián)想一直在提AI PC 的戰(zhàn)略,你怎么看大模型和端側(cè)的結(jié)合?
宋春雨:去年聯(lián)想宣布進(jìn)入到 AI PC 的時(shí)代,包括 AI phone,AIOT,要用大模型賦能新的硬件。很多大模型公司都非常愿意和我們合作。
我們相信未來端側(cè)會(huì)有專門的大模型,因?yàn)閭€(gè)人數(shù)據(jù)的隱私考慮,不能直接放到云端(模型)上訓(xùn)練。另外,端側(cè)模型能對(duì)用戶有更快速的響應(yīng)。如果模型整合了端到端,在特定領(lǐng)域的模型效率肯定是最好的。
極客公園:隨著大模型跟機(jī)器人結(jié)合,這是否意味著機(jī)器人產(chǎn)業(yè)迎來了 GTP-3 的時(shí)刻?
宋春雨:我去年初就這樣認(rèn)為了,只是當(dāng)時(shí)不知道是誰會(huì)引領(lǐng)這個(gè)產(chǎn)業(yè)。
機(jī)器人的通用性,主要是大模型帶來的、而不是硬件帶來的。因?yàn)橛布褪且粋€(gè)驅(qū)動(dòng)單元,驅(qū)動(dòng)單元(的進(jìn)步)是一個(gè)漸進(jìn)式過程。但大模型能讓機(jī)器人理解物理世界,它會(huì)帶來劇變。
極客公園:您好像投了一些垂直領(lǐng)域的機(jī)器人,你看好通用人形機(jī)器人嗎?
宋春雨:之前我投的是 AI 1.0 時(shí)代做特定任務(wù)的的機(jī)器人,現(xiàn)在我也讓團(tuán)隊(duì)快速地去看通用機(jī)器人。在這個(gè)產(chǎn)業(yè)大潮里,所有的領(lǐng)域都在快速地迭代。我相信 10 年內(nèi),人形機(jī)器人可以產(chǎn)業(yè)化。
其他各個(gè)板塊,包括英偉達(dá)發(fā)布的新芯片,馬斯克開源的新模型,OpenAI 要發(fā)布 GPT-5,所有終端廠商全在談 AI PC、AI phone 和 AIOT,新進(jìn)入的 top 玩家和 top 創(chuàng)業(yè)公司越來越多……這真是非常非常 Dynamic(動(dòng)態(tài)變化)的大時(shí)代。
極客公園:這么多的變量涌現(xiàn),是不是你投了科技這么多年從來沒有感受到的?
宋春雨:即使我們投科技這么多年,也從來沒有感受到。
之前我們投寒武紀(jì)、曠視科技、第四范式、思謀科技,這都是 AI 1.0 時(shí)代非常非常重要的公司。那時(shí)侯的競(jìng)爭(zhēng)格局和產(chǎn)業(yè)收斂程度,可能是以三年為周期。但大家現(xiàn)在看到的大模型浪潮,基本是以半年為周期收斂。
這波大模型浪潮和之前所有的科技創(chuàng)新都不一樣。它是大 dynamic、大資金,大家從人才、資金等各個(gè)維度切進(jìn)去,這是前所未有的一次人類超級(jí)科技工程。
「這個(gè)世界不愁錢,缺的是最好的創(chuàng)業(yè)者和最好的創(chuàng)業(yè)公司」
極客公園:聽說你們每年年初都會(huì)拿 3 個(gè)月時(shí)間,不做投資、只做行業(yè)調(diào)研。在大模型火熱的這兩年,你們都得出了什么調(diào)研結(jié)論?
宋春雨:其實(shí)結(jié)論是相似的,核心就是相信 scaling law(規(guī)模定律)、相信視覺模型和語言模型要走向統(tǒng)一,最終人類最終會(huì)實(shí)現(xiàn) AGI、進(jìn)入硅基智能的大爆發(fā)時(shí)代。同時(shí),我們也堅(jiān)信中國應(yīng)該出現(xiàn)自己的 OpenAI。
極客公園:為什么要研究 3 個(gè)月、而且還要全員參與?
宋春雨:因?yàn)闀r(shí)代在發(fā)生很大的變化,當(dāng)硅基智能時(shí)代到來,很多未知的東西都需要深入研究才能明白。
比如神經(jīng)網(wǎng)絡(luò)為什么要這樣的模式才能運(yùn)行?為什么在 Transformer 架構(gòu)下加算力、再加超大規(guī)模參數(shù)就能涌現(xiàn)?模型的上限潛力到底在哪里?如果我們想知道這些問題,就要研究,而研究之后,我們對(duì) AGI 才有了信心。
極客公園:像你們這樣對(duì) AGI 有技術(shù)信仰的機(jī)構(gòu)并不多,最終是否有足夠的錢來支持創(chuàng)業(yè)公司昂貴的 AGI 夢(mèng)想?
宋春雨:去年我去美國跟硅谷的大公司交流,他們跟我分享了一個(gè)數(shù)據(jù)。過去一年,硅谷的 VC 在人工智能大模型上投資的資金量,是 AI1.0 時(shí)代所有總和的 10 倍。這個(gè)資金量是非常非常驚人的。
中國也一樣,肯定有一年的資金量,會(huì)是過去 AI 1.0 時(shí)代的 10 倍。但這一年不一定是去年,因?yàn)槿ツ瓴艅傞_始。大家都在摸索和學(xué)習(xí)的過程。
對(duì)生成式 AI 的投資在 2023 年迎來爆發(fā)|圖片來源:CB Insights
極客公園:所以你對(duì)資金這個(gè)事還是比較樂觀?
宋春雨:比較樂觀。這個(gè)世界不愁錢,缺的是最好的創(chuàng)業(yè)者和最好的創(chuàng)業(yè)公司。
極客公園:現(xiàn)在大模型公司的投資方背后基本都是大廠,擁有資金、產(chǎn)業(yè)等優(yōu)勢(shì)的 CVC,會(huì)是能陪創(chuàng)業(yè)者走到最后的機(jī)構(gòu)嗎?
宋春雨:CVC 肯定是其中一股勢(shì)力。
極客公園:你覺得 AGI 的實(shí)現(xiàn)預(yù)計(jì)要多久?
宋春雨:估計(jì)是 2028 年到 2030 年。
極客公園:在技術(shù)的大浪潮下,會(huì)有一些對(duì)人類的憂慮嗎?
宋春雨:肯定會(huì)有。硅基智能和碳基智能的神經(jīng)網(wǎng)絡(luò)原理,其實(shí)是非常非常相似的。人的神經(jīng)網(wǎng)絡(luò)也是靠不斷學(xué)習(xí)、接觸數(shù)據(jù)、受到刺激,才能更加智能。
所以人不用腦也會(huì)落后,客觀一點(diǎn)說,人也要進(jìn)步。
極客公園:聽說你們內(nèi)部喜歡說「問對(duì)的問題」,可否提一個(gè)大模型行業(yè)的「對(duì)的問題」?
宋春雨:我們內(nèi)部梳理出了 100 多個(gè)問題,比如開源和閉源的關(guān)系、大模型有多家還是一家獨(dú)大等等,都是我們想提出的問題。
極客公園:你們看好怎樣的創(chuàng)業(yè)者?
宋春雨:還是要在大模型創(chuàng)新上有非常強(qiáng)的認(rèn)知、并且能不斷推進(jìn)大模型的創(chuàng)新路徑。這種創(chuàng)業(yè)者是我最喜歡的。
極客公園:具體怎么理解?
宋春雨:很多人是看到了 Sora 所以相信,但我不是,我是預(yù)判。創(chuàng)業(yè)者也是一樣。他不一定要先做出來什么,但他要有能力去理解,這個(gè)是關(guān)鍵。