99国产精品久久久久久久成人,国产真实高潮太爽了,色婷婷婷丁香亚洲综合,欧美性做爰片k8,亚洲一区自拍高清亚洲精品

對(duì)話沈抖:今天市面上有很多大模型,但大部分會(huì)迅速消失

摘要

「我們本來(lái)也覺(jué)得看熱鬧的人少了,但沒(méi)想到用戶的熱情未減?!?/p>

對(duì)話 | 張鵬 

編輯 | 黎詩(shī)韻、鄭玄

 

在「文心一言」放開(kāi)后的第 24 個(gè)小時(shí),沈抖進(jìn)到后臺(tái)看了下數(shù)據(jù),發(fā)現(xiàn)文心一言回答了用戶「3342 萬(wàn)個(gè)」問(wèn)題,這個(gè)數(shù)字超出了他的預(yù)期。

 

兩天后,沈抖和包括我本人在內(nèi)的幾名媒體人坐在一起聊起這件事時(shí)說(shuō),「我們本來(lái)也覺(jué)得看熱鬧的人少了,但沒(méi)想到用戶的熱情未減?!?/p>

 

9 月,在中國(guó)大模型熱潮持續(xù)了整整半年之際,普通人終于有機(jī)會(huì)上手。

 

8 月 31 日起,包括「文心一言」在內(nèi)的多款大模型陸續(xù)通過(guò)備案,正式對(duì)公眾開(kāi)放。這一消息不僅讓用戶雀躍嘗試,也引發(fā)了企業(yè)的熱情回應(yīng)。沈抖說(shuō),在文心一言開(kāi)放當(dāng)天,在百度智能云千帆大模型平臺(tái)上,日活企業(yè)數(shù)增長(zhǎng)超過(guò) 40%。——后者是百度面向企業(yè)端推出的大模型開(kāi)發(fā)與管理平臺(tái)。

 

在大模型時(shí)代,百度希望在同一時(shí)間線,推動(dòng)個(gè)人和企業(yè)用上大模型。從宏觀角度來(lái)說(shuō),這有利于大模型這項(xiàng)前沿技術(shù)的普及。從公司角度來(lái)說(shuō),這有助于百度自己做生意。盡管 C 端用戶的商業(yè)價(jià)值未能立刻顯現(xiàn),但 B 端客戶的商業(yè)價(jià)值則直接體現(xiàn)為模型 API 調(diào)度費(fèi)、以及云計(jì)算收入。

 

去年 5 月,已經(jīng)掌管百度移動(dòng)生態(tài)(MEG)多年的沈抖,被委以百度智能云事業(yè)群(ACG)總裁這一重職。集團(tuán)對(duì)他的期待是,抓住 AIGC 時(shí)代的機(jī)遇,把智能云做成百度第二增長(zhǎng)曲線。

 

但沈抖面對(duì)的狀況卻非常棘手。百度并不是中國(guó)最大的云計(jì)算廠商,只是在用于 AI 相關(guān)服務(wù)的公有云上排名領(lǐng)先。當(dāng)時(shí),沈抖也希望用 AI 帶動(dòng)整個(gè)云服務(wù)增長(zhǎng),無(wú)奈當(dāng)時(shí)的 AI 能力太「碎片化」,無(wú)法擺脫服務(wù)成本高、難以規(guī)模化、利潤(rùn)微薄的現(xiàn)狀。

 

但幾個(gè)月后,大模型時(shí)代到來(lái)。從競(jìng)爭(zhēng)格局上看,過(guò)去以 IaaS(基礎(chǔ)設(shè)施即服務(wù))和 PaaS(平臺(tái)即服務(wù))為主的基礎(chǔ)云服務(wù),正在讓渡于以 AI 為主的 MaaS(模型即服務(wù))的云服務(wù)。沈抖認(rèn)為這正是百度智能云「彎道超車」的機(jī)會(huì)。

 

而從營(yíng)收的角度上看,大模型的通用能力,讓云服務(wù)得以更標(biāo)準(zhǔn)化,從而在不同場(chǎng)景中規(guī)模復(fù)用,降低服務(wù)成本、增加利潤(rùn)。正是因此,百度管理層在 2023 年二季度財(cái)報(bào)電話會(huì)議中對(duì)投資者表示,AI 和大模型會(huì)讓百度智能云獲得更高的利潤(rùn)率。

 

以下是我們和沈抖對(duì)話的全文,由極客公園整理。

 

01 C 端文心一言、B 端千帆平臺(tái),成功的一體兩面

 

 問(wèn):看熱鬧到了真正干實(shí)事的時(shí)候。前兩天,百度在 C 端開(kāi)放了文心一言,你怎么看這個(gè)用戶使用數(shù)據(jù)?在意料之中還是意料之外?后臺(tái)的運(yùn)維能力是怎樣的?

沈抖:數(shù)據(jù)是我當(dāng)天晚上 12 點(diǎn)半發(fā)到群里,同事們第二天就發(fā)布了這個(gè)數(shù)據(jù)。數(shù)據(jù)是我從系統(tǒng)里截的,原封不動(dòng)地呈現(xiàn)給了外界,絕對(duì)真實(shí)。

我們本來(lái)也覺(jué)得「看熱鬧」的少了,所以預(yù)期沒(méi)有那么高。沒(méi)想到當(dāng)天有 3342 萬(wàn)個(gè)回答量,這說(shuō)明用戶對(duì)文心一言期待還是很高的。大家不是上來(lái)問(wèn)一句、兩句就走了,而是經(jīng)過(guò)了多輪的對(duì)話。從這個(gè)角度上來(lái)說(shuō),用戶的熱情還在。

文心一言從 3 月 16 號(hào)開(kāi)始內(nèi)測(cè)已經(jīng)有五六個(gè)月時(shí)間,無(wú)論在效果提升、還是成本降低上,都給了我們比較充裕的準(zhǔn)備時(shí)間。比如文心大模型的推理速度已經(jīng)較當(dāng)初提升了 30 多倍,大幅降低了推理成本,也讓我們能夠承載得了這么大的用戶量。

 

問(wèn):所以這段時(shí)間百度大模型的技術(shù)進(jìn)步,也包含成本上的進(jìn)步?

沈抖:對(duì),大模型本身就是資源密集型的技術(shù)范式。

我們開(kāi)始沒(méi)有想到流量會(huì)這么大,機(jī)器(算力)資源本身很寶貴,我們覺(jué)得放太多機(jī)器在那兒也是浪費(fèi),就沒(méi)有額外放太多機(jī)器。當(dāng)天用戶規(guī)模上來(lái)以后,好在因?yàn)槲覀兊耐评硇阅芴岣吡耍赃€是給用戶提供了穩(wěn)定的服務(wù)。

我們手里也握著不錯(cuò)的算力儲(chǔ)備,接下來(lái)也會(huì)繼續(xù)降低訓(xùn)練、推理的成本,滿足用戶需求沒(méi)有問(wèn)題。當(dāng)時(shí)我們內(nèi)部群里討論,流量來(lái)了能不能抗住。我說(shuō),讓流量來(lái)得更猛烈些,都是幸福的煩惱。

 

問(wèn):文心一言在 C 端的放開(kāi),對(duì)百度的好處是什么?

沈抖:你可能擔(dān)心的是,向 C 端開(kāi)放如果不能帶來(lái)商業(yè)價(jià)值,是不是可持續(xù)的問(wèn)題。

事實(shí)上,只要真正給用戶創(chuàng)造了價(jià)值,商業(yè)化只是時(shí)間早晚的問(wèn)題。技術(shù)發(fā)展史上,那些有價(jià)值但變現(xiàn)難的事例很少。文心一言確實(shí)給 C 端用戶帶來(lái)了真真實(shí)實(shí)的價(jià)值,昨天我看有一些評(píng)論講,沒(méi)有了文心一言,他的辦公效率就會(huì)下降。所以只要有價(jià)值,未來(lái)文心一言的商業(yè)化是順其自然的。

 

問(wèn):中國(guó)大模型的 C 端產(chǎn)品形態(tài),會(huì)跟 ChatGPT 保持一致嗎?也就是訂閱制收費(fèi)嗎?

沈抖:現(xiàn)在講大模型的產(chǎn)品形態(tài)還太早了,它的定義也還沒(méi)有那么清楚。

當(dāng)年移動(dòng)互聯(lián)網(wǎng)起來(lái)的時(shí)候,我們可以用幾個(gè)關(guān)鍵詞講清楚它的定義,比如 SoLoMo(Social、Local、Mobile,利用社交媒體、地理定位服務(wù)和移動(dòng)終端設(shè)備提供更好的用戶體驗(yàn))。但現(xiàn)在大模型還無(wú)法用幾個(gè)明確的詞定義。它的能力更強(qiáng)大,但邊界也更寬泛,還遠(yuǎn)沒(méi)到收斂產(chǎn)品形態(tài)的時(shí)候。

OpenAI 是技術(shù)驅(qū)動(dòng)的公司,用戶體驗(yàn)其實(shí)不是它的強(qiáng)項(xiàng)。它今天設(shè)計(jì)出的產(chǎn)品形態(tài)還很早期,接下來(lái)產(chǎn)品的迭代速度會(huì)非???、形態(tài)也會(huì)劇烈變化。

 

問(wèn):ChatGPT 向 C 端用戶收訂閱費(fèi)的商業(yè)模式,在中國(guó)是可行的嗎?

沈抖:我們可能會(huì)演變出新的變現(xiàn)方式,比如常見(jiàn)的廣告、電商加游戲三大變現(xiàn)方式。

如果你愿意一個(gè)月花兩千塊錢雇一個(gè)助理,那當(dāng) AI 能做助理 1/10 的事情,比如幫你制定旅游行程、預(yù)定機(jī)票和酒店、甚至調(diào)動(dòng)打車和外賣軟件等,你會(huì)不會(huì)愿意花兩百塊?只是變現(xiàn)方式不一定是會(huì)員費(fèi),可能是交易傭金或其他方式。

再比如,游戲里邊一堆 NPC 角色都是生成式 AI 驅(qū)動(dòng)的、電商領(lǐng)域「數(shù)字人」直播也由生成式 AI 支撐,這都可能產(chǎn)生不同的變現(xiàn)方式。最終 C 端的產(chǎn)品形態(tài),決定了它的變現(xiàn)方式。

 

問(wèn):如果 C 端產(chǎn)品最終是生產(chǎn)力工具,有沒(méi)有可能不是個(gè)人掏錢、而是公司給個(gè)人掏錢?

沈抖:有可能。比如百度網(wǎng)盤也算是一個(gè)效率工具,很多公司會(huì)買網(wǎng)盤賬號(hào)給員工用。我們還接觸過(guò)企業(yè),給每個(gè)員工配一個(gè) Copilot 賬號(hào)寫程序。這都是企業(yè)給個(gè)人買單的案例。

 

「文心一言」界面

 

問(wèn):作為內(nèi)容公司,我們也特別想用大模型來(lái)生產(chǎn)文章。你們剛上線了 To B 的大模型服務(wù)平臺(tái)「千帆」,推出「千帆」的背景是怎樣的?能怎么幫助零程序員的公司部署大模型?

沈抖:這是非常好的問(wèn)題。事實(shí)上,這就是我們做千帆平臺(tái)的原因。

這次大模型在 B 端落地的特點(diǎn)是大公司先行,很多客戶都是金融機(jī)構(gòu)、能源機(jī)構(gòu)、教育機(jī)構(gòu)等。它們有一個(gè)明顯的特點(diǎn)是需要私有化部署,但這樣門檻很高,還要自己培養(yǎng)一堆技術(shù)人員迭代模型,可能會(huì)減慢大模型生效的時(shí)間。

反倒像很多中小公司,你們大概率不會(huì)排斥一個(gè)(平臺(tái)型)SaaS 產(chǎn)品,也不會(huì)排斥公有云。千帆平臺(tái)就是這樣的產(chǎn)品。企業(yè)可以在上面直接調(diào)用 API,也可以訓(xùn)練樣本做微調(diào),幾乎零代碼打造自己的模型。我們做千帆的目的,就是要降低大模型的部署門檻、推動(dòng)大模型的廣泛應(yīng)用。

 

問(wèn):似乎你們和 OpenAI 的路徑有所不同。OpenAI 是先推 C 端產(chǎn)品 ChatGPT,再慢慢推 B 端產(chǎn)品,百度卻是 C 端和 B 端齊頭并進(jìn)。為什么會(huì)有這種差異?

沈抖:技術(shù)都有接受度的問(wèn)題,得讓更多的用戶真正用它,找到它的價(jià)值所在。大家都在談大模型,但多少人真的用過(guò)大模型?B 端企業(yè)客戶更能感受到大模型對(duì)它們整個(gè)生產(chǎn)范式的潛在影響,它們更需要用起來(lái)。

但如果它們既不用公有云的 API,也不自己搭一套環(huán)境去體驗(yàn)、嘗試,那就是純粹在那兒天馬行空地想象。所以我們需要做千帆,讓它們先把大模型用起來(lái)。其實(shí)關(guān)于大模型的全方位開(kāi)放,C 端等了很久,B 端也等了很久。只是 B 端離商業(yè)化更近。

 

問(wèn):文心一言放開(kāi)后,千帆平臺(tái)的 B 端需求被拉動(dòng)了多少?

沈抖:在文心一言開(kāi)放的當(dāng)天,在百度智能云千帆大模型平臺(tái)上,日活企業(yè)數(shù)增長(zhǎng)超過(guò) 40%,考慮到 TO B 的反應(yīng)速度通常滯后一些,實(shí)際的情況會(huì)更好一些。

放開(kāi)不僅會(huì)拉動(dòng) C 端數(shù)據(jù)上漲,也一定會(huì)拉動(dòng) B 端的數(shù)據(jù)上漲。因?yàn)檫@會(huì)幫 B 端企業(yè)降低成本、加快迭代速度(注:用國(guó)內(nèi)模型成本更低、更方便)。

但從數(shù)據(jù)漲幅上,B 端暫時(shí)還比不上 C 端。今天假設(shè)有人要在 B 端用「文心一言」,他與其上來(lái)就調(diào)用 API,不如先去 C 端體驗(yàn)一下。當(dāng)他認(rèn)為體驗(yàn)好,才會(huì)來(lái)千帆上用它。讓 B 端用起來(lái),需要一個(gè)培育的過(guò)程。

 

問(wèn):如果 C 端和 B 端齊頭并進(jìn),你們?cè)趺丛O(shè)置優(yōu)先級(jí)?重點(diǎn)主要放在 C 端還是 B 端?

沈抖:當(dāng)資源出現(xiàn)沖突時(shí),才需要設(shè)置優(yōu)先級(jí)。大模型的特點(diǎn)是,它在底下很厚的一層都是通用的,那在上面找應(yīng)用,無(wú)論 To B 還是 To C,都是百度要齊頭并進(jìn)做的。沒(méi)有到資源沖突的地步。

在 C 端,百度正在積極研究大模型可落地的產(chǎn)品形態(tài)和商業(yè)模式。百度要基于大模型重構(gòu)自己的 C 端產(chǎn)品,比如從百度自己的產(chǎn)品數(shù)據(jù)來(lái)看,百度網(wǎng)盤、百度文庫(kù)等產(chǎn)品,基于大模型重構(gòu)后,用戶使用粘性和會(huì)員付費(fèi)率都有很大提高;全新打造的文心一言 APP 和重構(gòu)后的百度搜索,也成為大模型應(yīng)用新入口。在 B 端,百度智能云通過(guò)打造出最好的大模型平臺(tái),服務(wù)好 To B 市場(chǎng)。

 

問(wèn):其實(shí)最通用的基座是你們的云計(jì)算,無(wú)論服務(wù)內(nèi)部客戶、還是外面客戶,都是你們的成功。

沈抖:是的,你服務(wù)好了內(nèi)部客戶、就服務(wù)好了外部客戶,服務(wù)好了外部客戶、就服務(wù)好了內(nèi)部客戶,這是 MaaS 的美妙之處。否則的話,假設(shè)外部和內(nèi)部完全是兩套技術(shù)棧,成本就太高了。

我們是兩條腿走路。百度當(dāng)然希望能做出一鳴驚人的 To C 產(chǎn)品,但我們也非常愿意通過(guò)底層大模型和算力,支撐更多的企業(yè)和開(kāi)發(fā)者做出好的 To C 應(yīng)用。其實(shí)無(wú)論上面誰(shuí)成功,都是底層大模型的成功。

 

 

02大模型開(kāi)啟殘酷淘汰賽,開(kāi)源模型的未來(lái)堪憂

 

 問(wèn):除了文心一言外,千帆平臺(tái)還上線了其他模型。千帆跟 Hugging Face 這樣的模型聚合平臺(tái)有什么區(qū)別?

沈抖:在目前或相當(dāng)長(zhǎng)一段時(shí)間內(nèi),不管是出于模型的場(chǎng)景適配性、還是客戶的心理需求,企業(yè)都希望能嘗試不同的模型。從這個(gè)角度來(lái)講,我們也需要提供第三方模型。

但也不是每一個(gè)模型都值得去試,那會(huì)是很大的資源浪費(fèi)。所以千帆有自己的篩選原則,我們放上來(lái)的都是相對(duì)比較優(yōu)秀、易用的模型。

 

問(wèn):所以 Hugging Face 的定位是社區(qū),千帆的定位是平臺(tái)?

沈抖:沒(méi)錯(cuò)。千帆不只是解決你來(lái)選模型的問(wèn)題,更解決你把模型真正用起來(lái)的問(wèn)題。用起來(lái)又包括數(shù)據(jù)、訓(xùn)練、調(diào)優(yōu)、Prompt 工程,以及應(yīng)用搭建等一系列問(wèn)題,還要充分考慮到成本和效率。千帆提供的是一站式服務(wù),這是千帆跟 Hugging Face 的區(qū)別。

Hugging face 模型廣度足夠,而千帆依托云廠商天然的優(yōu)勢(shì),有足夠大的運(yùn)營(yíng)空間,也可以做到端到端的訓(xùn)練和推理性能優(yōu)化。例如,訓(xùn)練過(guò)程中的加速,故障的快速感知、定位、恢復(fù);推理過(guò)程中基于百度龐大的異構(gòu)計(jì)算集群的擴(kuò)展性,有非常好的資源彈性,也可以提供 serverless 的服務(wù),使得客戶獲得低基礎(chǔ)設(shè)施成本、無(wú)需運(yùn)維、高擴(kuò)展性的收益。這是千帆要比 Hugging Face 做得更深的地方。

 

百度智能云千帆大模型平臺(tái) | 圖片來(lái)源:百度智能云官網(wǎng)

 

問(wèn):你似乎不看好開(kāi)源模型,但開(kāi)源攤薄了企業(yè)部署大模型的成本,也不能說(shuō)它沒(méi)有意義。你到底怎么看開(kāi)源模型?

沈抖:你說(shuō) LLaMA(注:Facebook 的開(kāi)源大模型)的成本誰(shuí)攤?是 Facebook。那 Facebook 的成本誰(shuí)攤?如果想不清楚這個(gè)問(wèn)題的終點(diǎn),那它(開(kāi)源)就是無(wú)源之水、無(wú)本之木,終歸有一天會(huì)出問(wèn)題。

因?yàn)檫@跟傳統(tǒng)的開(kāi)源軟件不一樣,過(guò)去一個(gè)人參與開(kāi)源的投入,就是他自己的時(shí)間成本。但今天如果一個(gè)人想搞開(kāi)源大模型,機(jī)器、數(shù)據(jù)的成本都太高了。

 

問(wèn):可以用愛(ài)發(fā)電,不能用愛(ài)計(jì)算。

沈抖:對(duì),訓(xùn)一輪你得扔幾千萬(wàn)進(jìn)去。

今天跟傳統(tǒng)開(kāi)源玩法有一點(diǎn)相似是,它們都是用開(kāi)源來(lái)吸引用戶的注意力,最終還是希望選其他(閉源)大模型。

 

問(wèn):有沒(méi)有可能出現(xiàn)類似 Red Hat 和 IBM 的關(guān)系(注:2018 年,IBM 宣布收購(gòu)全球最大的開(kāi)源公司紅帽)?假設(shè)像 IBM 這樣不甘心的有錢企業(yè)主,愿意支持開(kāi)源方呢?這樣開(kāi)源就有資金、數(shù)據(jù)支持了。

沈抖:開(kāi)源肯定是會(huì)長(zhǎng)期存在的。隨著大模型越來(lái)越受關(guān)注,政府、企業(yè)都可能捐贈(zèng)去支撐這方面的研究,促進(jìn)整個(gè)市場(chǎng)教育。但它最后能產(chǎn)生多大的價(jià)值?我覺(jué)得它大概率不會(huì)成為主流,也不會(huì)形成完整閉環(huán)的商業(yè)模式。

傳統(tǒng)的軟件開(kāi)發(fā)可以形成閉環(huán)。比如你寫了一段代碼或升級(jí)了一個(gè)功能,可以很快 check in(簽入),整個(gè)開(kāi)源軟件的能力一下就提高了一層。但今天 LLaMA 發(fā)布完了以后,不管有多少人在用,它沒(méi)法 check in 回去,數(shù)據(jù)放不回去、算力放不回去、能力也放不回去,形成不了閉環(huán)。

 

問(wèn):很多開(kāi)源派認(rèn)為,開(kāi)源模型讀過(guò)萬(wàn)億參數(shù),雖然比不上閉源模型,但是也是很可用的了。就像模型本身雖然沒(méi)有 985 和 211 畢業(yè)的水平,但至少是個(gè)專科水平可以用來(lái)做更垂直的微調(diào)了。

沈抖:Foundation Model(基礎(chǔ)模型)到底要不要進(jìn)步?如果說(shuō)今天 Foundation Model 已經(jīng)很好了,不用再改了,那沒(méi)有問(wèn)題。但今天的情況是,F(xiàn)oundation Model 只有 60 分,我們要爭(zhēng)取做到 90 分、95 分的問(wèn)題。

 

問(wèn):為什么要進(jìn)步?很多企業(yè)的真實(shí)感受是,GPT3.0 都已經(jīng)能解決問(wèn)題,那進(jìn)步的意義是什么?

沈抖:這是一個(gè)很好的問(wèn)題,我們內(nèi)部也討論過(guò)。今天 Foundation Model 做到 60 分也能解決很大一部分問(wèn)題,但它離完美地解決,差距還是很大的。而人性的需求是,但凡你能讓我一次解決的,分兩次絕對(duì)不干。

今天你在 Foundation Model 只有 60 分的基礎(chǔ)上,訓(xùn)練出了 85 分。那之后 Foundation Model 達(dá)到 85 分,你是不是能得 95 分呢?人在這方面的追求是無(wú)極限的。

這個(gè)極限肯定是要繼續(xù)往上拉的。拿搜索舉例,20 多年前的搜索就能用,那谷歌這 20 多年都在干嘛?你看似結(jié)束了,實(shí)際上沒(méi)有。

 

問(wèn):怎么看大模型接下來(lái)的競(jìng)爭(zhēng)格局?

沈抖:今天市面上有非常多模型,但我認(rèn)為它們很多都會(huì)迅速消失。

現(xiàn)在很多模型之所以還存在,是因?yàn)楹芏嗳诉€不知道它的好壞。反正誰(shuí)也試不了,誰(shuí)也用不了,一測(cè)排名還挺靠前。但隨著模型的放開(kāi),優(yōu)劣更容易評(píng)判了。今天這些做大模型的,你給他三千萬(wàn)個(gè)問(wèn)題輸進(jìn)去試試,估計(jì)一大半都得干趴下。

這會(huì)導(dǎo)致流量的逐步集中,頭部模型更容易形成規(guī)模效應(yīng),從而進(jìn)一步分?jǐn)偰P脱邪l(fā)的成本。差距會(huì)進(jìn)一步拉大。

 

問(wèn):淘汰賽會(huì)什么時(shí)候開(kāi)始?

沈抖:不好說(shuō),畢竟大家融的錢可能還得花一段時(shí)間。

對(duì)于大企業(yè)來(lái)講,燒還是燒得起的,但也要看它燒的價(jià)值何在。有一些企業(yè)是沖著反正自己的應(yīng)用場(chǎng)景很多,這時(shí)候讓它去調(diào)別人家的大模型 API 肯定不干,所以一定會(huì)做一個(gè)自己的模型。好點(diǎn)、差點(diǎn)(無(wú)所謂),至少不用依賴外部。大企業(yè)做模型這件事還會(huì)持續(xù)一段時(shí)間。

 

 

03大模型讓云計(jì)算服務(wù)走向「標(biāo)準(zhǔn)化」,百度云終于賺錢了

 

 問(wèn):未來(lái)大模型會(huì)不會(huì)成為所有應(yīng)用的底座?這會(huì)誕生一個(gè)完全不同的開(kāi)發(fā)、應(yīng)用生態(tài)嗎?

沈抖:毫無(wú)疑問(wèn),大模型會(huì)成為一個(gè)新時(shí)代的操作系統(tǒng),變成很多應(yīng)用的底座。

一直以來(lái),人和人、和機(jī)器打交道,都是用語(yǔ)言作為指令。但過(guò)去,機(jī)器不懂自然語(yǔ)言,我們就硬生生寫了一套程序語(yǔ)言讓它理解?,F(xiàn)在大模型理解了自然語(yǔ)言,整個(gè)應(yīng)用開(kāi)發(fā)范式就發(fā)生了根本性的變化。開(kāi)發(fā)變得由創(chuàng)意驅(qū)動(dòng),而不是由代碼能力驅(qū)動(dòng)。

另外,大模型也有把系統(tǒng)串聯(lián)起來(lái)的能力。像現(xiàn)在插件的出現(xiàn),也就是獨(dú)立完成某種能力、等待被調(diào)用的組件,大模型可以把插件組合起來(lái)完成一個(gè)特定的任務(wù)。這都會(huì)進(jìn)一步改變開(kāi)發(fā)范式。

 

問(wèn):如果大模型能打通所有插件解決問(wèn)題,這是不是變相實(shí)現(xiàn)了互聯(lián)互通?

沈抖:其實(shí)依然沒(méi)有。實(shí)際上,這些 APP 現(xiàn)在也都存在于同一個(gè)手機(jī)上、同一個(gè)應(yīng)用程序里,它照樣沒(méi)有實(shí)現(xiàn)互聯(lián)互通。將來(lái)在大模型基座上,美團(tuán)接進(jìn)來(lái)、滴滴接進(jìn)來(lái),但它們還是沒(méi)有互通的。

 

問(wèn):底層的問(wèn)題沒(méi)有解決。

沈抖:對(duì),互聯(lián)互通應(yīng)該指的是數(shù)據(jù)打通,你的數(shù)據(jù)我可以訪問(wèn)、我的數(shù)據(jù)你可以訪問(wèn)。但在大模型底座下,我們只是愿意跟這個(gè)中樞對(duì)話,但我們插件彼此之間并沒(méi)有對(duì)話。

 

問(wèn):這種不互聯(lián)互通的情況,會(huì)不會(huì)導(dǎo)致開(kāi)發(fā)者不能流暢地實(shí)現(xiàn)跨資源調(diào)度?這會(huì)是中國(guó)大模型開(kāi)發(fā)生態(tài)的缺陷嗎?

沈抖:我覺(jué)得主要的原因是沒(méi)放開(kāi)、流量規(guī)模沒(méi)起來(lái)。比如文心一言一下子有了 3000 多萬(wàn)的流量,開(kāi)發(fā)者一算可能 1% 是自己的,那也有 30 萬(wàn)的訪問(wèn)了,他就會(huì)決定來(lái)干。

 

問(wèn):在大模型時(shí)代,百度云怎么定義自己在生態(tài)里的位置?利益機(jī)制如何分配?

沈抖:以百度一家之力是絕對(duì)干不過(guò)來(lái)的。不是恐怕干不過(guò)來(lái),是絕對(duì)干不過(guò)來(lái)。

首先,插件一定會(huì)是非常繁榮的生態(tài),它和大模型之間是相輔相成的。插件要從大模型中獲取流量,大模型又需要插件能力的支持,就像今天假設(shè)手機(jī)上沒(méi)有微信、抖音 ,用戶可能都不用它了。

其次,在面向終端客戶的應(yīng)用上,無(wú)論是私有云部署、還是通過(guò)千帆這樣的平臺(tái)級(jí)方案,最終一定需要生態(tài)伙伴完成最后一公里交付的問(wèn)題,比如金蝶、用友、軟通動(dòng)力等。它們有特別熟悉的客戶和業(yè)務(wù)流程,最終需求都會(huì)被它集成。

總結(jié)一下,一是開(kāi)發(fā)生態(tài)的能力聚合、二是幫大模型做交付的合作伙伴、三是用大模型強(qiáng)化自身服務(wù)的客戶,這都是生態(tài)。

 

問(wèn):大模型的技術(shù)范式,給云計(jì)算帶來(lái)了哪些改變?

沈抖:技術(shù)發(fā)展的脈絡(luò)是越來(lái)越高級(jí)。換句話講,離底層越來(lái)越遠(yuǎn),越來(lái)越不需要關(guān)注細(xì)節(jié),封裝越來(lái)越好,有大量的人在背后把這些活給干了。這本身也是云貢獻(xiàn)的價(jià)值。

早期的 CPU 云貢獻(xiàn)的價(jià)值,就是客戶不用自己買機(jī)器一個(gè)一個(gè)卡綁,它封裝得越來(lái)越好、可以在上邊直接用。隨著大模型時(shí)代到來(lái),「AI 加速芯片」GPU 慢慢成為算力中心,算力增長(zhǎng)速度遠(yuǎn)遠(yuǎn)超過(guò) CPU。這會(huì)加速我們從 CPU 云向 GPU 云的切換。

在 GPU 云的時(shí)代,最終我們會(huì)把云的能力進(jìn)一步封裝,不讓底層暴露出來(lái),形成更高級(jí)的交互形態(tài),直接對(duì)接大模型的 API。今天的云還是給工程師開(kāi)發(fā)的,交互形態(tài)還不夠徹底,但未來(lái)底層的工程師會(huì)減少,更多人會(huì)往上層走。這是一個(gè)大幅的變化。

 

百度智能云 | 圖片來(lái)源:視覺(jué)中國(guó)

 

問(wèn):大模型會(huì)重塑云計(jì)算的市場(chǎng)格局嗎?如果會(huì),什么時(shí)候能看到信號(hào)?

沈抖:我喜歡這個(gè)問(wèn)題。如果沒(méi)有大模型的話,百度的云會(huì)打得非常吃力。我們過(guò)去一直在喊「深入行業(yè)、聚焦場(chǎng)景、云智一體、AI 普惠」,百度智能云想做的就是把 AI 放到整個(gè) To B 的服務(wù)里,讓它成為一個(gè)增長(zhǎng)點(diǎn)。

但過(guò)去,傳統(tǒng)的 AI 是非常碎片化的。它要針對(duì)一個(gè)問(wèn)題生成一個(gè)能力,再解決這個(gè)問(wèn)題,通用性比較差。這就導(dǎo)致它都是項(xiàng)目制,很難規(guī)?;驳?。

而生成式 AI 出來(lái)以后,我們看到它的通用性非常好、一下子能解決很多問(wèn)題,在應(yīng)用層往下基本都是統(tǒng)一的,哪怕需要微調(diào)、需要插件,都是標(biāo)準(zhǔn)化的動(dòng)作。這跟之前非常碎片化的 AI 應(yīng)用完全不一樣。這本身就是云業(yè)務(wù)的巨大變化,所謂的 IaaS 變成了 MaaS。

 

問(wèn):過(guò)去中國(guó)的 AI 公司都是要落項(xiàng)目,非常苦。沒(méi)法像現(xiàn)在這樣,通過(guò)標(biāo)準(zhǔn)化的產(chǎn)品解決問(wèn)題。

沈抖:我們那時(shí)候跟 Robin(注:百度創(chuàng)始人、董事長(zhǎng)兼 CEO 李彥宏)討論云戰(zhàn)略,他也要求我們必須得標(biāo)準(zhǔn)化、規(guī)模化,不然體現(xiàn)不出來(lái)百度作為一個(gè)技術(shù)公司的價(jià)值。

 

問(wèn):所以接下來(lái)長(zhǎng)期都會(huì)是標(biāo)準(zhǔn)化和規(guī)?;??

沈抖:大模型在早期有很大的不確定性,今天,很多客戶對(duì)大模型的能力上限、邊界、成本、交付、需求方式都還沒(méi)有統(tǒng)一認(rèn)知。短時(shí)間內(nèi),我們還不能保證客戶都到公有云上來(lái),肯定還是先通過(guò)項(xiàng)目制的方式去做。

但即使是這樣的項(xiàng)目制,也跟以前的項(xiàng)目制不一樣。比如我給你私有化部署了模型,它更像是 Windows 或者是 office,先是 95 版,接著是 97 版,又來(lái)了 2000 版,你得不斷的升級(jí)。看似我給你一個(gè)光盤裝到家里了,實(shí)際上你得不斷地訂閱。這跟原來(lái)搭建的也不一樣。

 

問(wèn):但你們的財(cái)務(wù)已經(jīng)出現(xiàn)了改善。今年一季度百度智能云首次實(shí)現(xiàn)季度盈利,你們提到原因就是云服務(wù)的標(biāo)準(zhǔn)化,實(shí)現(xiàn)了規(guī)模復(fù)用、降低了成本。

沈抖:是的。在單純項(xiàng)目制、或者項(xiàng)目制占比比較高的情況下,交付后毛利太低了。

 

 

04執(zhí)掌百度云一年多,迎來(lái)了最好的機(jī)遇

 

 問(wèn):作為百度最高決策層的一員,你平常最關(guān)心和焦慮的問(wèn)題是什么?經(jīng)常要跟團(tuán)隊(duì)討論的問(wèn)題是什么?

沈抖:在產(chǎn)品形態(tài)上,Robin 有一個(gè)要求,一定要用 AI 原生思維來(lái)重構(gòu)所有的產(chǎn)品。是重構(gòu),而不是接入。

在技術(shù)上,我們思考的是今天生成式 AI 的能力還能往上蹦多高。文心一言現(xiàn)在的評(píng)測(cè)結(jié)果還不錯(cuò),但它還遠(yuǎn)遠(yuǎn)沒(méi)到人類語(yǔ)言、或者優(yōu)秀人類語(yǔ)言理解的上限。怎么能繼續(xù)快速拉升這個(gè)能力,肯定是我們第一位思考的問(wèn)題。

接著是行業(yè)應(yīng)用上,模型怎么能真正用起來(lái)、在哪些場(chǎng)景能用起來(lái)、用起來(lái)的門檻有多高、邊界有多寬、怎么能提高它的效率、怎么激發(fā)大家想到更好的用法……這都是我們要不斷思考的東西。

 

問(wèn):這些都是比較偏軟的層面,偏硬的層面呢?

沈抖:現(xiàn)在算力集群從千卡到萬(wàn)卡,百度是中國(guó)真正在萬(wàn)卡級(jí)別上跑單一任務(wù)的公司。

在萬(wàn)卡集群下,組織、效率、保障這些真正底層的工作大家看不見(jiàn),但是它們極其重要。比如,我們要提高底層硬件和軟硬一體的訓(xùn)練、推理效率。這都是蠻關(guān)鍵的東西。

 

問(wèn):你在百度這么多年一直都負(fù)責(zé)搜索、廣告業(yè)務(wù),直到去年才主掌智能云,馬上就遇到了大模型的歷史機(jī)遇。會(huì)覺(jué)得是一種幸運(yùn)嗎?你的感受是怎樣的?

沈抖:沒(méi)那么夸張,但我確實(shí)很興奮、很幸運(yùn)能去做這么一件事。

去年接手的時(shí)候,我就有(把云服務(wù))規(guī)?;?biāo)準(zhǔn)化的思路。但因?yàn)?AI 能力太碎片化了,做起來(lái)非常難。當(dāng)時(shí)我就使勁在想,有什么東西是既需要 AI 能力、又需要 AI 算力、同時(shí)還能讓很多人同時(shí)去用的?找半天找不著。

然后,大模型就出現(xiàn)了。一下子就感覺(jué)順手了。

 

百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群(ACG)總裁沈抖 | 圖片來(lái)源:百度

 

問(wèn):你個(gè)人學(xué)的是人工智能方向,大模型是不是也跟你更匹配?

沈抖:這跟我研究生做的事情很相似。雖然我一直學(xué)計(jì)算機(jī)的,但我做得偏軟件的多一些,一直在人工智能這條線上做。

當(dāng)時(shí)接了云(偏底層硬件)以后,我真的又把操作系統(tǒng)、計(jì)算機(jī)組成原理的書拿來(lái)看了一遍。如果說(shuō)真是 CPU 時(shí)代的 IaaS、網(wǎng)絡(luò)組件、存儲(chǔ)計(jì)算那套東西,我覺(jué)得還是有點(diǎn)難的。

但大模型出來(lái)以后,我發(fā)現(xiàn)那些東西被封裝在下面了,我現(xiàn)在主要研究大模型就可以,比如讀論文、自己用 Python 把千帆上的 API 調(diào)用一遍等等。我覺(jué)得順手多了。

 

問(wèn):接下來(lái),你對(duì)百度智能云的發(fā)展增速有怎樣的預(yù)期?

沈抖:百度智能云現(xiàn)在就接近兩百億的盤子,還相對(duì)比較小。在大模型的加持下,我們的客戶需求變得很旺盛,現(xiàn)在都忙不過(guò)來(lái)。不過(guò)要想真正讓用戶用起來(lái)、做好交付,還需要一個(gè)過(guò)程。

 

問(wèn):四季度會(huì)迎來(lái)小爆發(fā)嗎?

沈抖:有人估計(jì)四季度會(huì)是爆發(fā)的。需求確實(shí)開(kāi)始起來(lái)了,但我覺(jué)得爆發(fā)的話,可能要到明年。

 

問(wèn):你怎么評(píng)價(jià)自己的運(yùn)氣?

沈抖:我覺(jué)得這是百度的運(yùn)氣。百度做 AI 做了這么多年,下了這么大功夫,如果大模型不來(lái)的話,云的商業(yè)化路徑確實(shí)更難一些,也很辛苦。這正好說(shuō)明有 Vision 的公司,最后運(yùn)氣也不會(huì)太差吧。

 

 

最新文章

極客公園

用極客視角,追蹤你不可錯(cuò)過(guò)的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現(xiàn)。

張鵬科技商業(yè)觀察

聊科技,談商業(yè)。