99国产精品久久久久久久成人,国产真实高潮太爽了,色婷婷婷丁香亚洲综合,欧美性做爰片k8,亚洲一区自拍高清亚洲精品

「橙篇」背后的百度文庫,如何做好「AI 原生化」?

摘要

百度大模型的「先鋒」,是怎么做產(chǎn)品的?

「底稿」對(duì)話欄目

誰在影響、定義我們的時(shí)代?他們做了什么,如何思考?對(duì)話關(guān)鍵人物,記錄歷史底稿。

本欄目將持續(xù)推出。

對(duì)話 | 張鵬
編輯 | 連冉、靖宇
累計(jì) AI 用戶數(shù)已經(jīng)突破 1.4 億,使用次數(shù)突破 15 億——AI 重構(gòu)之下,百度文庫煥發(fā)了全新活力。在「AI 產(chǎn)品榜」的 5 月份榜單中,百度文庫 AI 功能更是以單月 6536 萬訪問量位列國內(nèi)總榜首位,甩開第二名將近 1500 萬的身位。
成立十余年的百度文庫,是如何在 AI 時(shí)代迸發(fā)出強(qiáng)大的吸引力的?
當(dāng) AI 作為一項(xiàng)創(chuàng)新的底層技術(shù)被整合進(jìn)產(chǎn)品系統(tǒng)中,如何理解百度文庫的演進(jìn)軌跡,及其在產(chǎn)品使用和目標(biāo)上的轉(zhuǎn)變?作為行業(yè)最火的 AI 原生應(yīng)用之一,它是如何實(shí)現(xiàn)進(jìn)化的?
近日,在與極客公園創(chuàng)始人、總裁張鵬的對(duì)談中,百度副總裁、文庫事業(yè)部負(fù)責(zé)人王穎給出了解答。
去年 8 月至今,百度文庫經(jīng)過大模型的重構(gòu),已經(jīng)實(shí)現(xiàn)了從內(nèi)容理解、規(guī)劃到生成的全流程智能化。目前,百度文庫背后的團(tuán)隊(duì)僅有兩百余人,而在交付上實(shí)現(xiàn)正反饋之外,他們甚至還做到了商業(yè)上的正循環(huán)。
在 5 月底,百度文庫推出了新產(chǎn)品「橙篇」,是行業(yè)首個(gè)集「專業(yè)知識(shí)檢索和問答、超長(zhǎng)圖文理解和生成、深度編輯和整理、跨模態(tài)自由創(chuàng)作」的「查閱創(chuàng)編」一站式 AI 自由創(chuàng)作平臺(tái),未來,文庫和橙篇也會(huì)建立自己的內(nèi)容分發(fā)體系。
在這一波大模型的浪潮中,百度文庫的轉(zhuǎn)型既借助了技術(shù)的躍進(jìn),也是對(duì)用戶需求深刻理解的體現(xiàn)。如今,百度文庫已進(jìn)入與過去截然不同的發(fā)展階段,產(chǎn)品正在并將繼續(xù)經(jīng)歷一系列變革,而這些變革或許將徹底改變?nèi)藗儗?duì)文庫的常規(guī)認(rèn)知和使用習(xí)慣。
「理想的 AI,應(yīng)該端到端解決問題,讓機(jī)器像人一樣思考,讓產(chǎn)品像人一樣工作?!?/strong>AI 重構(gòu)后的百度文庫,已經(jīng)做到了這一點(diǎn)。去年的極客公園創(chuàng)新大會(huì) 2024 上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏曾強(qiáng)調(diào)過,AI 的真正價(jià)值在于原生應(yīng)用的開發(fā),而橙篇作為新近推出的 AI Native 產(chǎn)品,正在為用戶創(chuàng)作展開更廣闊的可能。
從將所有旗下應(yīng)用全部用大模型進(jìn)行重塑,到文庫成為跑在最前面的那個(gè)隊(duì)伍,可以看得到,百度做 AI 的決心并非紙上談兵,而是正在不斷突破創(chuàng)新應(yīng)用場(chǎng)景,用 AI 深度重構(gòu)產(chǎn)品,為用戶持續(xù)提供屬于這個(gè)大模型時(shí)代的智能增益。
在對(duì)談中,百度副總裁、文庫事業(yè)部負(fù)責(zé)人王穎輸出了一些精彩觀點(diǎn):
「文庫會(huì)是一站式 AI 內(nèi)容獲取和創(chuàng)作平臺(tái),創(chuàng)作從文庫開始就好了。」
「目標(biāo)對(duì)不齊,來自于標(biāo)準(zhǔn)對(duì)不齊?!?/strong>
「一開始做產(chǎn)品,心里就有一張損益表?!?/strong>

以下是對(duì)話全文,由極客公園編輯整理。

 

01

AI 重塑下的百度文庫

張鵬:文庫在引入智能技術(shù)初期的決策過程是怎么樣的?是如何設(shè)定第一個(gè)目標(biāo)并逐步發(fā)展的?
王穎: 我們首先考慮了兩個(gè)關(guān)鍵點(diǎn)。第一,我們引入了大模型技術(shù),評(píng)估它在哪些領(lǐng)域有顯著的能力提升,以及還有什么缺陷,AI 技術(shù)自 20 世紀(jì) 50 年代以來一直在發(fā)展,但大模型的出現(xiàn)標(biāo)志著創(chuàng)作的能力飛躍,這個(gè)技術(shù)飛躍是不是能解決目前用戶的問題。
第二,我們深入挖掘了用戶在文庫的需求。傳統(tǒng)上,人們認(rèn)為文庫只是一個(gè)文檔檢索平臺(tái),但通過深入分析,我們發(fā)現(xiàn)用戶找內(nèi)容不僅僅是為了閱讀,而是為了寫作。我們進(jìn)一步探究了用戶為何尋找內(nèi)容,以及找到內(nèi)容后他們要做什么。我們意識(shí)到,用戶的核心目的不是為了找內(nèi)容本身,而是為了支持他們的寫作需求。
寫作有兩條路徑,第一條路徑,擅長(zhǎng)寫的用戶上手打開編輯器就寫了,還有一種不會(huì)寫的用戶,他們第一步需要找素材。
50% 的用戶屬于第二類,他們需要找素材并進(jìn)行組合和編輯。即使是擅長(zhǎng)寫作的用戶,在寫作過程中也常常需要尋找專業(yè)素材和靈感。這些都是文庫用戶的需求,也顯示出找和寫的需求實(shí)際上是一個(gè)統(tǒng)一的需求,只是由于過去的技術(shù)水平限制,這個(gè)過程不得不被分割在不同的工具和平臺(tái)上進(jìn)行。
張鵬:所以在技術(shù)進(jìn)步的推動(dòng)下,文庫有機(jī)會(huì)更深入地滿足用戶需求了。
王穎:我們一開始就知道用戶有一個(gè)完整的需求,但原來的技術(shù)和產(chǎn)品限制只能解決其中的一部分,只能提高一部分效率。其實(shí),人工智能的本質(zhì)是讓機(jī)器像人一樣思考。
做人工智能產(chǎn)品,就要讓產(chǎn)品像人一樣工作,幫用戶完成所有工作。我們最初的重構(gòu)思路是:既然有了這種技術(shù),我們要讓產(chǎn)品像人一樣工作,端到端地解決問題,而不是只解決一個(gè)環(huán)節(jié)的問題。
很多人認(rèn)為文庫是用來搜資料的,質(zhì)疑我們?yōu)槭裁匆么竽P?。可以回想一下去?3 月份,很多平臺(tái)是這么做的:用戶搜索不到內(nèi)容時(shí),他們用大模型生成一篇給用戶。可是這種做法并沒有解決用戶的本質(zhì)需求。就像我們買米是為了做飯吃飽,而不是為了單純擁有米。
我們最開始的目標(biāo)是讓產(chǎn)品像人一樣思考,端到端地解決問題,在實(shí)現(xiàn)這個(gè)目標(biāo)的過程中,確實(shí)遇到過很多問題。
用戶對(duì)文庫的認(rèn)知是一個(gè)資料庫,用來存儲(chǔ)和查找資料,這個(gè)認(rèn)知非常強(qiáng)烈。
我們要做的第一件事是讓用戶過來查找資料,并讓用戶繼續(xù)留在這里,讓他們知道文庫也能幫助寫作。
所以,我們?cè)诶斫獾接脩粼诓檎屹Y料后可能需要編輯和創(chuàng)作時(shí),就提供相應(yīng)的能力,當(dāng)技術(shù)進(jìn)一步成熟時(shí),我們就直接搭建新功能支持寫作,比如后續(xù)文庫就推出了各種格式的寫作功能,到現(xiàn)在文庫又推出的全新 App——橙篇,用戶不僅可以查找資料,還可以直接進(jìn)行寫作。
張鵬:在找到文檔和內(nèi)容后,用戶還需要對(duì)它們進(jìn)行進(jìn)一步加工、轉(zhuǎn)化和存儲(chǔ),使其未來可以結(jié)構(gòu)化使用。所以第一步是將這個(gè)過程延長(zhǎng),而不是直接到寫作階段,這些工作是什么時(shí)候進(jìn)行的?
王穎:用戶進(jìn)入文庫后,我們不僅提供文檔搜索能力,還提供寫作相關(guān)的能力。當(dāng)你找到一篇文檔后,可以進(jìn)行擴(kuò)寫、改寫,甚至基于文檔內(nèi)容制作 PPT。
這些工作是在去年 5 月份之前進(jìn)行的。當(dāng)時(shí)我們還沒有編輯器,因此只能先做這些基礎(chǔ)工作。然后我們一邊開發(fā)編輯器,一邊進(jìn)行 AI 滲透,讓用戶知道文庫有 AI 功能,AI 對(duì)寫作有幫助,這是一個(gè)并行的過程。編輯器做完以后,我們直接推出了完整寫作功能,用戶就可以直接進(jìn)入寫作階段。
張鵬:文庫有畫本的功能,這個(gè)功能用戶的反饋怎么樣?
王穎:畫本功能分享率很高,有 30%。這個(gè)功能成本有點(diǎn)高,不過推出一個(gè)半月我們已經(jīng)把成本下降了一個(gè)量級(jí),到今年年底成本應(yīng)該都算不上負(fù)擔(dān)了。
現(xiàn)在文庫所有的 AI 功能沒有優(yōu)化到位就不推,現(xiàn)在是因?yàn)榈轿涣耍跃烷_始推了,轉(zhuǎn)化率也特別好。
張鵬:所以文庫不光交付實(shí)現(xiàn)了正反饋,商業(yè)上也做到了正循環(huán)。
王穎:我們從一開始做項(xiàng)目,就是從一張損益表開始的。

02

「模型接入」的挑戰(zhàn)

張鵬:那么后來真正把模型接入,是很簡(jiǎn)單的事嗎?還是說需要和模型團(tuán)隊(duì)磨合很久?
王穎: 我們沒有覺得很簡(jiǎn)單。大家對(duì)使用模型的理解不同。以前的模型是解決專用問題,現(xiàn)在的通用模型解決很多問題。
通用模型有它的限制,所以我們用 MoE 來解決問題。首先,通用模型能力有限,我也不能全都用大模型,那樣成本太高,現(xiàn)在 AI 應(yīng)用賠錢就是因?yàn)槌杀締栴}。
我們把大模型看作大腦,它負(fù)責(zé)理解和分工,復(fù)雜的問題用大模型解決,其他的功能用不同的模型來做。
事實(shí)上,文庫做到今天,我們有對(duì)模型進(jìn)行精調(diào),但并沒有用想象的那么多的精調(diào)數(shù)據(jù),因?yàn)橐蟮牟皇菙?shù)據(jù)數(shù)量,而是數(shù)據(jù)質(zhì)量夠不夠好,夠不夠均衡。并且,文庫有自己的算法工程來做 Prompt(提示詞)優(yōu)化,包括使用不同尺寸的模型來執(zhí)行不同的任務(wù),最終將它們整合起來,形成一個(gè)協(xié)調(diào)一致的系統(tǒng)。
文庫從第一天開始,就讓產(chǎn)品像人一樣思考,像人一樣工作。這種思考和分工是持續(xù)進(jìn)行的,我們從來沒有在大模型上糾結(jié)過。
到目前為止,我們和大模型團(tuán)隊(duì)一起真正合作開發(fā)的定制能力只有兩個(gè):
一個(gè)是字?jǐn)?shù)控制,大模型的多樣性決定了依從性問題的存在:模型團(tuán)隊(duì)一開始不能完全理解這個(gè)需求,因?yàn)樵谒阉鲌?chǎng)景中,字?jǐn)?shù)長(zhǎng)短內(nèi)容無所謂,但對(duì)文庫用戶來說不一樣,如果用戶要求寫 500 字,它卻寫了 1500 字,就給用戶增加了刪減的負(fù)擔(dān)。現(xiàn)在,文心一言在字?jǐn)?shù)依從性上可以做到上下浮動(dòng) 5%。
另一個(gè)是理解和生成:我們提供很多文檔解析能力,以及專業(yè)文檔的標(biāo)準(zhǔn)和專家標(biāo)準(zhǔn),然后模型去訓(xùn)練這些內(nèi)容。這兩件事是我們與模型團(tuán)隊(duì)真正共建的。

03

AI 重構(gòu),

核心在于「價(jià)值」

張鵬:你要求產(chǎn)品團(tuán)隊(duì)首先對(duì)于模型有根本性的理解,且對(duì)自己如何運(yùn)用模型,一上來就要清晰的認(rèn)識(shí)。
王穎: 對(duì),現(xiàn)在的組織結(jié)構(gòu)中,產(chǎn)品和策略是要融合的。過去的工作流程里,是算法團(tuán)隊(duì)來負(fù)責(zé)策略算法,產(chǎn)品負(fù)責(zé)提需求,產(chǎn)品團(tuán)隊(duì)提供產(chǎn)品原型可以了。現(xiàn)在這種模式行不通了,每個(gè)人都要滲透到對(duì)方的領(lǐng)域。原來是陣地型打法,現(xiàn)在得全攻全守往前推進(jìn)。
張鵬:是什么讓你下定決心必須這樣?
王穎:標(biāo)準(zhǔn)不一致就會(huì)導(dǎo)致目標(biāo)不一致。另外,交付不等于用戶滿意。成熟的業(yè)務(wù)有明確的標(biāo)準(zhǔn)。但對(duì)于全新重構(gòu)的項(xiàng)目而言,如果沒有建立明確的標(biāo)準(zhǔn),光是以物理上線為目標(biāo),而不是以用戶的實(shí)際滿意度為目標(biāo),是行不通的。
張鵬:上一個(gè)時(shí)代的產(chǎn)品經(jīng)理需要懂人性,但今天光懂人性不夠,還需要懂模型。
王穎: 對(duì),因?yàn)槲覀兘⒌氖侨撕蜋C(jī)器溝通的橋梁。
張鵬:你是怎么管理產(chǎn)品需求、定義和實(shí)現(xiàn)效果的?
王穎: 我會(huì)把各方面都搞得清晰。從最開始的需求判斷是不是應(yīng)該這么做,產(chǎn)品怎么定義,哪些是突出的賣點(diǎn),應(yīng)該實(shí)現(xiàn)什么樣的效果。也畫產(chǎn)品圖,包括交互設(shè)計(jì)和一些 UI 設(shè)計(jì),會(huì)帶著團(tuán)隊(duì)一起來做。不同的生成路徑也會(huì)關(guān)注,比如做 PPT 的生成路徑和做漫畫的生成路徑是不一樣的。但是在同一個(gè)產(chǎn)品中又不能讓用戶在生成不同內(nèi)容或不同品類時(shí),都感覺像在使用一個(gè)不同的東西一樣。這些流程需要重新設(shè)計(jì)。
張鵬:做完第一步,把第一個(gè)延長(zhǎng)線畫了,看到什么樣的數(shù)據(jù)變化?
王穎:用戶使用時(shí)長(zhǎng)有變化了,翻倍了。
張鵬:上線多長(zhǎng)時(shí)間看到的?
王穎:大概是一個(gè)月。不光使用時(shí)長(zhǎng)翻倍了,留存也提升了。
張鵬:怎么從時(shí)長(zhǎng)的翻倍,去解讀用戶的收獲?
王穎:看結(jié)果。以前的用戶基本上是找到就下載,時(shí)間很短?,F(xiàn)在會(huì)發(fā)現(xiàn)用戶有了更多的互動(dòng),會(huì)調(diào)用各種功能,自然時(shí)間就變長(zhǎng)了。
還有一個(gè)關(guān)鍵指標(biāo)是下載完成后本地使用。畢竟下載可用了,才會(huì)下載。
張鵬:下載下來意味著有效交付完成了。
王穎:對(duì),要么下載,要么分享轉(zhuǎn)發(fā)。還要關(guān)注留存和活躍留存率,也就是用了某項(xiàng)功能的用戶,第二天再次使用的比例是否超過以往。只有用戶覺得功能有用,才會(huì)再次回來使用。就像去飯館吃飯一樣,如果今天不好吃,明天還會(huì)再來的人肯定不多。
張鵬:做到這一步有沒有很復(fù)雜的技術(shù)挑戰(zhàn)?
王穎:有很多,舉個(gè)例子,在初期的文檔寫作中,除了大家熟知的幻覺問題,還有字?jǐn)?shù)依從方面。其實(shí)很多時(shí)候擴(kuò)寫 1.5 倍就夠了,但之前有一些大模型的擴(kuò)寫長(zhǎng)度趕上重寫一篇了,這就不太好。文庫推動(dòng)解決的就是這一點(diǎn)。
張鵬:怎么去定義字?jǐn)?shù)依從性的合理指標(biāo)?擴(kuò)寫要做好是怎么做到的?
王穎:我們做了大量調(diào)研去了解用戶對(duì)擴(kuò)寫的期待是什么樣的。用大模型重構(gòu)產(chǎn)品的時(shí)候,很多人不知道標(biāo)準(zhǔn)怎么建立,但其實(shí)標(biāo)準(zhǔn)不是存在于行業(yè),而是藏在用戶心里。
用戶對(duì)新事物總是有所期待,我們得去滿足這些期待,高太多,用戶可能不理解,低于期待值更不行。找到用戶的期待值,比它高一格就是標(biāo)準(zhǔn)。
產(chǎn)品剛上線的時(shí)候,我們邀請(qǐng)測(cè)試、維護(hù)了四個(gè)用戶群,每個(gè)群里有兩百人,版本出來就給這些群里的用戶使用,他們會(huì)給到一些反饋。
張鵬:所以擴(kuò)寫也是在這一波前期測(cè)試過程當(dāng)中,用戶提出問題,然后你們反過來進(jìn)行調(diào)研,到底應(yīng)該怎么擴(kuò)寫。
王穎:對(duì),因?yàn)?Prompt 解決不了這個(gè)問題。有些大模型問題是 Prompt 無法解決的。大模型的特性就是多樣性,而多樣性會(huì)導(dǎo)致依從性差,這是必須要解決的問題?,F(xiàn)在一般的擴(kuò)寫比例是 1.5~2。
張鵬:所以這是一個(gè)擴(kuò)寫的黃金比例。在做這個(gè)的同時(shí)你們還在搭編輯器,這個(gè)事情復(fù)雜嗎?
王穎:很復(fù)雜。復(fù)雜之處在于幾個(gè)方面。
首先,不同的文件類型需要不同的編輯器,比如 Word、PPT、Excel 需要的編輯器都不一樣。這導(dǎo)致用戶在處理文件時(shí)需要頻繁地切換。
其次,進(jìn)入編輯器之前,文件可能存在多種格式,增加了處理的復(fù)雜性。
最后,編輯器本身的工具非常繁多,使用指令復(fù)雜,每個(gè)編輯器可能有數(shù)百個(gè)指令,如果每個(gè)都要實(shí)現(xiàn),工作量非常巨大。
此外,這是一個(gè)強(qiáng)工程項(xiàng)目,像 Word 或 Office 這樣的產(chǎn)品本身也是編輯器,我們做編輯器不是要跟它們做一樣的產(chǎn)品,我們要做的是融合編輯器,這個(gè)編輯器要兼容所有的文件格式,用戶不需要關(guān)心格式問題,只需要告訴我們需要完成什么任務(wù)即可。
百度原來沒有這方面對(duì)應(yīng)的積累,我們是從頭開始做的。
張鵬:上線之后用戶的反應(yīng)怎么樣?
王穎:擴(kuò)寫和續(xù)寫對(duì)編輯器的要求并不高。真正對(duì)編輯器要求高的是 PPT。PPT 功能推出之前,擴(kuò)寫僅限于文本,我們對(duì)編輯器的理解和難度的把握都相對(duì)有限。
PPT 功能的出現(xiàn),使得操作空間擴(kuò)展了。首先,PPT 本身的制作難度就比文本要大;其次,現(xiàn)在能夠在同一個(gè)平臺(tái)上進(jìn)行格式轉(zhuǎn)換,融合編輯器的優(yōu)勢(shì)也就體現(xiàn)出來了。如果只限于 Word,能做的就只是文字處理,但有了融合編輯器,不僅可以處理 PPT,還能實(shí)現(xiàn) PPT 與 Word 之間的格式轉(zhuǎn)換,甚至還能制作圖表。
張鵬:PPT 能力上線之后,用戶能明顯感覺到文庫編輯器的意義所在了。接下來用戶數(shù)據(jù)變化怎么樣?
王穎:非常明顯。各種用戶數(shù)據(jù)曲線陡峭上升。去年 9 月到 10 月,DAU 從 30 萬爬升到 140 萬。
張鵬:所以文庫接下來會(huì)是什么樣的產(chǎn)品定義?
王穎:一站式 AI 內(nèi)容獲取和創(chuàng)作平臺(tái),所有創(chuàng)作從文庫這里開始就好了。
張鵬:分發(fā)怎么做,有一鍵轉(zhuǎn)發(fā)功能嗎?
王穎:有。用戶不需要考慮素材的來源、格式或者具體細(xì)節(jié),他們只需將內(nèi)容提供給文庫,輸出支持包括存儲(chǔ)、轉(zhuǎn)發(fā)、分享等。
張鵬:這樣聽下來,文庫像是個(gè)人寫作的操作系統(tǒng)。
王穎:對(duì),除此之外,還希望文庫有自己的生態(tài),可以分發(fā)內(nèi)容。
張鵬:Robin 說文庫是被 AI 重構(gòu)最好的產(chǎn)品,你有沒有聽他定義過他認(rèn)為的好是在于什么?
王穎:核心就是價(jià)值,為用戶、行業(yè)帶來什么價(jià)值,有沒有價(jià)值重構(gòu),提供價(jià)值增量。
給用戶提供了價(jià)值,用戶就會(huì)用腳投票,同時(shí)價(jià)值會(huì)反哺大模型,利用人類行為反饋提升自身性能。
 

04

橙篇——

「長(zhǎng)文創(chuàng)作、批量賦能」

張鵬:文庫最近推出了橙篇這個(gè)產(chǎn)品,對(duì)它的定位是什么?
王穎:我們希望橙篇能夠成就人生新篇章。除了專業(yè)寫作以外,橙篇未來還將注重休閑娛樂性質(zhì)的寫作,以及分享互動(dòng)的功能。

 

張鵬:文庫這樣的平臺(tái)本身也支持創(chuàng)作,橙篇的推出是出于什么考慮?

王穎:用戶在創(chuàng)作過程中存在兩種情況:一半的用戶因?yàn)椴恢廊绾沃珠_始,需要找資料參考,另一半則能夠直接開始寫作。盡管文庫已經(jīng)積累了 15 年的經(jīng)驗(yàn),擁有廣大用戶,但大多數(shù)人仍然將其視為一個(gè)資料搜索平臺(tái),而非創(chuàng)作起點(diǎn)。
在短期內(nèi),文庫是一個(gè)內(nèi)容獲取和創(chuàng)作的一站式平臺(tái)的認(rèn)知還需要逐步建立,但我們需要一個(gè)平臺(tái)來盡快滿足用戶直接創(chuàng)作的需要,這就是橙篇的定位。
我們希望通過橙篇從創(chuàng)作的最初階段就為用戶提供支持,同時(shí)通過專業(yè)知識(shí)內(nèi)容的輔助來提升創(chuàng)作質(zhì)量、拓寬創(chuàng)作服務(wù)范圍。
張鵬:可以有一小股部隊(duì)像創(chuàng)業(yè)公司做新銳產(chǎn)品一樣,更有活力。
王穎:對(duì),沒有包袱,可以做很多嘗試。
張鵬:用戶有給到一些什么反饋,對(duì)后續(xù)做產(chǎn)品有指導(dǎo)作用的?
王穎:呼喚趕緊出一個(gè) App,需要更多的體裁和品類,希望有更多表格處理能力。
張鵬:用戶在橙篇寫作的話,主要寫些什么類型?
王穎:長(zhǎng)文很多,大多在 5000 字以上。
張鵬:寫作通用性還可以。
王穎:對(duì),我們也強(qiáng)調(diào)專業(yè)性。我們一直有在長(zhǎng)文和專業(yè)內(nèi)容上發(fā)力,為什么要這樣做?因?yàn)榇髮W(xué)生用戶是傳播力最強(qiáng)的用戶群體,所以我們首先要滿足他們的需求,在長(zhǎng)文理解和寫作方面,進(jìn)行了專門的調(diào)整。
此外,為了應(yīng)對(duì)大模型不夠?qū)I(yè)的問題,從去年 7 月份開始,我們就開始建設(shè)專業(yè)內(nèi)容,大量引入專業(yè)資源,全覆蓋 Nature 這樣的頭部期刊以及大量專業(yè)數(shù)據(jù)和出版社資源,這些其他大模型尚未涉足。這些工作是在去年 5、6 月份開始的。畢竟大模型有幻覺,有專業(yè)性不夠的問題,所以比較早就開始準(zhǔn)備這些。
張鵬:所以你們是希望寫作這件事情,更多人當(dāng)成更日常的東西,怎么做到這一點(diǎn)呢?
王穎:對(duì),本質(zhì)就是兩件事,要么因此獲得尊重,要么因此掙到錢。那我們就做好兩件事,一個(gè)是分享,一個(gè)是激勵(lì)。
我們現(xiàn)在和很多 IP 合作,用戶可以自由創(chuàng)作并分享作品。通過分享,讓更多人看到成果,滿足了分享展示的需求。畫本功能就是出于這個(gè)原因開發(fā)的。
激勵(lì)方面,用戶創(chuàng)作小說后,我們會(huì)通過多個(gè)內(nèi)容分發(fā)平臺(tái)進(jìn)行分發(fā),產(chǎn)生的收入會(huì)與創(chuàng)作者分成,這樣用戶就有了動(dòng)力。
畫本也一樣,只要用戶的創(chuàng)作在平臺(tái)產(chǎn)生的利潤,都會(huì)分給用戶。即使用戶沒有直接在平臺(tái)創(chuàng)作或分享內(nèi)容,只要他們有所貢獻(xiàn),也會(huì)有代幣獎(jiǎng)勵(lì),這些代幣可以用于完成任務(wù),比如制作 ppt。如果代幣不足,用戶可以通過繼續(xù)創(chuàng)作或購買來獲取更多代幣。這是我們?cè)谧龅囊恍﹪L試。
張鵬:以小說為例,現(xiàn)在是供給不足、需求不足還是連接不足?
王穎:現(xiàn)在是供給不足,而不是需求不足。首先,小說用戶占了整個(gè)中國用戶的 50%,這個(gè)比例遠(yuǎn)遠(yuǎn)超出想象。我們?cè)菊J(rèn)為小說用戶是十八九歲到三十幾歲的年輕人,但實(shí)際上,小說用戶的年齡范圍非常廣泛,從十幾歲到六七十歲都有。
需求已經(jīng)非常明顯,但供給卻跟不上。供給可以分成幾個(gè)層次,頭部作家一直被催更,顯然是供給出現(xiàn)了問題。比如,烽火戲諸侯一章要寫十萬字,創(chuàng)作時(shí)間很長(zhǎng),一直被催更。爽文、腦洞文也同樣如此。
優(yōu)質(zhì)供給不足,不是說書放在那兒沒人看,而是能讓大家持續(xù)看下去的好書不多。我們發(fā)現(xiàn),老白文人均閱讀本書是 1.3 本,而腦洞文是 3 本多,讀者閱讀速度很快,而供給足夠的話,讀者還會(huì)繼續(xù)閱讀下去。問題在于,好的供給還是不夠,這是非常明顯的問題。
張鵬:所以可以理解為橙篇的目標(biāo)是通過這個(gè)操作系統(tǒng),幫助更多有效的供給批量產(chǎn)生。
王穎:對(duì),有效的供給可以分為幾類,每種都有其標(biāo)準(zhǔn)。首先是情節(jié)感人、文字優(yōu)美、文筆也不錯(cuò)的優(yōu)質(zhì)供給;其次是雖然有好的情節(jié)但很多人卡在表達(dá)環(huán)節(jié),這個(gè)問題大模型可以解決。
小說后續(xù)可以衍生到漫畫領(lǐng)域,漫畫供給問題尤為突出。我們和創(chuàng)作者合作進(jìn)行了實(shí)驗(yàn),有家公司嘗試對(duì)兩到三部漫畫實(shí)施日更策略,以此來測(cè)試是否能夠吸引更多的關(guān)注。結(jié)果顯示,盡管付費(fèi)率保持不變,但閱讀量確實(shí)有所增加。
張鵬:有效供給最后很有可能也變成多模態(tài)。
王穎:我們本身也具備多模態(tài)能力,現(xiàn)在沒上橙篇是因?yàn)槿肆Σ粔颍€沒來得及開發(fā)出來,之后會(huì)上線的。
 

05

文庫和橙篇的未來

張鵬:百度文庫和橙篇是怎么通過用戶行為數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)飛輪效應(yīng)的?
王穎:比如說在文檔平臺(tái)上,我們會(huì)根據(jù)文檔的下載次數(shù)來篩選出比較優(yōu)質(zhì)的文檔,然后讓大模型重點(diǎn)學(xué)習(xí)這些文檔。
PPT 工具中也是類似,系統(tǒng)會(huì)自動(dòng)提供已經(jīng)整理過的圖片,并生成提示,用戶可以根據(jù)這些數(shù)據(jù)進(jìn)行修改。
漫畫的話,通常會(huì)同時(shí)生成兩張圖片供用戶選擇,成本比較高,但效果并不是太好,因?yàn)橛袝r(shí)候用戶對(duì)哪張都不太滿意。
張鵬:這種情況可以做局部修改?
王穎:漫畫功能支持局部修改。
張鵬:這樣就解決了一致性的問題。
王穎:一個(gè)是一致性問題的解決,另一個(gè)是滿意度的提高。例如用戶只對(duì)圖像的臉部滿意,而對(duì)身體部分不滿意,那么評(píng)分可能只有 60 分;而如果整體都滿意了,評(píng)分可能會(huì)達(dá)到 80 分。
張鵬:這種方式在交付、交互和數(shù)據(jù)循環(huán)上都是有效的。
王穎:對(duì),我們會(huì)在模型上進(jìn)行局部控制。比如,我們將分享和轉(zhuǎn)發(fā)按鈕放在顯眼位置,方便用戶操作后進(jìn)行分享和轉(zhuǎn)發(fā)。這樣的設(shè)計(jì)不僅能夠提升用戶體驗(yàn),也能更有效地引導(dǎo)用戶參與,為后續(xù)進(jìn)一步優(yōu)化提供參考。
張鵬:橙篇算是文庫下面一個(gè)「特種部隊(duì)」?
王穎:它跟文庫是平行的兩個(gè)產(chǎn)品,但是底座的基座能力、基座算法、編輯器都是一套,不同主要在于前端的交互方式,除此之外,就是不同的產(chǎn)品團(tuán)隊(duì)在與模型對(duì)接。
張鵬:橙篇與文庫為用戶提供了兩種典型的創(chuàng)作方式:一種是原生創(chuàng)作加資料參考,另一種是資料參考加創(chuàng)作,最終的目標(biāo)都是打造創(chuàng)作的操作系統(tǒng),兩者的價(jià)值在于解鎖更多高質(zhì)量的內(nèi)容供給,從而激發(fā)需求,并通過內(nèi)容分發(fā)建立連接,最終形成完整的閉環(huán)。
王穎:對(duì),先從激發(fā)需求開始。
張鵬:過去發(fā)現(xiàn),互聯(lián)網(wǎng)領(lǐng)域里只要能夠指數(shù)級(jí)提升創(chuàng)作者的數(shù)量,就有機(jī)會(huì)誕生新的分發(fā)平臺(tái)。你們相信現(xiàn)在又有這樣的機(jī)會(huì)了。
王穎:文庫的目標(biāo)是平衡消費(fèi)者和創(chuàng)作者之間的關(guān)系。過去,消費(fèi)者遠(yuǎn)遠(yuǎn)多于創(chuàng)作者,因?yàn)楹芏嗳擞X得創(chuàng)作是一件很難的事。
文庫的核心是讓每個(gè)消費(fèi)者都能成為創(chuàng)作者,通過進(jìn)一步降低創(chuàng)作門檻,擴(kuò)大創(chuàng)作者群體,促進(jìn)更多內(nèi)容的涌現(xiàn),從而吸引更多人來消費(fèi)。
張鵬:文庫怎么定義 24 年的目標(biāo)?這里面的優(yōu)先級(jí)是什么樣的?
王穎:最重要的是有多少用戶使用,也就是 DAU 或者 MAU。這可能不是唯一的標(biāo)準(zhǔn),但是是很客觀的標(biāo)準(zhǔn)。用戶愿意使用甚至持續(xù)使用某個(gè)產(chǎn)品,說明這個(gè)產(chǎn)品真的給他們帶去了價(jià)值。對(duì)于文庫這種依賴用戶主動(dòng)參與的線上業(yè)務(wù),這是很重要的。
張鵬:未來文庫里的交互會(huì)出現(xiàn)根本性的變化嗎?
王穎:會(huì)?,F(xiàn)在有一個(gè)改版在醞釀了,后面還會(huì)有一個(gè)版本。
張鵬:交互變化的思路原則是什么?
王穎:更傾向于自然交互。7 月底,橙篇 APP 出來之后,應(yīng)該會(huì)跟完全大家想的不一樣。
 
*頭圖來源:百度文庫
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

最新文章

極客公園

用極客視角,追蹤你不可錯(cuò)過的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現(xiàn)。

張鵬科技商業(yè)觀察

聊科技,談商業(yè)。