展會信息港展會大全

李彥宏宣布文心大模型4.0正式發(fā)布,“生成式AI和搜索是天作之合”
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-17 19:34:35   瀏覽:5097次  

導(dǎo)讀:騰訊新聞《一線》劉雨點 在百度世界大會2023上,百度董事長兼CEO李彥宏宣布文心大模型的4.0正式發(fā)布。他稱:這是我們認為迄今為止最強大的文心的大模型,它的基礎(chǔ)模型實現(xiàn)了全面的升級。在理解、生成、邏輯、記憶這四大能力上,相比現(xiàn)在大家線上用的文心一言...

科技新聞《一線》劉雨點

在百度世界大會2023上,百度董事長兼CEO李彥宏宣布文心大模型的4.0正式發(fā)布。他稱:“這是我們認為迄今為止最強大的文心的大模型,它的基礎(chǔ)模型實現(xiàn)了全面的升級。在理解、生成、邏輯、記憶這四大能力上,相比現(xiàn)在大家線上用的文心一言的版本是有明顯的提升。綜合水平跟GPT4相比,也已經(jīng)毫不遜色。”

在他看來,要用理解、生成、邏輯、記憶這四個能力來做應(yīng)用,才是AI時代的原生應(yīng)用。

在會議上,李彥宏宣布了幾項百度基于AI的業(yè)務(wù)重構(gòu)和推出的原生應(yīng)用。

其中最重要的是,百度搜索已經(jīng)基于AI大模型完成重構(gòu)。

李彥宏說,搜索雖然還是從簡單的搜索框開始,但是接下來的一步一步都已經(jīng)超越了、重構(gòu)了原來的搜索模式,不僅提升了搜索的質(zhì)量,而且突破了搜索的應(yīng)用范圍,擴大了產(chǎn)品的邊界。這樣的AI互動式的搜索,將引領(lǐng)搜索行業(yè)的代際變革。

他接著說道,在不久的將來,搜索會變成一個貼心的助手,能夠隨時喚起解決問題,甚至打破端的限制,做到隨時隨地響應(yīng),滿足所需,全程陪伴。“生成式AI和搜索其實是天作之合。”李彥宏說。

其次,百度發(fā)布AI原生思維產(chǎn)品百度GBI(Generative Business inteligence),也就是生成式商業(yè)智能。他稱,這不是重構(gòu)的產(chǎn)品,而是從零開始做出來的新產(chǎn)品。

他認為,在我們的商業(yè)世界里面,其實最離不開的就是商業(yè)分析,也就是BI。

百度的GBI從三個方面顛覆了傳統(tǒng)的數(shù)據(jù)分析:首先是傳統(tǒng)的BI只有專業(yè)人士才能夠操作,而GBI能夠聽懂總裁的問題并實時去執(zhí)行;其次GBI提供了便捷的接入方式,企業(yè)可以接入數(shù)據(jù),并且用任意的數(shù)據(jù)用自然語言來進行提問、分析,而不是像過去需要專業(yè)的跨數(shù)據(jù)庫、跨表格去做各種各樣復(fù)雜的操作;第三是GBI具備學(xué)習(xí)能力,企業(yè)可以注入自己所在行業(yè)的專業(yè)知識,讓GBI成為一個行業(yè)專家。

此外,他們將百度智能辦公平臺如流、百度文庫、百度網(wǎng)盤等傳統(tǒng)業(yè)務(wù)也都基于AI進行了重構(gòu)。

以下為李彥宏演講文字實錄:

李彥宏:各位來賓大家好!歡迎來到2023百度世界大會,歡迎來到生成式人工智能的時代!這次大會的主題聚焦AI原生應(yīng)用,我會詳細跟大家分享在過去幾個月百度對旗下各個產(chǎn)品線進行原生化的重構(gòu)這個過程當(dāng)中獲得的心得和體會,希望對大家能夠有所幫助。

眾所周知,AI原生應(yīng)用是基于大模型來開發(fā)過去一年,科技領(lǐng)域最大的創(chuàng)新無疑就是大模型帶來的智能涌現(xiàn),這是我們開發(fā)AI原生應(yīng)用的基矗

百度的AI原生應(yīng)用也是基于文心一言來開發(fā)的,大家知道文心一言首發(fā)是今年的3月16號,之后我們快速進行迭代,在今年的8月31號又獲得了批準(zhǔn)向全世界開放。自此之后,其實我們獲得的用戶反饋也在不斷地增多,創(chuàng)新速度實際上是在不斷加快的。

今天,我非常高興地在這里宣布,文心大模型的4.0正式發(fā)布了!同時,我們也同步開始邀請測試,今天來到現(xiàn)場的各位朋友,你們只需要掃描自己嘉賓證上的二維碼就可以獲得邀請測試的權(quán)限,你登陸文心一言的官網(wǎng)或者下載最新版的文心一言的APP,就可以體驗到文心一言的專業(yè)版,它背后就是文心大模型的4.0的版本了。這是我們認為迄今為止最強大的文心的大模型,它的基礎(chǔ)模型實現(xiàn)了全面的升級。在理解、生成、邏輯、記憶這四大能力上,相比現(xiàn)在大家線上用的文心一言的版本是有明顯的提升。綜合水平跟GPT4相比,也已經(jīng)毫不遜色。

所謂的AI原生應(yīng)用,我的理解就是基于大模型的理解、生成、邏輯、記憶能力開發(fā)出來的應(yīng)用,因為這些能力是過去的時代所不具備的,所以它才能夠打開無限的創(chuàng)新空間。下面,我就結(jié)合應(yīng)用場景來給大家介紹一下文心一言的四大能力,要用這四個能力來做應(yīng)用,才是AI時代的原生應(yīng)用。

首先,我們講一下理解能力。這個能力是我在接觸大模型之后,其實感覺最神奇的地方。過去我們講AI是人工智障,就是AI經(jīng)常聽不懂人話,久而久之就不太敢說太多的人話了。但是,今天你說的每一句話它大概率都能聽懂,很多時候比你的同事、朋友更能夠懂你在說什么。我們舉個例子,假如說你是一位在北京工作的年輕人,你想在河北購房,那么想知道在北京申請公積金貸款行不行。我們來測試一下文心一言的理解能我來給大家演示。(演示)

大家可以看到,這個文心一言回答是可以用公積金貸款的。為什么說這段回答體現(xiàn)了大模型的理解能力?其實剛才我給的PROMPT看似簡單,實際上是有好幾個小的陷阱的。

首先,這是一個前后亂序的表述,大部分人在打電話提問的時候,他是想到哪兒說到哪兒,不會那么嚴(yán)謹(jǐn)。就像剛才說的PROMPT,我先說了要買房,要辦理公積金,最后才說我在北京工作,那么這個對理解能力其實就提出了更高的要求。

第二,我這里頭也用了兩個比較模糊的表述,一個是說在北京工作,潛臺詞是說公積金是在北京繳存的。另外是回承德買房,這里頭暗示了我大概是承德的戶口。

第三,文心一言結(jié)合上下文,把所有的信息都組合在一起,準(zhǔn)確地理解了真正的問題,就是一個在河北承德戶籍的用戶能不能用北京的公積金在承德貸款買房?然后再針對這個問題給出相應(yīng)的回答。

我們可以看到文心一言已經(jīng)可以對前后亂序的表述、比較模糊意圖的表達、話語中的潛臺詞都進行相當(dāng)準(zhǔn)確的理解,這些能力在政務(wù)、營銷、客服等等領(lǐng)域,其實都有非常廣泛的應(yīng)用前景。

這是大模型的理解能力,我們再來講一下大模型的生成能力。大模型可以生成文字、圖片、視頻各種各樣多模態(tài)的內(nèi)容。我們今天來讓文心一言生成一套廣告素材,我們先給它一張原始的圖片,這是一張汽車的圖片,然后再來說一段PROMPT。這是長安新推出的新能源車,請幫我生成兩張圖片,背景是春天,富有生機的景色,同時呈現(xiàn)車的飛馳感。

我們看到生成的結(jié)果確實體現(xiàn)到了春天生機勃勃的樣子,而且還配上了飛馳的時候的模糊感,這是根據(jù)一張原始圖片生成兩張圖片。下面我讓它直接生成一個豎版的海報。“結(jié)合長安觀望上長安啟源的信息,做一張豎版的海報,寫上簡約優(yōu)雅的文案與車身樣式相呼應(yīng)。”我們生成了一張同時具備文字和圖片的豎版的海報。我們再來提更多的要求,我們現(xiàn)在擁有了一張海報,還需要更加豐富的廣告文案,可以請文心一言再來寫幾條。“這款車強調(diào)數(shù)智座艙、扶光設(shè)計、品質(zhì)駕乘,請再寫五條廣告文案,每條文案需要包含簡短標(biāo)題和一段描述。”AI寫出來的文案,里這樣里面有科技之美、時代風(fēng)潮之類的描述,還強調(diào)人機交互,文案是比較專業(yè)和流暢的,應(yīng)該說已經(jīng)達到了品牌營銷使用的標(biāo)準(zhǔn)。

接下來,想讓它幫我生成視頻廣告,“請結(jié)合官網(wǎng)信息和已有的視頻內(nèi)容,生成一個數(shù)字人的口播視頻,我想投放信息流廣告。”現(xiàn)在視頻已經(jīng)生成了,我們來看一看播放出來是什么效果。(視頻)

這確實是比較有特色的數(shù)字人的口播視頻,也體現(xiàn)出了這款車的特點,F(xiàn)在我們擁有了一條廣告片、五個廣告文案,還有一張海報。而我僅僅是給了文心一言一張原始的圖片和幾個像數(shù)智座艙、品質(zhì)駕乘的詞語作為PROMPT,而且全過程只用了不到三分鐘。

不久前,我們利用生成功能推出了AIGC營銷創(chuàng)意平臺擎舵,它是讓一個人就可以成為一支AI的營銷隊伍。今天現(xiàn)場有不少做文案策劃的朋友,看到這些你們會不會覺得大模型帶來創(chuàng)意上的啟發(fā),幫助你們提升效率。

接下來講第三個能力,邏輯推理的能力。很多人經(jīng)常給孩子輔導(dǎo)作業(yè),有時候開玩笑說,不寫作業(yè)母慈子孝,一寫作業(yè)雞飛狗跳。文心一言能不能幫助家長解決輔導(dǎo)功課的問題?我現(xiàn)在編一道數(shù)學(xué)題,看看文心一言的表現(xiàn)。“錐形的沙堆,底面積是8平米,高12公分,把這堆沙子鋪在寬兩米的路上,厚度5厘米,能鋪多少米路?”這是一類小時候都做過的數(shù)學(xué)題,從文心一言的回答來看,它的邏輯還是非常清晰的,每一個解題的步驟都給了出來,我們的家長們可以看一看這是不是比一些輔導(dǎo)教材上給出來的答案還要更加詳細?

甚至AI還能夠指出解題當(dāng)中用到的知識點,幫助我們的孩子鞏固和學(xué)習(xí),現(xiàn)在我來再問它一下。“上述解題過程都涉及了哪些知識點?”文心一言其實明確給出了這道題涉及到的圓錐體積公式、統(tǒng)一計量單位、體積保持不變,還有解方程等等知識點,這個對于學(xué)生、老師、家長其實都很實用。這些知識點都清晰地掌握以后,必將使得孩子具備舉一反三的能力。

大模型有著比較超強的邏輯能力,當(dāng)然這個能力不僅僅可以用在解數(shù)學(xué)題上,事實上在比如說智能地圖的路線策劃、智能助理處理復(fù)雜任務(wù)、智能交通系統(tǒng)的紅綠燈的控制等等,其實都需要用到大模型的邏輯能力。

我們再看大模型的第四項能力,記憶能力。這里面的記憶主要指你前面說過的話,AI記不記得祝AI生成的內(nèi)容,前后會不會產(chǎn)生矛盾,這個是區(qū)別大模型智能程度的一個重要指標(biāo)。我們通過多輪對話,就能夠體現(xiàn)出來大模型的記憶能力。很多創(chuàng)作者都在利用文心一言在做小說的創(chuàng)作,而小說的內(nèi)容如果說前后矛盾的話,那它就沒有可讀性了。今天我就讓文心一言現(xiàn)場寫一個小說,然后穿插一些干擾性的問題,看看它能不能記得住自己寫過的內(nèi)容。我來先說一個PROMPT,“請幫我寫一篇武俠小說,主人公是個女俠,情節(jié)要跌宕起伏一些。”我們看到小說的大綱已經(jīng)寫出來了,首先是故事的背景,在古代的武林世界黑暗勢力正在崛起,女主角叫靈兒,擁有操縱內(nèi)力和飛行的力量。那接下來就是故事的開篇,靈兒要擊敗黑暗勢力拯救武林,在小說的總高潮是她和反派進行了生死決戰(zhàn),擊敗了反派,拯救了武林和所有門派。最后靈兒和盟友們一起建立了內(nèi)力修行所。

現(xiàn)在這個故事基本成行了,但是有點簡單,我想再增加一些角色的需求。“現(xiàn)在人物關(guān)系太簡單了,只有兩個角色,再增加四個角色。”我們看到文心一言又給出四個角色,每個角色都有不同的身份和性格,有著不同的人設(shè),其中慕容孤城是一代宗師,蕭寒雁是預(yù)測未來的先知。但是現(xiàn)在缺一個小說中必備的要素,就是戲劇沖突,沒有沖突的故事就不是好故事。

剛剛女主打敗黑暗勢力的過程,也是有點簡單,我們看看能不能加大一點難度。“還要給故事增加主線的戲劇沖突,讓故事更有可看性。”我們看到它也把戲劇沖突寫好了,這里頭實際上涉及到一個反轉(zhuǎn),就是黑暗勢力背后真正主導(dǎo)者是一位德高望重的宗師級的人物,好幾次讓女主陷入了險境,直到?jīng)Q戰(zhàn)女主才有了真正反殺的機會。

可以看到它其實是記住了故事的主線是靈兒和黑暗勢力的對決,沖突也是圍繞這樣的主線來展開的。文心一言還記不記得剛才寫過的故事,并且把故事和這些角色能夠?qū)?yīng)上呢?我們再來提下一個需求,“把這些角色帶入到你給我設(shè)計的故事大綱中吧,并且設(shè)計一個標(biāo)題。”

我們看到結(jié)果已經(jīng)顯示在大屏幕上,這篇小說叫做《江湖風(fēng)云之正義之戰(zhàn)》,它補充的人物和戲劇沖突在大綱里頭,其中第四章和第五章告訴我們反派宗師其實就是剛剛介紹過的慕容孤城。在整個過程當(dāng)中,其實我不斷地在加大難度,提出新的要求,去干擾它的記憶。文心一言依然記住了前面所有的需求答案,能夠把故事情節(jié)和人物準(zhǔn)確對應(yīng)上,記憶力是非常不錯的。

現(xiàn)在我來考一考在現(xiàn)場的大家,你們還記不記得主人公靈兒具有什么樣的特殊能力?大部分人可能不記得了,我們問問文心一言還記得不記得?“女主角擁有的能力是什么?”答案出來了,是操縱內(nèi)力和飛行的力量,這就是在第一輪對話當(dāng)中文心一言寫下來的文字。現(xiàn)在經(jīng)過五輪的對話和幾千字小說內(nèi)容的生成之后,它還記得之前寫過的內(nèi)容,這個就是大模型具備的所謂的記憶的能力。

我們剛剛體驗了大模型的四大能力,當(dāng)然這些能力在大部分時候不是單一的體現(xiàn)在產(chǎn)品中的,恰恰相反它都是綜合的用,相輔相成。像剛才創(chuàng)作廣告文案,它就需要理解創(chuàng)作的主題、厘清創(chuàng)作的邏輯,通過記憶來保持前后一致。在解數(shù)學(xué)題的過程當(dāng)中,也是需要綜合的運用理解、生成、邏輯和記憶的能力。

我們再來看一個綜合應(yīng)用這四項能力的案例,請看大屏幕。首先我們要打開重構(gòu)后的百度APP,用攝像頭掃一下患者拿出來的藥盒,然后就不用再看小字的使用說明書了,這里有數(shù)字醫(yī)醫(yī)生來幫你進行講解。(演示)

剛才屏幕上出現(xiàn)的這些問題,比如飯前吃還是飯后吃,喝酒能不能吃,還有什么注意事項等等,都是很多患者在日常用藥的過程當(dāng)中遇到的問題。我們看到大模型不僅可以幫助患者做用藥說明書的解讀,還可以結(jié)合個性化的需求來提升用藥效率,確;颊叻幍臏(zhǔn)確性和及時性。

不久前,我們將文心的大模型和專業(yè)的醫(yī)療知識結(jié)合,發(fā)布了靈醫(yī)大模型。它的上層應(yīng)用靈醫(yī)bot可以幫助患者和醫(yī)生對話生成病例,這個例子不僅僅用在理解、生成、邏輯、記憶的能力,而且還有語音、視覺多模態(tài)的能力。

前面的演示主要體現(xiàn)文心大模型在理解、生成、邏輯和記憶四大能力上的進步,這些能力可以說是一切的AI原生應(yīng)用賴以生存的基礎(chǔ),所以我們花了挺大的篇幅來講解大模型擁有的能力。

但是反過來講,沒有一個構(gòu)建于基礎(chǔ)模型之上的豐富的AI原生應(yīng)用的生態(tài),大模型其實就一文不值。也正是因為這個原因,我在5月份的時候就公開講說,“百度要做第一個把所有的應(yīng)用都重做和重構(gòu)的公司,我們要用AI的思維做出AI時代的原生應(yīng)用”。現(xiàn)在幾個月過去了,我們的搜索、如流、地圖、網(wǎng)盤、文庫等等產(chǎn)品,都將以一個全新的面目跟大家見面,當(dāng)然這中間踩過不少坑,我也愿意拿出來跟大家分享,希望你們在開發(fā)過程中少走彎路。下面我就給大家展示一下這些用大模型重構(gòu)過的產(chǎn)品到底長什么樣,我相信能夠幫助大家拓展你們的想象力,激發(fā)大家一起來做出更驚艷的AI的原生應(yīng)用。

我首先向大家展示我們的搜索因大家知道這是百度的起點。很多人對搜索的印象,還是你輸入一個關(guān)鍵詞,然后百度給你一個一個的網(wǎng)頁鏈接。

百度的新搜索在打開界面的時候除了看到一個搜索框,就是你的使用習(xí)慣不用變,搜索結(jié)果和過去相比就完全不一樣了。重構(gòu)后的新搜索它有三個特點:極致滿足、推薦激發(fā)和多輪交互。

什么是極致滿足?當(dāng)你在搜索框里輸入問題,比如說MBTI是什么?怎么側(cè)方停車?新的搜索不是給你一堆堆的鏈接,而是通過大模型去理解,然后生成一個最好的答案。比如我們詢問“過去二十年,各國工業(yè)增加值排名”,新的搜索不僅會直接告訴你答案,還可以用動態(tài)的圖表來展現(xiàn)這個答案。從我身后的大屏幕可以看到,在過去二十年我們的工業(yè)制造經(jīng)歷了飛速的發(fā)展,中國從制造大國正在向制造強國轉(zhuǎn)變,這就是所謂的極致滿足,也就是一步給你最極致的答案。

第二步在看到這些極致答案之后,你還想看什么內(nèi)容?這就是我們講到的推薦激發(fā)。比如在動態(tài)圖之后,推薦激發(fā)功能就再給你提示一些工業(yè)增加值和GDP有什么關(guān)系?工業(yè)對國民經(jīng)濟發(fā)展有什么影響?這些你有可能關(guān)心的問題,點擊之后也能大家相應(yīng)的答案。

大家也知道并不是所有需求都有一個唯一正確的答案,用戶的需求有時候會很復(fù)雜,有時候自己都沒想清楚真實需求是什么。即使想清楚了,一兩句話也說不清楚,所以我們很難要求一個用戶把非常復(fù)雜的要求一次性通過大段的描述來完整表述出來。這個時候怎么辦?我們就要用更加新穎的、更有個性化特點的搜索模式來服務(wù)用戶,這就是我們的多輪交互。

我們來看一下這個例子。比如你在詢問“北京周邊登山去哪兒比較推薦?”它給出了多個答案,也比較偏向走徒步路線。然后它又給了幾個提示,讓你補充選擇自己的情況,你可以選擇新手、親子、觀賞落葉的幾種情況,F(xiàn)在它改為推薦西山和百望山,相對好爬,而且對親子活動也是比較友好的。再繼續(xù)提問“登山徒步需要什么裝備”,回答有登山杖、登山鞋等等。它還記得前面選擇了親子游,特別提示了怎么照顧小朋友。所以生成式AI和搜索其實是天作之合!

搜索雖然還是從簡單的搜索框開始,但是接下來的一步一步都已經(jīng)超越了、重構(gòu)了原來的搜索模式,不僅提升了搜索的質(zhì)量,而且突破了搜索的應(yīng)用范圍,擴大了產(chǎn)品的邊界。這樣的AI互動式的搜索,將引領(lǐng)搜索行業(yè)的代際變革。

在不久的將來,搜索會變成一個貼心的助手,能夠隨時喚起解決問題,甚至打破端的限制,做到隨時隨地響應(yīng),滿足所需,全程陪伴。

下面,我們來看第二個AI原生思維的產(chǎn)品,叫做百度GBI(Generative Business inteligence),也就是生成式商業(yè)智能。這不是重構(gòu)的產(chǎn)品,而是從零開始做出來的新產(chǎn)品。在我們的商業(yè)世界里面,其實最離不開的就是商業(yè)分析,也就是BI。怎么做出最快的商業(yè)決策?現(xiàn)在請大家通過一個視頻來感受一下。(視頻)

大家看到剛才視頻里頭總裁是問了很多非常專業(yè)的問題,有財務(wù)分析的,有項目交互的,還有用戶分析的,運用了GBI的總裁助理都能夠很快地給出來結(jié)果,讓這位總裁當(dāng)場決策。這就是基于大模型的能力做出來的決策利器,也是國內(nèi)首個生成式商業(yè)智能產(chǎn)品百度GBI。剛才說,用GBI干啥都快,確實此言不虛。掌握先進工具的人不僅不會被AI所取代,而且可以說升職加薪不是夢,反而不適用先進工具的人反而有丟掉工作的風(fēng)險。

百度的GBI是怎么做到快人一步的?其實從三個方面顛覆了傳統(tǒng)的數(shù)據(jù)分析:首先是傳統(tǒng)的BI只有專業(yè)人士才能夠操作,而GBI能夠聽懂總裁的問題并實時去執(zhí)行;其次GBI提供了便捷的接入方式,企業(yè)可以接入數(shù)據(jù),并且用任意的數(shù)據(jù)用自然語言來進行提問、分析,而不是像過去需要專業(yè)的跨數(shù)據(jù)庫、跨表格去做各種各樣復(fù)雜的操作;第三是GBI還具備學(xué)習(xí)能力,企業(yè)可以注入自己所所行業(yè)的專業(yè)知識,讓GBI成為一個行業(yè)專家。這就是百度GBI,可以把商業(yè)分析師十幾天完成的分析、撰寫、報告縮短到分鐘級,所謂天下武功唯快不破,企業(yè)競爭不是大魚吃小魚,而是快魚吃慢魚,這些話我們聽了很多,但是今天真正擁有利器了。當(dāng)你比競爭對手能夠更快的決策,很可能你就贏了。

說到快速決策,在百度我們依賴智能辦公平臺:如流。我們也利用AI重構(gòu)了這個應(yīng)用,如今已經(jīng)成為百度人離不開的超級助理,F(xiàn)在大家請看,這個是如流在做實時的記錄,我們看看它是不是能夠把剛才講過的要點內(nèi)容都記祝(視頻)

這是如流會議紀(jì)要一鍵生成功能,如流的這個功能極大的減少了會議的工作量,讓開會的時間縮短了40%。

另外的工作場景是工作群,大量的職場人常常被各種各樣群聊信息所轟炸,快速總結(jié)群聊的重點就成為極其實用的功能。下面請大家看一看如流的產(chǎn)品經(jīng)理是如何使用它的。(視頻)

他有9個工作群,耽擱半天時間可能上千條未讀信息。如流不僅可以一千條信息一秒鐘get重點,還可以智能地把需要閱讀的內(nèi)容分為帶我確認、重點關(guān)注、話題討論幾個類別,這樣就大大提高了工作效率。它究竟提煉的準(zhǔn)不準(zhǔn),會不會理解有錯誤或者漏掉一些關(guān)鍵信息?這就是考驗大模型的理解能力和生成能力,理解越深刻,總結(jié)就越精確,不要說一千條,哪怕是一萬條,如流的超級助理也一樣可以在幾秒鐘之內(nèi)給出智能的分類和智能的總結(jié)。

我們再看工作另外的場景,就是差旅。機票、酒店、談參這些非常繁雜,也非常耗時間。如果人手都有AI助理,幫助你解決瑣碎的事,你是不是會更喜歡你的工作一些?比如最近我們的如流產(chǎn)品經(jīng)理計劃出差去上海和人保的王總見面。我們知道人保集團正在推動產(chǎn)品、服務(wù)、商業(yè)模式、數(shù)字科技等等方面的創(chuàng)新,百度的人工智能技術(shù)正好可以在這里發(fā)揮作用。這次出差的行程安排就可以交給如流超級助理,我們一起來看一看它的表現(xiàn)。(演示)

超級助理可以根據(jù)日程信息來安排行程,像比如說最晚的會議是4點鐘結(jié)束,飛機就要預(yù)定到7點半以后,以及按照他的差旅標(biāo)準(zhǔn)幫助他找到可以住宿的酒店,最后向客戶發(fā)出了會邀。

與客戶見面之前需要合作的背景,這一點如流的超級助理也可以幫他完成。通過與公司的系統(tǒng)數(shù)據(jù),比如CRM數(shù)據(jù)打通,如流就給出了合作項目、拜訪記錄等等細節(jié)的數(shù)據(jù)。

通過理解業(yè)務(wù)合作情況和外部的信息,如流幫他生成了一份談參,預(yù)設(shè)客戶可能提出的問題,還給出了一些合作的建議。從這一點上,大家看如流的超級助理是不是真的很像一個真人的助理?

我們剛剛看到只用三句話,如流就搞定了差旅單、機酒、日程的預(yù)定,甚至準(zhǔn)備了洽談的參考資料,這就是如流的一鍵差旅。這是怎么做到的呢?這個就是大模型的理解生成、理解、記憶、邏輯的綜合應(yīng)用,把復(fù)雜的任務(wù)拆解成多個簡單的任務(wù)分別去執(zhí)行,再合并成最終的結(jié)果。提升效率就是提升競爭力,而如流讓智能工作代替了勤奮工作。

現(xiàn)在再來看下一個產(chǎn)品,百度文庫。這也是我認為目前重構(gòu)的最徹底的一款產(chǎn)品,百度的文庫將徹底顛覆辦公、學(xué)習(xí)和創(chuàng)作的習(xí)慣。過去是怎么創(chuàng)作的?假如說你要做一場演講,比如講AI在心理學(xué)領(lǐng)域的應(yīng)用,查資料、整理素材、寫稿、寫PPT、美化PPT,你得花上好幾天的時間。今天在百度文庫上可以用一句話啟動這項工作,請看大屏幕。首先你希望它撰寫一篇演講稿,圍繞人工智能和心理學(xué)的主題讓它找到幾十份的資料。它還能識別出來哪些是學(xué)術(shù)期刊、權(quán)威報告,哪些只是大眾的材料。如果想寫一篇生動活潑的文章就寫大眾素材,比如散文、科普類文章。但是如果你要想寫一篇嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)演講稿,就可以只勾選權(quán)威的內(nèi)容,保證內(nèi)容的準(zhǔn)確性。然后文庫通過理解這些文稿資料,再生成一個結(jié)構(gòu)完整、段落清晰的文章,同時對內(nèi)容做出潤色和排版。能做誰到一些,是因為百度文庫已經(jīng)擁有了十億優(yōu)質(zhì)的文檔,基于這些內(nèi)容可以寫出來真正實用的清晰的文稿,而不是像很多大模型一樣一本正經(jīng)的胡說八道,它也不會泛泛地去空談。

下一步演講還需要PPT,文庫可以把剛剛這篇稿子和你收藏過的一些資料相結(jié)合,自動生成PPT框架,然后再美化作圖,做出幾十頁的PPT。

這里還有一些多模態(tài)的生成能力的玩法,比如說風(fēng)格的選擇、風(fēng)格的一鍵切換。但是還有一些更考驗文庫能力的地方,就是需要對內(nèi)容有精準(zhǔn)的理解。比如需要知道觀點之間的關(guān)系是并列關(guān)系,還是從屬關(guān)系,這樣才能設(shè)計出來正確的圖表。因為有這樣的理解能力,文庫在生成PPT的基礎(chǔ)上,還可以把這份PPT對應(yīng)的演講稿也給你寫出來。不僅如此,它還能根據(jù)這些內(nèi)容推演出觀眾可能會提出什么問題,然后問你準(zhǔn)備好這些問題的答案。

我們評測過,文庫這些生成能力,尤其是PPT的生成能力,已經(jīng)遠超了市場上任何的其他工具。無論是國外的,還是國內(nèi)的工具。過去人們來文庫是為了找現(xiàn)成的內(nèi)容,今后可以隨心所欲來文庫生產(chǎn)內(nèi)容,效率高于任何其他的生產(chǎn)力工具。基于文心大模型的四大能力,毫不夸張地說,百度文庫已經(jīng)從根本上革了自己的命,它完成了從一個內(nèi)容工具向生產(chǎn)力工具的進化。

不久之前,百度文庫新版本開放的第一天,AI的這些新功能就迎來了超過200萬人次的體驗。現(xiàn)在,我們可以更加有信心地說“大模型時代百度文庫是生產(chǎn)內(nèi)容最好的起點”。

與文庫一樣,百度網(wǎng)盤是大家非常熟悉的老朋友。過去十一年,網(wǎng)盤為8億用戶提供服務(wù),文件量級超過4萬億,每一天都有用戶上傳圖片超過10億張,所以百度網(wǎng)盤在重構(gòu)的方向上重點就是要做好個人文件的智能服務(wù)。

大家看到百度網(wǎng)盤新的首頁,重構(gòu)之后的百度網(wǎng)盤不但實現(xiàn)了從圖形交互界面到自然語言交互界面的轉(zhuǎn)變,還增強了多模態(tài)信息理解的能力,F(xiàn)在只要一句話就能夠?qū)ψ约壕W(wǎng)盤里頭的文件、圖片、視頻來進行操作,我們這個功能叫做百度網(wǎng)盤的云一朵,它是業(yè)界乃至全球首個個人云的智能助理,F(xiàn)在我們就來感受一下云一朵能夠解決哪些痛點,帶來什么樣的新體驗。

第一,找圖片或視頻。有時候明明想起來一個畫面,知道它存在網(wǎng)盤當(dāng)中,但是要找到這個東西往往需要很多步的操作,甚至折騰半天也沒找到。現(xiàn)在你對云一朵說一句話,它就能夠幫你精準(zhǔn)地定位。

它幫我快速地找到了OpenAI首席科學(xué)家eliassource (音)采訪當(dāng)中關(guān)于Transformer的內(nèi)容。在看似簡單的搜索背后,實際上是多個AI能力在起作用,它需要理解視頻的內(nèi)容,識別里面不同的角色,還要對上下文有記憶,才能精準(zhǔn)定位到視頻當(dāng)中的某一鄭這個技術(shù),其實在全球都是非常領(lǐng)先的。

第二,幫助用戶快速了解視頻的內(nèi)容。大家看到演示了兩個能力,一個是對內(nèi)容進行總結(jié)和摘要的能第二個是提取金句的能力。這是一段長達43分鐘的采訪,我們通過AI的理解和邏輯能力,云一朵對視頻做了提煉和總結(jié),介紹了他的主要觀點。很多時候我們覺得原文很精彩,提煉出來的主要觀點或摘要之后就沒有那么吸引人了,所以剛才第二個功能其實對我來說更有用,也就是要找到原來視頻當(dāng)中最精彩的部分,就是那些金句。比如他說學(xué)習(xí)統(tǒng)計規(guī)律比眼見為實要重要得多,提煉出來這個金句在其中的關(guān)鍵突破就是實現(xiàn)了多模態(tài)信息的高效提取,這個技術(shù)在全球也是非常領(lǐng)先的,它能夠從很長的訪談當(dāng)中找到最精華的部分,極大的提高了學(xué)習(xí)和工作的效率。

這就是我們用AI重構(gòu)后的新網(wǎng)盤,截止到昨天云一朵的用戶已經(jīng)達到了2000萬,它是基于個人云的AI智能助理。如果說過去十年百度定義了什么叫做網(wǎng)盤,那么未來十年百度將用AI重新定義新的網(wǎng)盤。

接下來來看一個更為歷史悠久的產(chǎn)品,就是百度地圖。我們用AI原生思維重構(gòu)了已經(jīng)走過了18年路程的產(chǎn)品,這也是全球首個AI原生地圖產(chǎn)品。

在過去的18年當(dāng)中,百度地圖積累了非常豐富的功能,它可以導(dǎo)航、打車、找代駕、訂酒店、買機票,甚至滿足更為復(fù)雜條件下的POI的查找尋求。過去這些操作非常復(fù)雜,往往需要六七步,甚至有些功能需要大概二十步以上才能夠完成,F(xiàn)在用戶只要說出其中的需求,地圖就可以調(diào)動幾千個服務(wù)的API接口來把多級菜單變成一步直達、快速響應(yīng)。我們接下來看一下百度地圖是怎么實現(xiàn)的。(視頻)

在這個視頻里面,用戶考驗了百度地圖對于泛需求的理解,中間聚會地點的選取,多個地點的信息對比,以及對于未來出行的推薦和預(yù)約,它都給出了非常合理的答案。這就是因為文心一言的能力已經(jīng)跟地圖特有的億級POI的信息,以及萬億級交通感知的數(shù)據(jù)進行了融合,能夠隨時調(diào)用給出推薦。

重構(gòu)之后的百度地圖,不只是導(dǎo)航,它更是我們的出行向?qū),可以說是越用越聰明,越來越懂你。

剛剛我們展示了六個線上的AI原生應(yīng)用,但是大模型帶來的改變不僅如此,它其實也影響著我們線下的工作和生活。比如說用大模型來重構(gòu)汽車的車內(nèi)空間,是否能夠給我們帶來驚喜?現(xiàn)在來看一段本月底即將交付的集度極越的視頻。(視頻)

大模型和智能座艙進行結(jié)合,你跟它交互越多就會越理解你的需求,不再需要復(fù)雜的各種各樣的按鍵操作,用語音就能夠操控車內(nèi)的一切,讓智能座艙擁有邏輯推理、策略規(guī)劃和內(nèi)容生成等各種的能力。即使是剛才那種環(huán)境七嘴八舌、多人指令、聲音交織、連續(xù)對話的情況下,它也能理解每個人不同的需求,并且同時滿足它。這些能力首先落地在由集度設(shè)計的極越01的機器人上,百度機器人在EQ和IQ兩個方面全面賦能這款新車,極越01也將成為最聰明、最懂你的汽車機器人。

今天我相信大家已經(jīng)感受到了AI巨大的能量,我更相信大模型將開啟一個繁榮的AI原生應(yīng)用的生態(tài)。說到生態(tài),我們就不能不提插件,插件非常重要,它可以讓開發(fā)者、創(chuàng)業(yè)者快速融入到新的生態(tài)當(dāng)中去?梢哉f插件是一種特殊的AI原生應(yīng)用,因為門檻最低,最容易上手。不久之前,百度也上線了靈境插件平臺,無論是個人或者企業(yè)的數(shù)據(jù)、能力或應(yīng)用,都能夠在靈境平臺上快速變成一個插件。

我們舉個例子,你從網(wǎng)上買了東西,賣家發(fā)貨跟實物不符,這個時候你想咨詢一下怎么要求賠償。這里頭的法律智能助手就可以給出建議,因為它接入了中國司法大數(shù)據(jù)研究院這樣的官方權(quán)威機構(gòu)提供的插件。再比如畢業(yè)求職季寫簡歷,你想做一名AI算法工程師,沒問題!我們只要輸入包含背景信息的PROMPT,大模型通過調(diào)用插件就能夠幫你一鍵生成簡歷模板。

插件增強了大模型的能力,讓它更加實用,也更易用,使得很多企業(yè)的私有數(shù)據(jù)在沒有泄漏風(fēng)險的情況下,能夠方便快捷地利用到最先進的大模型的能力,能夠降低我們開發(fā)者的開發(fā)門檻,能夠促進AI生態(tài)的快速成長和繁榮。

現(xiàn)在靈境的插件平臺上線其實短短的只有一個月的時間,我們已經(jīng)有2.7萬個開發(fā)者的申請入駐,覆蓋了20多個領(lǐng)域。除了法律咨詢、簡歷生成,還有像腦圖制作、口語練習(xí)等等各種各樣的場景。

原生應(yīng)用其實調(diào)用基礎(chǔ)大模型的主要方式,應(yīng)該說是API。在百度的千帆大模型平臺上,企業(yè)可以快速調(diào)取包括文心一言在內(nèi)的各種各樣的大模型的API來獲得這些大模型的能力。今天,千帆大模型平臺已經(jīng)成為了中國最大、最開放的大模型開發(fā)平臺,不僅有42個主流的大模型入駐,而且有17000家企業(yè)在這里開發(fā)產(chǎn)業(yè)模型和解決方案。同時,我們也覆蓋了將近500個不同的場景。我在這里也告訴大家,從今天開始,我們的企業(yè)客戶也可以通過千帆來申請測試文心4.0的API了。

我們中國有豐富的應(yīng)用場景,中國的用戶又天然愿意擁抱新的技術(shù),現(xiàn)在有的先進的基礎(chǔ)大模型就可以構(gòu)建起來一個非常繁榮的AI原生應(yīng)用的生態(tài),就可以共同創(chuàng)作新一輪的經(jīng)濟增長。

隨著這一波AI浪潮的到來,有些人會擔(dān)心自己會不會被AI所取代。但是,我們看到的實際情況是AI不僅不會取代人,AI還能救人。(視頻)

十秒鐘完成預(yù)警,十分鐘完成救援,哪怕是在瞬息萬變的現(xiàn)實世界里,AI也能夠根據(jù)風(fēng)險排查的邏輯對復(fù)雜的圖像、語言的理解第一時間找到潛在的風(fēng)險點,發(fā)出預(yù)警,避免悲劇的發(fā)生。

最后我還想說,未來的AI原生應(yīng)用一定是多模態(tài)的。在信息世界之外,一定會重構(gòu)我們的物理世界。而自動駕駛其實就是視覺大模型重構(gòu)物理世界的一個典型應(yīng)用。

大模型會讓百度的自動駕駛能力超越經(jīng)驗系統(tǒng),更聰明地處理復(fù)雜的場景,實現(xiàn)更為廣泛的時空覆蓋。下面我就請我的同事帶大家來感受一下,請看大屏幕。(視頻)

今天蘿卜快跑已經(jīng)是全球最大的自動駕駛出行服務(wù)商,累計已經(jīng)提供了超過400萬次的載客服務(wù)。蘿卜快跑的全無人車已經(jīng)跑在了武漢、重慶、北京、上海、深圳等很多城市的多個區(qū)域,我相信隨著運營規(guī)模的不斷擴大,技術(shù)水平的不斷提升,成本更低的自動駕駛車輛的規(guī);渴,蘿卜快跑將越來越接近商業(yè)化的盈利,讓我們共同期待AI原生出行時代的到來!

隨著大模型技術(shù)的不斷提升,我堅信從今往后大量的AI原生應(yīng)用將不斷地涌現(xiàn),數(shù)字技術(shù)和實體經(jīng)濟將深度融合,我們的大模型技術(shù)已經(jīng)應(yīng)用在了制造、能源、電力、化工、交通等各種各樣的實體產(chǎn)業(yè)當(dāng)中了。用智能巡檢來降低安全隱患、用智能調(diào)度來縮短交付周期、用智能決策來提升企業(yè)的效率、用智能信控來解決交通擁堵,大模型正在成為新型工業(yè)化的重要推動力。

《時代周刊》在一篇封面文章當(dāng)中寫到,“AI的獨特性是它不僅能夠模仿人的某些技能,還能夠執(zhí)行我們難以完成的任務(wù)。然而,推動機器學(xué)習(xí)和大語言模型的每一次進步的背后,其實都是人類。”

對于這句話,我非常贊同!新的世界,新的未來,將在每一個企業(yè)、每一個開發(fā)者、每一位用戶的一次次PROMPT當(dāng)中生成。我們將進入一個AI原生的時代,我們將進入一個人機通過PROMPT來相互交流的時代,未來由你生成,未來由我們一起一起生成,謝謝大家!

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港