年初 AI 行業(yè)都在說(shuō)今年會(huì)是 AI 硬件元年,現(xiàn)在看來(lái)這個(gè)說(shuō)法對(duì)了一半,今年應(yīng)該是 AI 眼鏡的爆發(fā)前夜。Meta Ray-Ban 的爆火,讓各家科技公司快速跟進(jìn)。蘋果內(nèi)部啟動(dòng)「Atlas」的智能眼鏡計(jì)劃,OpenAI 消費(fèi)硬件團(tuán)隊(duì)挖來(lái)了 Meta AR 眼鏡主管。有媒體報(bào)道國(guó)內(nèi)至少有 50 個(gè)團(tuán)隊(duì)在做 AI 眼鏡,當(dāng)中不乏小米、vivo、榮耀等硬件廠商。
離大模型更近的互聯(lián)網(wǎng)公司和 AI 公司自然也近水樓臺(tái),百度今天也正式發(fā)布了全球首款搭載中文大模型的原生 AI 眼鏡小度 AI 眼鏡。在今天的百度世界大會(huì) 2024 上,百度還宣布文心大模型的日均調(diào)用量超 15 億,相較一年前首次披露的 5000 萬(wàn)次,增長(zhǎng)約 30 倍。李彥宏表示,「這條陡峭的增長(zhǎng)曲線,代表著過(guò)去兩年中國(guó)大模型應(yīng)用的爆發(fā)!
回顧移動(dòng)互聯(lián)網(wǎng)的黃金十年,應(yīng)用的爆發(fā)離不開(kāi)智能手機(jī)的崛起。在混沌初開(kāi)的 AI 時(shí)代,廠商開(kāi)始尋找 AI 應(yīng)用落地的載體。手機(jī) PC 固然還是主流,但或許還有更適合 AI 的硬件形態(tài),眼鏡就是當(dāng)下最被市場(chǎng)看好的一個(gè)形態(tài)之一。關(guān)注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察
小度 AI 眼鏡,打造中國(guó)的 Meta Ray-Ban 爆款在端側(cè)硬件中,AI 智能眼鏡講出了最性感的故事。在一眾 AI 原生硬件曇花一現(xiàn)的 2024 年,Meta Ray-Ban 智能眼鏡能夠賣 300 多萬(wàn)臺(tái),幾乎是目前最成功的 AI 硬件。它能被市場(chǎng)接受有幾個(gè)關(guān)鍵的原因:
佩戴體驗(yàn)接近日常,重量已經(jīng)沒(méi)有比常規(guī)眼鏡重太多。功能簡(jiǎn)單,但僅有的幾個(gè)功能體驗(yàn)都穩(wěn)定好用,比如語(yǔ)音識(shí)別和降噪。定位清晰,一開(kāi)始就沒(méi)有奔著取代手機(jī)的設(shè)備去做,而是針對(duì)主流設(shè)備之外補(bǔ)充的場(chǎng)景提升。今天百度在發(fā)布首款 AI 眼鏡時(shí)雖然沒(méi)有提到 Meta Ray-Ban,但從產(chǎn)品形態(tài)和功能來(lái)看,也在沿著這些被驗(yàn)證的產(chǎn)品設(shè)計(jì)靠近。具備第一視角拍攝,邊走邊問(wèn)、識(shí)物百科等六大功能搭載 1600 萬(wàn)像素超廣角攝像頭,自研 AI 防抖算法采用 4 麥克風(fēng)陣列設(shè)計(jì),集成開(kāi)放式揚(yáng)聲器支持 56 個(gè)小時(shí)超長(zhǎng)待機(jī),半小時(shí)充滿電重量?jī)H 45 克,有多種款式可供選擇
APPSO 在現(xiàn)場(chǎng)
百度希望這款 AI 眼鏡能夠成為一部行走的百科全書。依托百度地圖的位置服務(wù),以及百度搜索、百度百科深度融合,小度 AI 眼鏡可以邊走邊問(wèn),結(jié)合視覺(jué)和定位的技術(shù),隨時(shí)隨地地了解歷史、文化和風(fēng)土人情。
在出國(guó)開(kāi)會(huì)或者是逛博物館時(shí),小度 AI 眼鏡不僅能夠?qū)崟r(shí)翻譯,還能智能分析拍照的內(nèi)容,提煉信息,特別是面對(duì)大段外文文字時(shí),它也能輕松應(yīng)對(duì)。在閱讀時(shí),它可以成為你的智能筆記助手,輕點(diǎn)即可將重點(diǎn)文字加入備忘錄。百度的 AI 眼鏡搭載文心大模型沒(méi)有懸念,但同時(shí)其也搭載了 DuerOS AI 原生操作系統(tǒng),在自然語(yǔ)言交互、多模態(tài)感知和擬人化呈現(xiàn)方面表現(xiàn)出色。
另一方面,小度 AI 眼鏡在硬件素質(zhì)方面也不遑多讓。小度 AI 眼鏡搭載 1600 萬(wàn)像素的超廣角攝像頭,遠(yuǎn)超行業(yè)標(biāo)準(zhǔn)。相比之下,Meta Ray-Ban 眼鏡也只是搭載了 1200 萬(wàn)像素的超廣角攝像頭。
同時(shí)百度還自研了 AI 防抖的算法,不管是靜態(tài)的風(fēng)景還是動(dòng)態(tài)的場(chǎng)景,都能表現(xiàn)出色。
作為語(yǔ)音交互的重要載體設(shè)備,小度 AI 眼鏡還具備敏銳的聽(tīng)覺(jué)能力。通過(guò)采用 4 麥克風(fēng)陣列設(shè)計(jì),小度 AI 眼鏡不僅可以更立體地進(jìn)行聲音的捕捉,保障嘈雜環(huán)境下通話的清晰度,還能夠更準(zhǔn)確地識(shí)別聲源的方向。此外,小度 AI 眼鏡還采用了定制的開(kāi)放式揚(yáng)聲器單元,聲音更自然,音質(zhì)也更清晰。值得注意的是,語(yǔ)音識(shí)別和降噪也是新一代 Meta Ray-Ban 最大的亮點(diǎn)之一,百度這款眼鏡和 Meta Ray-Ban 的 5 麥克風(fēng)陣列對(duì)比效果如何,也是后續(xù)用戶體驗(yàn)很關(guān)鍵的地方
基于低功耗電路架構(gòu)設(shè)計(jì),小度 AI 眼鏡還能實(shí)現(xiàn) 56 個(gè)小時(shí)的待機(jī),連續(xù)聽(tīng)歌 5 個(gè)小時(shí)。
摘下眼鏡休息 30 分鐘,就可以快速充滿電,真全天候「智能」。和 Meta Ray-Ban 等產(chǎn)品類似,這款眼鏡也是通過(guò)不搭載顯示屏來(lái)保證長(zhǎng)續(xù)航,這對(duì)于一款智能眼鏡的體驗(yàn)來(lái)說(shuō)十分關(guān)鍵。
作為全天候佩戴的眼鏡,輕薄是必不可少的。小度 AI 眼鏡的重量達(dá)到了 45 克,比 Meta Ray-Ban 還輕了 4 克,能夠減少對(duì)鼻梁和耳朵的壓力,在長(zhǎng)時(shí)間佩戴時(shí)更為舒適。此外,小度 AI 眼鏡的外形設(shè)計(jì)與普通眼鏡幾乎無(wú)異,而且還有多個(gè)款式可供選擇,兼顧實(shí)用性與時(shí)尚性。既有里子,也要面子。小度科技 CEO 李瑩表示,小度 AI 眼鏡是小度軟硬智能化的集大成之作。這款眼鏡計(jì)劃明年上半年正式上市,而尚未公布的價(jià)格將成為最大懸念。據(jù)說(shuō)會(huì)是一個(gè)「驚喜價(jià)格」。而此前也有消息稱,小度 AI 眼鏡的售價(jià)將低于 Meta Ray-Ban 眼鏡的 299 美元。作為對(duì)比,國(guó)內(nèi) AI 眼鏡的價(jià)格普遍在 2000 至 3000 元價(jià)位之間。比如雷鳥(niǎo) Air 2、XREAL Air 2、Rokid MAX 等產(chǎn)品,起售價(jià)分別為 2499元、2599 元和 2999 元。
大模型基本解決幻覺(jué)問(wèn)題,兩大「超級(jí)有用」AI 技術(shù)發(fā)布大模型已經(jīng)發(fā)展了兩年,那么對(duì)于 AI 行業(yè)而言,最大的變化是什么?李彥宏給出的答案是,大模型基本消除了幻覺(jué)。大模型是一個(gè)概率模型,生成的內(nèi)容具有不確定性。采用 RAG 技術(shù)后,大模型會(huì)利用檢索到的信息來(lái)指導(dǎo)文本或答案的生成,從而極大提高內(nèi)容的質(zhì)量和準(zhǔn)確性。今天,文字層面的 RAG 已經(jīng)做得很好,但圖像等多模態(tài)內(nèi)容和 RAG 的結(jié)合還不夠,或者說(shuō),至少?zèng)]有文生文 RAG 解決得那么好。
隨手讓圖像模型生成一張?zhí)靿恼掌詈笊傻奶靿掌B層數(shù)都能弄混。為此,百度將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力進(jìn)行結(jié)合,正式發(fā)布了文心 iRAG。文心 iRAG 主打無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本以及立等可取等的特點(diǎn)。此外,文心 iRAG 還能夠精準(zhǔn)生成特定物品/人物與任意背景,比如讓不同 AI 模型生成愛(ài)因斯坦與天壇的打卡合照。相比之下,由 iRAG 生成的圖像更真實(shí),質(zhì)量也更好。
作為一項(xiàng)基礎(chǔ)技術(shù),iRAG 的應(yīng)用空間廣闊,比如影視作品、漫畫作品,連續(xù)畫本,海報(bào)制作等,AI 生圖都可以大幅降低創(chuàng)作成本。另一個(gè)最新的 AI 技術(shù),則是無(wú)代碼工具「秒噠」。秒噠是一個(gè)不需要寫代碼,由大模型和智能體組成的全新軟件。李彥宏表示,無(wú)需寫代碼,秒噠能夠?qū)崿F(xiàn)任意想法,讓每個(gè)人都具備程序員的能力。我認(rèn)為它是迄今為止人類歷史上最復(fù)雜的多智能體協(xié)作工具。它包括無(wú)代碼的編程,多智能體的協(xié)作,以及規(guī);{(diào)用各種工具的能力。
發(fā)布會(huì)現(xiàn)場(chǎng)舉例稱,假如我們需要打造一個(gè)蘿卜快跑活動(dòng)邀請(qǐng)系統(tǒng),并把邀請(qǐng)函分享給其他人,收集想法和反饋,直接使用秒噠就可以滿足這個(gè)需求。上傳有關(guān)活動(dòng)的時(shí)間、地點(diǎn)和主題,然后秒噠接收到指令之后,就會(huì)出現(xiàn)負(fù)責(zé)規(guī)劃和調(diào)度的小組長(zhǎng)智能體。
它能夠把任務(wù)拆解成了需求,確定內(nèi)容,生產(chǎn)、答案工程開(kāi)發(fā)這三個(gè)步驟,然后召喚各個(gè)智能體來(lái)協(xié)作完成這個(gè)任務(wù)。比如策劃智能體(一號(hào))負(fù)責(zé)活動(dòng)邀請(qǐng)函的策劃設(shè)計(jì)解決方案。
然后策劃智能體把這個(gè)任務(wù)又分拆成了核心需求、內(nèi)容結(jié)構(gòu)、開(kāi)發(fā)需求、數(shù)據(jù)收集這四個(gè)子任務(wù)。接下來(lái),小編智能體(二號(hào))的主要職責(zé)就是編輯邀請(qǐng)函當(dāng)中的所有的文字和媒體內(nèi)容。以此類推,不斷涌現(xiàn)出更多智能體來(lái)實(shí)現(xiàn)這一需求。
當(dāng)然,如果對(duì)成品的畫風(fēng)不太滿意,想要更換的,輸入想法之后,負(fù)責(zé)編寫代碼、制作和部署網(wǎng)頁(yè)的程序員智能體會(huì)再寫一次代碼,直接給出新的版本。而在這個(gè)過(guò)程中,你不需要懂得任何代碼。由此,我們可以總結(jié)出秒噠的三個(gè)特性無(wú)代碼編程,多智能體協(xié)作,多工具調(diào)用。李彥宏表示,即日起,用戶可以排隊(duì)預(yù)約秒噠,預(yù)計(jì)將在明年一季度正式發(fā)布。
AI 應(yīng)用時(shí)代,真的來(lái)了百度認(rèn)為,智能體是 AI 應(yīng)用的最主流形態(tài),即將迎來(lái)它的爆發(fā)點(diǎn)。在今天的發(fā)布會(huì)上,李彥宏也將智能體分為了四類:公司類智能體、角色類智能體、工具類智能體、以及行業(yè)類智能體。公司類智能體公司類智能體可以簡(jiǎn)單理解成 AI 時(shí)代的公司官網(wǎng),支持主動(dòng)推薦,及時(shí)響應(yīng),一對(duì)一服務(wù)。舉例來(lái)說(shuō),百度搜索比亞迪,喚醒官方智能體,讓其推薦一款性能均衡的車型,以往你需要在傳統(tǒng)官網(wǎng)研究很久,但智能體能夠?qū)?shù)捋清楚,以及回答各種個(gè)性化的問(wèn)題。比起傳統(tǒng)的官網(wǎng),智能體既是你的品牌顧問(wèn),又是你的金牌銷售和客服,既專業(yè)又貼心。
據(jù)介紹,比亞迪官方智能體上線以后,它的銷售線索的轉(zhuǎn)化率提升了119%。聯(lián)想 AI PC 的智能體,九月份互動(dòng)率提升了 89%,銷售線索的轉(zhuǎn)化率提升了 80%。李彥宏表示,未來(lái)公司的官方智能體很可能會(huì)替代官網(wǎng),成為最直接面向消費(fèi)者的一個(gè)界面。角色類智能體高度擬人化的智能體,則更聰明,有情感,有態(tài)度。最典型的例子當(dāng)屬數(shù)字人。百度搜索教育輔導(dǎo),跳轉(zhuǎn)的數(shù)字人的效果更自然,動(dòng)作幅度更大。據(jù)李彥宏透露,數(shù)字人直播的轉(zhuǎn)化率甚至超越了真人?梢哉f(shuō),有了數(shù)字虛擬人,我們從未如此離名師、名醫(yī)、王牌律師這么近。
工具類智能體百度文庫(kù)和百度網(wǎng)盤還聯(lián)合發(fā)布了自由畫布。自由畫布支持輸入自由,不限數(shù)據(jù)來(lái)源;編輯自由,改寫擴(kuò)寫,續(xù)寫都可以;創(chuàng)作自由;分享自由,支持用戶個(gè)人云以及朋友圈。在發(fā)布會(huì)現(xiàn)場(chǎng),李彥宏向我們展示了用自由畫布創(chuàng)造大圣穿越到現(xiàn)代探險(xiǎn)的故事。
孫悟空在瀏覽打卡圣地后,最后來(lái)到了上海,不僅故事邏輯清晰,而且整體畫面也沒(méi)崩,一致性很好,甚至還能跳出條條框框,讓小朋友融入到個(gè)人定制的畫本當(dāng)中。李彥宏也說(shuō)了,自由畫布不是期貨,很快會(huì)正式上線,不妨期待一下。
行業(yè)類智能體被車撞了,對(duì)方全責(zé),卻不給賠償怎么辦?那么你可以咨詢法律行業(yè)類智能體法行寶,它會(huì)給出詳細(xì)的步驟指導(dǎo),并且交通事故賠償怎么計(jì)算,幫寫一封交通事故起訴狀,有了法行寶,這些都不是事。
上線半年多以來(lái),法行寶為 940 多萬(wàn)人提供了高效的、可信賴的法律服務(wù),累計(jì)回答用戶 1660 萬(wàn)個(gè)法律問(wèn)題,堪稱每個(gè)普通人專屬的免費(fèi) AI 律師。在大模型的產(chǎn)業(yè)應(yīng)用方面,目前有 15 萬(wàn)家企業(yè)、80 萬(wàn)開(kāi)發(fā)者入駐文心智能體平臺(tái),而且有超 60% 的央國(guó)企和大量民營(yíng)企業(yè)選擇百度智能云進(jìn)行 AI 創(chuàng)新。其中,百度智能云的千帆大模型平臺(tái)已經(jīng)累計(jì)幫助用戶精調(diào)了 3.3 萬(wàn)個(gè)大模型,開(kāi)發(fā)出了 77 萬(wàn)個(gè)企業(yè)應(yīng)用,擁有中國(guó)最大的大模型產(chǎn)業(yè)落地的規(guī)模。就具體的落地合作案例來(lái)說(shuō),百度與百勝中國(guó)合作,打造大模型服務(wù)專區(qū),實(shí)現(xiàn)大模型點(diǎn)餐。智聯(lián)招聘則借助百度 AI 的服務(wù),追求求職者與企業(yè)的雙向奔赴,實(shí)現(xiàn)人崗匹配平均準(zhǔn)確率達(dá)到 93%,大模型使用成本下降了 90%。
寫在最后,智能體站在新時(shí)代的風(fēng)口浪尖,正在成為下一個(gè)應(yīng)用爆發(fā)點(diǎn)。在人類信息技術(shù)演進(jìn)的各個(gè)歷史階段,應(yīng)用的形態(tài)各異,各領(lǐng)風(fēng)騷。李彥宏表示,在個(gè)人 PC 時(shí)代,它們以軟件和網(wǎng)站的形式出現(xiàn);在移動(dòng)互聯(lián)網(wǎng)時(shí)代,它們轉(zhuǎn)變?yōu)橐粋(gè)個(gè) APP 和賬號(hào)。而現(xiàn)在,在這個(gè)由 AI 主導(dǎo)的時(shí)代,智能體正在成為應(yīng)用的主流形態(tài)。隨著大模型技術(shù)的能力還在以指數(shù)級(jí)的躍遷,自然語(yǔ)言就成為了這個(gè)時(shí)代最重要的編程語(yǔ)言。我們每一個(gè)人都能夠動(dòng)手,創(chuàng)造一個(gè)屬于自己的,也屬于他人的 AI 應(yīng)用或者智能體。如李彥宏在演講的尾聲所說(shuō):國(guó)外有一種說(shuō)法叫「軟件吞噬世界」。但我認(rèn)為,這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。AI 時(shí)代,應(yīng)用創(chuàng)造世界。