出品|虎嗅科技組
作者|齊健
編輯|王一鵬
頭圖|Google
在谷歌巨大的商業(yè)化版圖面前,單純提前一天發(fā)布GPT-4o,似乎并沒有給OpenAI帶來足夠的優(yōu)勢。
在2024 Google I/O大會上,Google展示了一系列AI技術(shù)突破,包括AI生成視頻、AI驅(qū)動的Workspace自動化工具,以及產(chǎn)品效果直逼GPT-4o的語音助手。眾多AI產(chǎn)品的發(fā)布,形成了某種意義上的“狼群效應”,正幫助Google扭轉(zhuǎn)被動追趕的局面。
另外,Gemini的多模態(tài)能力、Android 15的AI增強,不僅提升了用戶體驗,也顯著增強了谷歌生態(tài)系統(tǒng)的粘性。相比之下,OpenAI可能技術(shù)上領(lǐng)先一步,但在應用廣度上顯得相對單一。
如今,Google帶著“巨頭范兒”的反擊越來越犀利,而對于GPT-5的發(fā)布時間仍持謹慎態(tài)度的Sam Altman而言,壓力變得越來越大。
巨頭反擊教材第一章:放大優(yōu)勢
巨型企業(yè)的戰(zhàn)略布局,往往建立在持續(xù)加強優(yōu)勢業(yè)務(wù)的前提下。而Google起家于搜索,長于Workspace等一系列辦公套件服務(wù),而這也成了2024年Google I/O大會發(fā)布的重點。
完善的AI搜索能力,是業(yè)內(nèi)翹首以盼的。Google本次發(fā)布的AI Overview,在多模態(tài)的問題上做足了文章
比如“Ask with video”,利用Gemini的多模態(tài)能力與Google Lens相結(jié)合,可以實現(xiàn)視頻搜索,只要錄制一段視頻,就能知道用戶使用唱片機,甚至維修照相機;Google Photos中還推出了新的AI功能“Ask Photos”,可以通過簡單的提問在大量照片中找出“孩子多年來學習游泳的歷程”。
OpenAI還展示了一款名為Project Astra的多模式AI助手,可以觀看并理解通過設(shè)備攝像頭看到的內(nèi)容,記住用戶的東西在哪里,幫用戶在現(xiàn)實世界“搜索“物品,或是完成其他任務(wù)。
Google版AI搜索的輸出結(jié)果不再是網(wǎng)址的羅列,而是一個全新的整合頁面它更像一份針對用戶提問而形成的報告,不僅包括對問題本身的回答,也包括對用戶可能忽略問題的猜測和補充,在產(chǎn)品形式上,也算做到了圖文并茂。
國內(nèi)某大廠同樣推出了AI搜索功能,但只是在傳統(tǒng)搜索頁面上,利用占網(wǎng)頁五分之一左右的空間,植入生成式AI的輸出結(jié)果,且只能針對特定問題觸發(fā)。整體完成度較低,因而也沒有做太高調(diào)地發(fā)布和宣傳。
兩相比較之下,Google此次對于AI搜索的革新可見一斑。在有限的搜索引擎市場里,這奠定了全新的標準。而對于模式已經(jīng)固化多年的搜索廣告而言,也更有想象空間。
Google不是在發(fā)布某一項大模型能力,而是在試圖重新占領(lǐng)用戶心智。當下,Google的搜索里面是“Ask,Not Search”,多模態(tài)的交互方式,只是在用戶層面進一步完善圍繞“Ask”建立的產(chǎn)品概念。
搜索的改造僅僅是個開始,Google希望搜索能成為激發(fā)用戶AI需求的超級入口,即使用戶不知道具體該問什么,Google也可以給出推薦,幫用戶腦暴。這時,搜索界面會進一步變化,變成信息流的形式,每個卡片都可以進一步操作。
在搜索之外,Google的另一個優(yōu)勢領(lǐng)域是Workspace。Google為Workspace發(fā)布了一款與國內(nèi)火爆的“數(shù)字員工”非常相似的產(chǎn)品AI Teammate。
首先,Gemini 1.5 Pro即將被植入Workspace的文檔、表格、幻燈片、云端硬盤和Gmail的側(cè)邊欄中,涵蓋企業(yè)日常運營的各個方面。Gemini可以幫用戶查找具體的業(yè)務(wù)信息而不是通用信息;直接從電子郵件中檢索相關(guān)的PDF文件;整理和管理電子郵件中的收據(jù),并進行歸檔,或者從收據(jù)中提取信息并添加到表格中。
Gmail App中加入Gemini后,還可以提供了更加詳細和上下文相關(guān)的回復建議,還能夠為用戶提供電子郵件的摘要。
同時,Google還將Gemini與Google生態(tài)的日歷、任務(wù)、Keep集成,使其AI產(chǎn)品成為一個全面的數(shù)字助理。Google還在Gemini執(zhí)行任務(wù)前設(shè)置了檢查機制,確保信息的準確性,而Google助力相比其他智能助手最大的優(yōu)勢就在于Gemini與Google原生產(chǎn)品的無縫集成。
在企業(yè)中,數(shù)字員工最早的產(chǎn)品是利用RPA(機器人流程自動化)來自動化執(zhí)行重復性、高量化、基于規(guī)則的任務(wù)。過去一年中大語言模型爆發(fā),使很多辦公軟件、辦公協(xié)作產(chǎn)品公司看到了機會,紛紛在會議、郵件、協(xié)同,以及文檔管理等領(lǐng)域推出了大模型加持的數(shù)字員工產(chǎn)品,其中不乏國內(nèi)大廠。
Google入局此類產(chǎn)品,無疑加劇了行業(yè)內(nèi)的競爭,也給關(guān)注此領(lǐng)域的企業(yè)樹立了一個“巨頭”標桿。在Google全套工具的配合下,AI teammate的AI不再是散點工具。它的功能不只是簡單的安排日程、訂會議、做會議紀要。
在Google全家桶的配合下,AI teammate可以真正理解業(yè)務(wù)流,理解業(yè)務(wù)上下文,并給出結(jié)論,甚至幫助評估風險業(yè)務(wù),回答項目能否按期完成,這甚至已經(jīng)接近一個“董事長助理”的工作了
Gemini支持的Workspace將在2024年6月,以“通用助手”的形式向付費訂閱者推出。
AI搜索和AI Workspace共同組成了Google版AI Agents的初貌:更強的多模態(tài)能力,全面深入多個場景的信息處理,真實理解企業(yè)的工作流。相比之下,OpenAI的GPT-4o雖在生成式AI技術(shù)上有優(yōu)勢,但在辦公應用場景中尚未形成全面、高效的解決方案。
巨頭反擊教材第二章:多打組合拳
除了核心優(yōu)勢業(yè)務(wù),Google也在2024 Google I/O大會上對整個生態(tài)系統(tǒng)進行了全面升級。
首先是圍繞YouTube的視頻領(lǐng)域。Google推出了對標Sora的Veo,Veo同樣可以輸出時長1分鐘左右的穩(wěn)定1080p視頻。Google稱已經(jīng)向一些創(chuàng)作者提供Veo,用于YouTube視頻制作,同時也向好萊塢推銷其用于電影制作,且Veo的部分功能將很快落到Y(jié)ouTube Shorts中。
Google還推出了對標GPT-4o的“可打斷的”語音助手Gemini Live,可以在Android上實現(xiàn)雙向流暢的AI對話體驗;還有角色聊天機器人Gems,與OpenAI的GPT Store,以及Character.AI類似,Gems可制作定制的ChatGPT聊天機器人,完成某些任務(wù)并保留特定的特征,例如與愛因斯坦或馬斯克對話,甚至可以為自己制作一個“假的”心理醫(yī)生。
此外,Google和OpenAI一樣,都關(guān)注教育場景。
Google推出了Android的Circle to Search,可以應用到家庭教育場景中。通過多模態(tài)模型提供個性化的互動式教育體驗。這款產(chǎn)品不僅能理解和回應學生的問題,還能根據(jù)學習進度調(diào)整教學內(nèi)容,提升了教育過程的互動性和效果。
疫情放大了在線教育的價值,家長也開始不斷提高對家庭教育的重視。調(diào)研機構(gòu)MarketsandMarkets的分析指出,全球數(shù)字教育市場規(guī)模預計從2023年的194億美元增長到2028年的667億美元,年復合增長率達28.0%。
Gems、Circle to Search與Gemini Live等產(chǎn)品,無疑可以大幅提高在線教育的互動體驗,并基于AI為不同孩子提供個性化的教育方案,彌補了傳統(tǒng)教育模式難以滿足所有學生的需求的問題。
除了商業(yè)生態(tài)和場景,在AI基礎(chǔ)設(shè)施方面,Google也進行了升級,這一點主要針對大模型ToB業(yè)務(wù)的成本問題。
本次Google I/O大會上,Google將自研AI芯片升級到第六代TPU(張量處理單元)Trillium,與第五代相比,每個TPU的計算性能提高了4.7倍。谷歌還宣布將成為首批提供Nvidia下一代Blackwell處理器訪問權(quán)限的云提供商之一。
Google CEO Sundar Pichai表示:“我們將繼續(xù)投資基礎(chǔ)設(shè)施,以推動人工智能的進步。”
相比于OpenAI和微軟的合作模式,Google通過自身業(yè)務(wù)生態(tài)系統(tǒng)的緊密協(xié)作,提升了Google Cloud以及AI相關(guān)服務(wù)的兼容性和互操作性,也為開發(fā)者提供了更強大的工具和支持,整體的技術(shù)和商業(yè)化競爭優(yōu)勢更加明顯。
在本次Google I/O大會上,Google總共124次提及AI。從商業(yè)生態(tài)到應用場景,再到基礎(chǔ)設(shè)施,Google幾乎對所有產(chǎn)品、能力進行了一次圍繞AI的升級。
相對于OpenAI,Google業(yè)務(wù)的戰(zhàn)線更長,這既是劣勢,也是優(yōu)勢。一套組合拳下來,OpenAI前一日的全部發(fā)布,成為了Google發(fā)布的章節(jié)內(nèi)容。這使得Google從單純的產(chǎn)品性能對比層面一躍而出,居高臨下的俯視2024年初的生成式AI市場競爭。
巨頭反擊教材第三章:整點新公司玩不起的
對于Google來說,所有的軟件能力,最終都會在硬件上有所體現(xiàn)為什么不呢?Google既有產(chǎn)品線,也有相關(guān)市場經(jīng)驗。相對于軟件服務(wù),硬件業(yè)務(wù)的重資產(chǎn)屬性更明顯,新銳公司很難玩得起,但Google如魚得水。
Google在本次大會中不僅明確了Pixel手機將具備原生Gemini能力,使設(shè)備的多任務(wù)處理能力大幅提升,還宣布了很多Android 15中將推出的AI功能。
事實上,Gemini早已作為獨立App在Android端上線。此次,更新中Gemini對話過程中,用可以直接將生成的圖像拖拽到其他應用中使用。在Android 15中,Gemini則支持了YouTube視頻內(nèi)容識別功能。Gemini可以在視頻播放界面直接提取相關(guān)信息,回答用戶關(guān)于視頻的各種問題,甚至生成視頻內(nèi)容摘要。
此外,用戶可以同時運行多個應用程序而不影響性能,這在以往手機中是難以實現(xiàn)的。此外,Gemini AI根據(jù)用戶習慣提供個性化推薦,使手機使用更加貼心便捷。這種智能化服務(wù)提高了用戶滿意度,增強了Google在智能手機市場的競爭力。
實時語音助手功能,在Pixel以及安卓系統(tǒng)中的落地,也必將使生態(tài)更加閉環(huán)。
在Gemini發(fā)布時提到的輕量化Nano版本已確認將用于Chrome的改進,在輕量化模型方面,Google又推出了全新的Gemini Flash。這兩款Gemini模型以及開源的Gemma模型,都將在未來的端側(cè)AI設(shè)備方面,為Google積蓄模型力量。
相比于過去單純討論芯片性能和安全性,Google的AI手機更加性感,也更符合實際。雖然Pixel手機的硬件水平在手機行業(yè)中一直處于落后地位,其唯一的競爭優(yōu)勢就是原生Android系統(tǒng)。如今作為Android+AI的原生設(shè)備,Pixel或?qū)⒂瓉硇碌拇禾臁?/p>
Android的Gemini更新將在“未來幾個月內(nèi)推廣到數(shù)億臺設(shè)備”,并且更多的上下文功能正在開發(fā)中。
Android的生態(tài)能力優(yōu)勢,第一次變得如此突出,Gemini在其中加碼極大。對于蘋果而言,在WWDC到來前,一切都是未知。對于新生的華為鴻蒙而言,挑戰(zhàn)更加劇烈。
有趣的是,AI不僅在Google的主力硬件產(chǎn)品中找到了豐富的應用場景,Google還展示了Google Glass的最新應用,似乎想告訴外界:有了AI的加持,即使是過去被認為失敗的項目,如今也能為新的創(chuàng)新提供基礎(chǔ)和靈感。
由此向下繼續(xù)推演,在Gemini和硬件能力的加持下,即使Google要殺入最火熱的AI PC市場的也會“順滑”無比。
結(jié)語
如何評價谷歌本次發(fā)布?不妨先看一下谷歌對哪些公司造成了威脅。
首先,AI搜索。除了已知的AI搜索公司PerplexityAI,以及傳說中的OpenAI搜索,Google最直接威脅的當然是傳統(tǒng)的搜索引擎。Google不只是簡單的在搜索結(jié)果中增加一個AI總結(jié),或是以自然語言對話方式進行搜索,Google的多模態(tài)AI搜索,幾乎可以說是改變了搜索的范式,提升搜索智能化的同時,極大地提高了用戶的使用體驗。
基于Google這樣的升級不管是有GPT-4加持的Bing,還是利用文心一言探索AI搜索的百度,都必須在AI+搜索的產(chǎn)品力方面加快創(chuàng)新步伐,才有可能在這一領(lǐng)域保持競爭力。
在辦公軟件、協(xié)作辦公方面。Workspace的升級,使Google有能力提供“真正的”數(shù)字員工。Google不只是要對標老牌競爭對手微軟,更是對所有研發(fā)數(shù)字員工、AI辦公軟件以及AI協(xié)同辦公的供應商發(fā)出了挑戰(zhàn)。以釘釘、飛書、WPS為代表的公司,在文檔處理,以及辦公、協(xié)作等方面的,可能都要重新評估自身的產(chǎn)品力。
在手機行業(yè)中,受到AI沖擊最大的廠商必然是蘋果,作為AI大模型時代唯一落后的巨頭,如果不在iOS生態(tài)中引入更多創(chuàng)新,蘋果恐怕很難應對來自Android陣營的AI攻勢。而其他手機廠商,不管如何高唱AI手機概念,在Android+Gemini的裹挾下,基于系統(tǒng)的AI升級空間將會越來越小,要保持競爭力,就只能在硬件、生產(chǎn)成本,以及供應鏈等方面“摳“些小錢了。
而對于整個AI行業(yè)來說,首當其沖的是OpenAI。過去一年中,OpenAI憑借大數(shù)據(jù)、大算力、強算法、強工程的優(yōu)勢,在AI行業(yè)內(nèi)保持了一個身位的領(lǐng)先優(yōu)勢。而隨著技術(shù)的普及和其他科技行業(yè)的發(fā)展OpenAI所謂的技術(shù)優(yōu)勢,支撐正在變低。OpenAI的領(lǐng)先技術(shù)正在從過去的被模仿,變成同期發(fā)布。
AI公司的技術(shù)競爭正在悄然向商業(yè)競爭和產(chǎn)品競爭過度。Google通過整合其廣泛的產(chǎn)品生態(tài)系統(tǒng),將AI技術(shù)落地到更多實際場景,如手機、辦公軟件、智能家居和在線教育等。一步步構(gòu)建了龐大的商業(yè)生態(tài)和穩(wěn)固的市場領(lǐng)先地位。
未來的競爭,或?qū)⒏嗟伢w現(xiàn)應用在場景中的多樣性和市場主導地位的爭奪上。在GPT-5或是其它更強大的AI大模型到來之前,OpenAI等AI公司在應用場景上的劣勢將會被Google持續(xù)放大。
如今,Google正在以教科書般的方式展示如何在激烈的市場競爭中,通過技術(shù)和商業(yè)戰(zhàn)略的雙管齊下實現(xiàn)反擊。這不僅僅是技術(shù)上的博弈,更是商業(yè)模式和生態(tài)系統(tǒng)構(gòu)建上的較量。