All in AI ,到 2024 年這個節(jié)點幾乎已經(jīng)成了互聯(lián)網(wǎng)科技公司的主旋律。
仿佛全世界都陷入了AI Fomo(AI 錯失恐懼癥),科技公司展開了追趕 OpenAI 的大模型軍備競賽,普通個體擔心被 AI 取代,于是 199 元的 AI 課收獲了大批擁躉。
而在國內(nèi)掀起的「百模大戰(zhàn)」中,金山辦公算是一個異類。這家國內(nèi)辦公軟件市場份額最高、現(xiàn)金流也十分充足的公司,并沒有投入到大模型的競爭中,卻在國內(nèi)最先推出了基于大語言模型的智能辦公助手 WPS AI。
以這種方式 All in AI 的金山辦公,在過去 36 年間從 PC 時代走到移動互聯(lián)網(wǎng)時代后,正在經(jīng)歷的第三個重要的節(jié)點,而前兩個節(jié)點都影響了中國辦公軟件的市場的走向。
八十年代,求伯君把自己關(guān)在在深圳蔡屋圍酒店 501 號房 14 個月,用一臺 386 電腦敲出了 12 萬行匯編代碼,1988 年 WPS 1.0 誕生。
2002 年,金山 6 號員工雷軍帶領(lǐng) 100 多位工程師花三年重寫了 WPS 500 多萬行代碼,推出了完全兼容微軟 Office 的 WPS 2005。
雷軍(左)和求伯君
現(xiàn)在大模型的到來開始改變軟件應(yīng)用的使用方式和開發(fā)方式,章慶元認為未來甚至 UI(User Interface,用戶交互)這個詞都會消失。金山也從去年開始暫停了所有跟 AI 無關(guān)的業(yè)務(wù),全面轉(zhuǎn)型。
愛范兒曾在年初的 ifanRank 中預(yù)測,我們正邁向工具性、普適化和工業(yè)化的「大應(yīng)用時代」,2024 年將看到更多滿足消費者或商業(yè)需求的 AI 原生應(yīng)用。
大模型賽道逐漸趨于飽和,接下我們顯然需要更多專注 AI 產(chǎn)品落地的公司,將大模型能力轉(zhuǎn)化為行業(yè)生產(chǎn)力和創(chuàng)造力。
AI 生產(chǎn)力的迷思
回顧過去一年的爆款 AI 工具,無論是微軟的 Copilot ,還是春節(jié)開始刷屏的 Sora ,伴隨出現(xiàn)的高頻詞匯往往有兩個顛覆和取代。
盡管這些 AI 工具奔著提升生產(chǎn)力而來,但比起它們可能帶來的效率提升,能取代多少工作顛覆哪些行業(yè)卻總是被討論最多的話題,甚至還有不少機構(gòu)樂此不疲計算出精確的百分比。
工具本質(zhì)是什么?幫助我們更輕松地完成想要做的事。那提升生產(chǎn)力無非就是兩種方式,要么提升單個步驟的效率,要么縮減任務(wù)過程中所需的步驟,或者兩者同時實現(xiàn)。
大模型驅(qū)動的一眾 AI 工具,則大大縮短了從提出需求到實現(xiàn)想法所需的流程。
你只要一句話,讓 AI 幾秒列出大綱,然后生成 20 多頁 PPT。
一些需要過去拍攝和后期制作的視頻,如今化作一段 prompt 指令。
哪怕是用手機隨手一拍的照片,用手指圈一圈就能將路人或雜物消除。
章慶元在去年接受采訪時曾預(yù)測,大概再過一年,人們就可以用「100 塊錢一個月請一個全能 Office 助手」的方式,實現(xiàn)對辦公軟件全新的掌控,任何復(fù)雜的表單、表格和計算等工具欄都會從辦公軟件上消失,這種用「訂閱」的方式也從根本上改變了辦公軟件的商業(yè)模式。
這背后其實是 AI 加速了算力平民化的進程。
WPS AI 的產(chǎn)品經(jīng)理付子豪不久前在一次分享中提出一個觀察:大模型的出現(xiàn)不能類比移動互聯(lián)網(wǎng)出現(xiàn)的狀態(tài),它更像是 PC 誕生的時代,云誕生的時代。
隨著人類社會出現(xiàn)的需求和場景越來越復(fù)雜,大腦的算力已經(jīng)不夠用,我們開始通過計算機擴展算力。但要充分釋放計算機算力的門檻并不低,你可能需要懂得編程語言,就算是常用 Excel 表格、PS,要用好也不容易。
AIGC 解決的就是算力門檻的問題,只要用自然語言就能讓計算機理解你的思考邏輯 ,并生成結(jié)果,極大地縮短從想法到結(jié)果的鏈條。
如果理解了這個邏輯,那我們對 Sam Altman 最近專訪中關(guān)于 AI 將取代多少工作的回答或許更有共鳴。
Altman 思考的方式不是人工智能將完成多少百分比的工作,而是 AI 在一段時間內(nèi)將完成多少百分比的任務(wù)。
我認為這是一個比 AI 可以做多少工作更有趣、更有影響力、更重要的問題,因為它是一種工具,可以在越來越復(fù)雜的水平上工作,在越來越長的時間范圍內(nèi)完成越來越多的任務(wù),并讓人們以一種更靈活的方式進行操作。
所以也許人們的工作效率會更高。
這個思考不僅對于用戶,對于 AI 工具的開發(fā)者同樣有價值。因為用戶需要的其實不是參數(shù)越來越大的模型,而是能讓他們更容易將想法落實的工具,就像當年喬布斯一個經(jīng)典的回答:
必須從用戶體驗入手,然后再回過頭去開發(fā)技術(shù),而不是從技術(shù)入手,然后再試著想辦法,看這個技術(shù)能用到哪?
Copilot 的交互
在《大模型元年,人類文明的操作系統(tǒng)正在大更新》一文中,我們提到下一代革命性的人機交互模式可能會是自然用戶界面(Natural user interface, NUI )。
NUI 最核心的原則是簡單性高于一切。復(fù)雜性是自然用戶界面的敵人。每個交互都應(yīng)該是不言自明的,不需要說明手冊。
而 Copilot ,則是 NUI 交互邏輯下 AI 工具理想的形態(tài)。Copilot 這個詞源自飛行術(shù)語,指的是協(xié)助主駕駛員操作飛機的副駕駛,當主駕駛員需要休息或處理其他任務(wù)時,副駕駛員就會接管控制權(quán),二者共同負責飛機的安全飛行。
我認為這也是人和 AI 交互最恰當?shù)男稳荨N④泴τ?Copilot 的定義是:一種使用自然語言處理技術(shù)或大語言模型,幫助人們完成復(fù)雜或認知任務(wù)的應(yīng)用程序或組件。
WPS AI 同樣將人機交互作為三大戰(zhàn)略方向之一,也把基于自然語言多輪問答式的自然交互稱為 Copilot,能夠深入植入到文檔和協(xié)作的各種場景。
比如昨天推出的 WPS AI 企業(yè)版可以提供「文理兼修」的數(shù)字員工服務(wù),例如閱讀助手、畫圖助手、考勤助手、銷售分析、合同分析等等,觸達各類細微的辦公場景。
其中的 Copilot Pro 則可幫助運營人員使用自然語言驅(qū)動 BI 產(chǎn)品分析數(shù)據(jù),同時可調(diào)用 WPS 365 API 和企業(yè)自有 API,解決辦公自動化需求。
GitHub 一項數(shù)據(jù)顯示,在使用 GitHub Copilot 的開發(fā)人員中,88% 的人表示他們的生產(chǎn)力更高,74% 的人表示他們可以專注于更令人滿意的工作中,77% 的人表示它有助于他們減少搜尋資訊或范例的時間。
章慶元有個形容也十分貼切,自然語言交互大幅降低用戶交互成本,意味著 Photoshop 可以直接進入「美圖秀秀」這類工具的市常
用戶能以操作美圖秀秀的交互難度,實現(xiàn) Photoshop 中復(fù)雜的功能。這樣情況正在越來越多類型的 AI 產(chǎn)品中出現(xiàn)。如果留意去年 WPS AI 的更新,也會發(fā)現(xiàn)用戶界面在不斷簡化,自然語言的輸入開始替代原來一些按鈕的功能。
可以看到,目前辦公文檔處理套件,已經(jīng)向「 office+協(xié)作+AI 」組成的一站式 AI 辦公轉(zhuǎn)變。一個產(chǎn)品能高效完成越來越多的任務(wù),但集成的功能模塊卻越來越少,這也將是 AI 工具的趨勢。
科技的革新本質(zhì)上是人機交互的進化,當 Copilot 發(fā)展到一定程度,甚至可能整個交互界面本身就是一個超級應(yīng)用,不僅連功能按鈕被取消,甚至很多應(yīng)用本身都不一定再需要單獨存在。
我們需要更多不做大模型的 AI 應(yīng)用主義者
很多人把大模型或 AIGC 視為第四次工業(yè)革命,實際上如果一個技術(shù)要被冠以革命性的帽子,實際指的不是技術(shù)的突破本身,而是能影響整個商業(yè)社會、改變大多數(shù)人的生活方式。
無論是蒸汽、電力還是互聯(lián)網(wǎng),毫無疑問都符合這些特點,那大模型呢?至少現(xiàn)階段肯定是達不到這個程度。我們需要的是通過 AI 應(yīng)用產(chǎn)品將大模型能力發(fā)揮出來,從而來影響人們的工作和生活。
吳恩達
計算機科學家吳恩達也認為,AI 作為新一代通用技術(shù),更多的機會,在于大規(guī)模應(yīng)用落地。
這也是為什么我一開始就說,我們需要更多不做模型的 AI 公司。大模型作為底層技術(shù)固然不可或缺,但專注于滿足消費者的各種需求以及各類商業(yè)交易的 AI 公司絕對需要更多,才能讓 AI 在社會層面真正爆發(fā)。
就像多點觸控技術(shù),早在初代 iPhone 發(fā)布 20 多年前就有了成熟應(yīng)用,但只有蘋果讓這項技術(shù)成為后來幾乎所有智能手機的交互方案。
而在這波 AI 浪潮中,也有著不生產(chǎn)大模型,但堅定要做大模型應(yīng)用者的探路人,金山辦公就是其中一個范本。
金山辦公的策略十分務(wù)實,關(guān)注落地的場景,幾乎與國內(nèi)主流的 AI 大模型公司都達成了深度合作,包括 MiniMax、智譜 AI、商湯、文心一言、通義大模型等,自己則聚焦落地的場景。
金山扮演的角色就像分診臺,負責判斷用戶所有的問題和要解決的場景然后調(diào)用對應(yīng)最適合的模型來執(zhí)行任務(wù)。而一些小眾場景則由金山辦公的自研小模型補充滿足需求。
比如商湯在數(shù)據(jù)分析上比較出色,WPS AI 就調(diào)用它處需要理科思維的場景。而像文字、PPT 等場景則通過智譜 AI 等模型來完成。
這樣化整為零的大模型應(yīng)用方式,好處是能充分發(fā)揮各模型的長處,實現(xiàn)優(yōu)勢互補,不會受到某個模型能力的限制。畢竟即便是 GPT-4,也有一些場景存在短板。
昨天的 WPS 發(fā)布會上,開場章慶元提到一個點讓我印象比較深刻。他說今天看到的所有功能,都是馬上能體驗,一定是落到客戶真實的應(yīng)用場景里的。
AI 除了在聊天框,在長文本處理不斷內(nèi)卷之外,還有什么更有想象力的應(yīng)用方式?
這是值得更多
人去探索的。
盡管目前大模型應(yīng)用處于起步階段,但像金山辦公這樣的 AI 應(yīng)用主義者應(yīng)該要多一些。