展會信息港展會大全

AI 大模型的下一步,或許是 Google 早年的那種便宜的方案
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-08-23 18:28:31   瀏覽:10429次  

導(dǎo)讀:Google 早期的服務(wù)器的樣子,這么多年在我腦子里,一直揮之不去,成為我對技術(shù),對創(chuàng)業(yè)公司的理解的一個基準。 這是2007 年,我在硅谷的計算機博物館看到的一臺: 下面的照片里面,綠色和白色相間的一條是 reset 的線,連著一個按鈕,一條是普通 PC 的硬盤燈...

Google 早期的服務(wù)器的樣子,這么多年在我腦子里,一直揮之不去,成為我對技術(shù),對創(chuàng)業(yè)公司的理解的一個基準。

這是2007 年,我在硅谷的計算機博物館看到的一臺:

下面的照片里面,綠色和白色相間的一條是 reset 的線,連著一個按鈕,一條是普通 PC 的硬盤燈。四個這樣按鈕和燈用四個螺絲釘直接固定在一個硬紙板上面。

顯卡的位置什么也沒有插,其他的擴展槽也都空著。

只有一個網(wǎng)卡,和網(wǎng)線。

CPU是奔二的。

這個是整個主板的樣子。

這個惠普的 Switch 總共有80條進線。

這一個機柜,總共是20層。每一層的架子上面墊著一層松木板的隔層,隔層上面放四個一摸一樣的主版,四塊硬盤放在中間一條。

還有一臺現(xiàn)存的在 Google 的訪客中心。

在互聯(lián)網(wǎng)初期,非?,搜索就成為一個有用,有前途的事情。那個時候壟斷的搜索引擎是 Lycos,AltaVista,InfoSeek 等等,像極了最近的各個大模型公司群雄爭霸。

但是和現(xiàn)在的大模型公司類似的是,這些搜索公司用的是 Sun Microsystem 的系統(tǒng),用的是 HP 等高端的服務(wù)器,穩(wěn)定性一流,成本也驚人。當(dāng)時運行搜索引擎可是個花大錢的生意。隨著流量的不斷攀升,成本也驚人的攀升。同時受到算力的限制,他們的搜索還是基本的檢索,就是文字的反向索引表,搜索效果一般。

Google 最初想到了 PageRank 算法,就是根據(jù)其他網(wǎng)頁的鏈接的權(quán)重來算網(wǎng)頁的重要度。這個倒是一個不錯的想法,但是實現(xiàn)起來需要非常大的算力,這個過程基本上和現(xiàn)在的大模型算文字的向量有點像。我想知道一個網(wǎng)頁的權(quán)重,我就需要把全網(wǎng)看一遍,看哪些其他的網(wǎng)頁指向這個網(wǎng)頁,以及這些網(wǎng)頁的權(quán)重,而這些網(wǎng)頁的權(quán)重又要這樣的邏輯算一遍,幾乎是一個死循環(huán)一樣的算力要求。

Google 的解決方案,就沒有買當(dāng)時唯一正確的主機廠商動輒幾萬美金一臺的高端服務(wù)器,而就是在一張軟木紙上,放上四小片主板,然后綁上硬盤,插上網(wǎng)卡,就結(jié)束了。

很顯然這樣的穩(wěn)定性和廠商的主機相比是天壤之別。所以,Google 就用軟件,做了Google File System 分布的文件系統(tǒng),讓文件在多個地方重復(fù)寫入,任何硬件壞了,數(shù)據(jù)就立刻可以在其他地方重建,以至于你沖過去隨便砸壞幾個「小電腦」都不影響。在加上自己的 MapReduce 的框架,把計算可以分布(map)在這些小電腦上計算,然后把結(jié)果匯總(Reduce),就可以把這么多電腦的算力加在一起,而不用一臺或幾臺特別強大的電腦。

總之,經(jīng)過這么一番折騰,Google 因為硬件便宜,算力足,存儲便宜,這些才足以支撐 PageRank 這樣的巨大的算力消耗,非?炀蛷 Stanford 的一個無名的小站,打敗了當(dāng)時的巨頭,成為了今天的 Google。所以,從某種角度說,用軟件換來的硬件的巨大的成本優(yōu)勢,是 Google 早期成功不可忽略的因素。

這段歷史,是不是會對現(xiàn)在的 AI 格局有所啟發(fā)呢?

用 Nvdia V100 的顯卡堆出來的 OpenAI 的 ChatGPT 的模型,固然幫助我們完成了從沒有到有,從看不到可能性到證明了可能性的第一步,就如同 Lycos 搭起來的昂貴的搜索引擎服務(wù)一樣。但,是不是有 Google 這樣的方式,用軟件的方式瘋狂的降低硬件成本的可能性呢?當(dāng)然我們已經(jīng)過了手工攢服務(wù)器的時代了,用電烙鐵焊 GPU 似乎也不是靠譜的路子(Google 當(dāng)年也用沒有這么做,而是直接用的 Intel 奔騰II 的 CPU ),但是會不會有一些讓人拍案叫絕的方案,可以大規(guī)模的降低成本呢?

我不是做大模型的, 并想不出來什么方案。但如果這樣的方案存在,或許將極大的改變大模型行業(yè)的競爭壁格局。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港