展會(huì)信息港展會(huì)大全

趕超OpenAI有望?谷歌秋季發(fā)布AI模型Gemini,創(chuàng)始人親自操刀
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-08-16 16:01:55   瀏覽:14179次  

導(dǎo)讀:劃重點(diǎn): 1 Gemini將會(huì)在今年秋季正式發(fā)布,讓谷歌有能力開發(fā)出競(jìng)爭(zhēng)對(duì)手無法開發(fā)的產(chǎn)品。 2 谷歌的Gemini模型不僅能理解并生成對(duì)話文本,還能像Midjourney一樣生成圖像。 3 谷歌計(jì)劃向外部開發(fā)人員出售訪問Gemini技術(shù)的權(quán)限。 4 谷歌聯(lián)合創(chuàng)始人親自參與Gemin...

劃重點(diǎn):

1

Gemini將會(huì)在今年秋季正式發(fā)布,讓谷歌有能力開發(fā)出競(jìng)爭(zhēng)對(duì)手無法開發(fā)的產(chǎn)品。

2

谷歌的Gemini模型不僅能理解并生成對(duì)話文本,還能像Midjourney一樣生成圖像。

3

谷歌計(jì)劃向外部開發(fā)人員出售訪問Gemini技術(shù)的權(quán)限。

4

谷歌聯(lián)合創(chuàng)始人親自參與Gemini項(xiàng)目開發(fā),并對(duì)模型進(jìn)行評(píng)估。

科技新聞?dòng)?8月16日消息,在今年5月的全球開發(fā)者大會(huì)上,谷歌首次透露正在開發(fā)大型語(yǔ)言模型Gemini。知情人士透露,Gemini將會(huì)在今年秋季正式發(fā)布,它不僅能像OpenAI的GPT-4一樣理解并生成對(duì)話文本,還能夠像Midjourney一樣生成圖像。

今年4月,谷歌母公司Alphabet的首席執(zhí)行官桑達(dá)爾皮查伊(Sundar Pichai)采取了一個(gè)不同尋常的步驟:合并旗下兩個(gè)擁有截然不同文化的人工智能團(tuán)隊(duì),以趕超OpenAI和其他競(jìng)爭(zhēng)對(duì)手。

如今,對(duì)谷歌這一努力的大考即將到來。數(shù)百人參與開發(fā)的谷歌大型機(jī)器學(xué)習(xí)模型將會(huì)在今年秋季發(fā)布,該產(chǎn)品將會(huì)是谷歌成立至今最重要的產(chǎn)品之一。據(jù)參開發(fā)的知情人士透露,谷歌開發(fā)的這組模型稱為Gemini,讓谷歌有能力開發(fā)出競(jìng)爭(zhēng)對(duì)手無法開發(fā)的產(chǎn)品。

OpenAI的GPT-4大型語(yǔ)言模型可以理解并生成對(duì)話文本。知情人士透露,Gemini將超越這一點(diǎn),把GPT-4等大型語(yǔ)言模型的文本功能與基于文本描述創(chuàng)建人工智能圖像的能力結(jié)合在一起,類似于人工智能圖像生成器Midjourney和Stable Diffusion。Gemini的生成圖像的能力之前沒有被報(bào)道過。

谷歌員工還討論過使用Gemini來提供一些功能,如分析圖表或創(chuàng)建帶有文本描述的圖形,以及使用文本或語(yǔ)音命令來控制軟件。谷歌正押注Gemini為各種服務(wù)提供動(dòng)能,從與OpenAI的ChatGPT競(jìng)爭(zhēng)的聊天機(jī)器人Bard ,到谷歌文檔和Slides等企業(yè)應(yīng)用。谷歌還希望通過谷歌云服務(wù)器租賃部門向訪問Gemini的應(yīng)用程序開發(fā)者收費(fèi)。谷歌云目前通過一款名為Vertex AI的產(chǎn)品出售更原始的谷歌開發(fā)的人工智能模型的訪問權(quán)限。這些新功能可能有助于谷歌趕上微軟,后者已在其Office 365應(yīng)用程序中率先推出了全新的人工智能功能,并向其應(yīng)用程序客戶出售OpenAI模型的訪問權(quán)限。

“我認(rèn)為在過去的9個(gè)月里,每個(gè)人都在問一個(gè)問題:‘什么時(shí)候有產(chǎn)品看起來能趕上OpenAI?’”風(fēng)投機(jī)構(gòu)Bloomberg Beta的人工智能初創(chuàng)公司投資者詹姆斯查姆(James Cham)說。“這將是第一個(gè)跡象,表明有人能夠以合法的方式與GPT-4競(jìng)爭(zhēng)。”

因?yàn)橄馚ard和ChatGPT這樣的人工智能服務(wù)希望幫助人們?cè)诓皇褂脗鹘y(tǒng)搜索引擎的情況下找到復(fù)雜問題的答案,谷歌必須冒險(xiǎn),嘗試在不削弱其核心搜索業(yè)務(wù)的情況下推出新技術(shù)。該公司還必須控制運(yùn)行Gemini模型的巨大服務(wù)器成本。參與該項(xiàng)目的人士透露,谷歌計(jì)劃在今年晚些時(shí)候向應(yīng)用程序開發(fā)人員正式推出Gemini,并可能在此之前開始在一些產(chǎn)品中使用它。

像Gemini這樣的機(jī)器學(xué)習(xí)模型通過分析大量的圖像和文本來識(shí)別模式并生成查詢的答案。過去,谷歌曾使用更簡(jiǎn)單的模型來改進(jìn)搜索。但是像Bard這樣的新產(chǎn)品依靠先進(jìn)的模型來處理更多的數(shù)據(jù),產(chǎn)生對(duì)話式的、類似人類的反應(yīng)。

YouTube的優(yōu)勢(shì)

據(jù)悉,谷歌在YouTube視頻轉(zhuǎn)錄的大型語(yǔ)料庫(kù)中訓(xùn)練了Gemini,但它也可以將視頻和音頻集成到Gemini模型本身,賦予它們多模態(tài)能力,許多研究人員認(rèn)為這是人工智能的下一個(gè)前沿。例如,在YouTube視頻上訓(xùn)練的模型可以幫助機(jī)械師根據(jù)視頻診斷汽車維修的問題。他們還可能根據(jù)用戶對(duì)他們想要?jiǎng)?chuàng)建的網(wǎng)站或應(yīng)用程序的草圖生成軟件代碼--OpenAI已經(jīng)測(cè)試了這種功能,但尚未正式推出。

使用YouTube內(nèi)容還可以幫助谷歌開發(fā)更先進(jìn)的文本到視頻軟件,根據(jù)用戶想看的內(nèi)容描述自動(dòng)生成詳細(xì)的視頻,類似于谷歌支持的初創(chuàng)公司RunwayML正在開發(fā)的技術(shù)。好萊塢和內(nèi)容創(chuàng)作者正密切關(guān)注這類軟件的發(fā)展。

至少有24名谷歌的經(jīng)理在負(fù)責(zé)Gemini的開發(fā)。他們包括曾在Google Brain和DeepMind工作的研究人員。Google Brain開發(fā)了谷歌當(dāng)前的人工智能模型Pathways Language Model;在2014年被谷歌收購(gòu)之后,DeepMind之前一直在獨(dú)立運(yùn)營(yíng)。這個(gè)新部門正在研究如何平衡從合并代碼到確定遠(yuǎn)程工作政策的一切。相比較而言,Google Brain對(duì)遠(yuǎn)程工作的態(tài)度遠(yuǎn)比DeepMind寬容。

DeepMind聯(lián)合創(chuàng)始人戴密斯哈薩比斯(Demis Hassabis)負(fù)責(zé)合并后的部門谷歌DeepMind。知情人士說,DeepMind的兩位長(zhǎng)期高管奧里奧爾維紐斯(Oriol Vinyals)和考瑞卡夫卡庫(kù)格魯(Koray Kavukcuoglu)與杰夫迪恩(Jeff Dean)一起負(fù)責(zé)Gemini。迪恩是谷歌的資深領(lǐng)導(dǎo)人,曾負(fù)責(zé)Google Brain。他們監(jiān)督參與Gemini開發(fā)的數(shù)百名員工。

在項(xiàng)目早期出現(xiàn)的一個(gè)問題是,工程師們是使用谷歌的軟件還是DeepMind的軟件,因?yàn)檫@兩個(gè)單位維護(hù)著完全獨(dú)立的代碼庫(kù)。他們確定了一種方法,其中涉及使用Pax,Google Brain用于訓(xùn)練機(jī)器學(xué)習(xí)模型的軟件,用于模型開發(fā)的早期階段,稱為預(yù)訓(xùn)練。在后期階段,該團(tuán)隊(duì)使用了DeepMind開發(fā)模型的軟件Core Model Strike。參與該項(xiàng)目的人士說,這一決定安撫了每一組的研究人員,但激怒了一些不想用不熟悉的軟件工作的其他人。

知情人士說,參與Gemini項(xiàng)目的聯(lián)合創(chuàng)始人塞吉布林(Sergey Brin)一直在對(duì)這些模型進(jìn)行自己的評(píng)估,并幫助訓(xùn)練它們。該消息稱,在團(tuán)隊(duì)發(fā)現(xiàn)Gemini接受了潛在攻擊性內(nèi)容的培訓(xùn)后,布林也參與了重新培訓(xùn)模型的技術(shù)決策。截至目前,谷歌發(fā)言人對(duì)此報(bào)道未予置評(píng)。

被迫合并

谷歌在2011年創(chuàng)建了Google Brain,以構(gòu)建人工智能來改善一切,從谷歌的搜索結(jié)果到該公司的廣告定位和Gmail中的自動(dòng)完成等功能。總部位于倫敦的DeepMind致力于更多的學(xué)術(shù)研究。它教會(huì)計(jì)算機(jī)下國(guó)際象棋或圍棋,其領(lǐng)導(dǎo)人認(rèn)為這項(xiàng)工作是發(fā)展人工智能道路上的一個(gè)里程碑。但是,盡管谷歌使用DeepMind的軟件來提高其數(shù)據(jù)中心的運(yùn)行效率,但該部門的工作并沒有對(duì)谷歌的核心產(chǎn)品產(chǎn)生太大影響。DeepMind的工程師也開發(fā)了他們自己的大型語(yǔ)言模型,但它們不是該公司的優(yōu)先事項(xiàng)。

去年年底,這一切都改變了。2022年11月,OpenAI發(fā)布了ChatGPT,幾周內(nèi)用戶激增至數(shù)千萬,幾個(gè)月內(nèi)收入數(shù)億美元。與此同時(shí),谷歌面臨著一系列的離職,包括一些知名研究人員流失到OpenAI,他們?cè)贑hatGPT的開發(fā)中發(fā)揮了重要作用。谷歌后來重新聘請(qǐng)了雅各布德夫林(Jacob Devlin),他在批評(píng)Bard的開發(fā)后于1月前往OpenAI;以及杰克雷(Jack Rae),他是前DeepMind研究員,已于2022年前往OpenAI。

在合并之前,Google Brain和DeepMind分別開發(fā)了針對(duì)ChatGPT的產(chǎn)品。DeepMind的工作人員開展了一個(gè)代號(hào)為Goodall的項(xiàng)目,利用一種名為Chipmunk的未公布模型的變體來開發(fā)ChatGPT的競(jìng)爭(zhēng)對(duì)手。最終,DeepMind停止了這項(xiàng)工作,轉(zhuǎn)而與Google Brain合作開發(fā)Gemini,盡管這兩個(gè)人工智能團(tuán)隊(duì)之間存在長(zhǎng)期的競(jìng)爭(zhēng)。

與此同時(shí),谷歌在3月份使用Google Brain的現(xiàn)有模型推出了Bard。當(dāng)時(shí),一些用戶批評(píng)Bard是ChatGPT的一個(gè)更有限的模仿者。但谷歌繼續(xù)改進(jìn)它,并在更多國(guó)家推出。5月,谷歌推出了大型語(yǔ)言模型PaLM 2,它改進(jìn)了Bard的答案和編寫代碼的能力。今年4月,皮查伊合并了Brain和DeepMind,這樣它們可以更快的行動(dòng)。這一變化令一些在Gemini工作的工程師感到意外,他們是在公司公開宣布時(shí)被告知這一消息的。

除了合并組織之外,該團(tuán)隊(duì)還面臨著發(fā)展道路上的巨大挑戰(zhàn),包括導(dǎo)航可以用來訓(xùn)練模型的數(shù)據(jù)。谷歌的律師一直在密切評(píng)估這項(xiàng)培訓(xùn)。在一個(gè)例子中,他們讓研究人員刪除了來自教科書的訓(xùn)練數(shù)據(jù)--這可能有助于模型回答天文學(xué)或生物學(xué)等學(xué)科的問題--因?yàn)閾?dān)心版權(quán)所有者的抵制。

不過,谷歌前高管、風(fēng)險(xiǎn)投資公司Felicis Ventures創(chuàng)始人艾登森庫(kù)特(Aydin Senkut)說,Gemini“基本上向我表明,谷歌決心再次走在前沿,而不是極端保守。這是正確的方向。”(無忌)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港