展會(huì)信息港展會(huì)大全

AI 開源許可證的法律與倫理之博弈
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-08-18 14:03:02   瀏覽:222439次  

導(dǎo)讀:整理 | 曾浩辰 責(zé)編 | 何苗 出品| 《開談》CSDN(ID:CSDNnews) 人工智能正以閃電般的速度席卷世界,AI 的開源許可與標(biāo)準(zhǔn)就像是這波浪潮中的一道道引水渠,引導(dǎo)著 AI 健康、安全有序地開放發(fā)展。但其本身也存在一些爭議:許可證的制定究竟是依賴倫理共識(shí),...

整理 | 曾浩辰 責(zé)編 | 何苗

出品| 《開談》CSDN(ID:CSDNnews)

人工智能正以閃電般的速度席卷世界,AI 的開源許可與標(biāo)準(zhǔn)就像是這波浪潮中的一道道引水渠,引導(dǎo)著 AI 健康、安全有序地開放發(fā)展。但其本身也存在一些爭議:許可證的制定究竟是依賴倫理共識(shí),還是完美的法律法規(guī)?

CSDN《開談》欄目以“AGI 時(shí)代的開源協(xié)議”為主題,邀請(qǐng)到開源社聯(lián)合創(chuàng)始人,Apache 軟件基金會(huì)正式會(huì)員劉天棟;中興通訊開源戰(zhàn)略總監(jiān),LF AI & Data 董事會(huì)主席孟偉;LF AI & Data TAC 成員兼生成式 AI 委員會(huì)發(fā)起人譚中意,以 AI 的開源協(xié)議為切入點(diǎn),探討 AI 治理的發(fā)展脈絡(luò)。

劉天棟從開源協(xié)作共享的角度,探討了許可證技術(shù)和道德的悖論,發(fā)人深思。孟偉分析了 AI 開源與傳統(tǒng)開源的不同之處,幫人們理清了 AI 開源充滿挑戰(zhàn)之處,并悄然將 AI 嵌入了 6G 通信的未來藍(lán)圖。而譚中意將目光聚焦于大模型應(yīng)用,力圖將 AI 的威力在各個(gè)領(lǐng)域展現(xiàn)無遺。

讓我們一同進(jìn)入 AI 開源的奇幻旅程,看看它究竟給帶來怎樣的精彩篇章。

精彩觀點(diǎn)搶先看:

孟偉:傳統(tǒng)的開源通常涵蓋程序員的智力產(chǎn)出,是其腦力勞動(dòng)的結(jié)晶。在 AI 開源中,這種情況更為復(fù)雜,它所涵蓋的內(nèi)容不僅限于人類智慧的輸出或者腦力勞動(dòng),還包括了數(shù)據(jù)和算力兩個(gè)重要方面。

劉天棟:人工智能的呼喚就是如此,你不應(yīng)該回答,但你一定會(huì)回答,因?yàn)楹闷嫘氖菬o法遏制的,這就是人類的本性。

譚中意:如果一個(gè)產(chǎn)業(yè)缺乏規(guī)則,人們就會(huì)小心謹(jǐn)慎,而有了規(guī)范,就意味著可以更加積極地前進(jìn)。這將促進(jìn) TOB(企業(yè)對(duì)企業(yè))和 TOC(企業(yè)對(duì)消費(fèi)者)應(yīng)用的繁榮發(fā)展。未來的很多年,將大模型的能力應(yīng)用到各行各業(yè)都是一個(gè)熱點(diǎn)問題。

AI 開源許可仍處在百花齊放的早期階段

CSDN:如何看待 AI 的開源?它和傳統(tǒng)開源有什么不同?

孟偉:傳統(tǒng)的開源通常僅涵蓋程序員的智力產(chǎn)出,是其腦力勞動(dòng)的結(jié)晶。而 AI 領(lǐng)域的開源則更為復(fù)雜,它不僅涵蓋人類智慧的輸出或者腦力勞動(dòng),還包括兩個(gè)重要方面:數(shù)據(jù)和算力。

數(shù)據(jù)在 AI 開源中具有關(guān)鍵地位,缺乏數(shù)據(jù)支持的大模型幾乎無法構(gòu)建。數(shù)據(jù)不僅僅代表個(gè)體的腦力勞動(dòng)產(chǎn)物,還牽涉到諸如人類隱私、倫理、合規(guī)等一系列問題。這使得數(shù)據(jù)在開源領(lǐng)域成為一個(gè)不可忽視的倫理和合規(guī)考量要素。

AI 開源還涉及到算力問題。在大模型興起前,開源項(xiàng)目主要源自歐美等技術(shù)較為先進(jìn)的國家。隨著大模型的興起,中東地區(qū)的石油生產(chǎn)國投入了大量金錢支撐算力資源,推動(dòng)了大模型的研發(fā)。算力也可能會(huì)影響到開源項(xiàng)目的平衡,并帶來一定的成本挑戰(zhàn)。

CSDN:開源許可證是如何被制定的?

孟偉:許可證的制定過程與制定標(biāo)準(zhǔn)的過程相似。它通常涉及到多次征求意見,最終形成一個(gè)被廣泛認(rèn)可的版本。這個(gè)過程可能由一個(gè)牽頭單位組織,可以是民間組織,也可以是官方機(jī)構(gòu)。這個(gè)過程類似于制定行業(yè)標(biāo)準(zhǔn),旨在確保許可證的內(nèi)容具有廣泛的適用性和認(rèn)可度。

許可證在國內(nèi)更常被視為一種約定或者合同協(xié)議,類似于網(wǎng)站登錄時(shí)所遇到的用戶協(xié)議。當(dāng)我們點(diǎn)擊“同意”時(shí),實(shí)際上是與網(wǎng)站達(dá)成了一種協(xié)議關(guān)系,即我們同意遵守其協(xié)議內(nèi)容。與此不同,在一些西方國家,特別是美國,許可證更多地涉及到版權(quán)和知識(shí)產(chǎn)權(quán),究竟是一種“合同(contract)”,還是單純的“許可證(license)”,還存在一定的爭議。

CSDN:目前,業(yè)界開源的大語言模型越來越多,性能也越來越強(qiáng)大。但一些知名的大模型如 LLaMa 、Falcon-40B 等,其開源協(xié)議卻頻繁引發(fā)爭議,業(yè)界關(guān)于 AI 的開源許可證和法規(guī)標(biāo)準(zhǔn)有哪些?

劉天棟:我們可以將法規(guī)劃分為不同層級(jí)。最高層次的法律法規(guī)通常具有較高的一致性,這是因?yàn)樗鼈兘?jīng)過多層立法和審批程序,具有較強(qiáng)的可持續(xù)性。然后是標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)在中間層級(jí)上變化較快,一致性相對(duì)較低。接下來是許可證,它更具靈活性,有多種類型,其中包括開源許可證。再往下是定制化的商業(yè)合同,可以根據(jù)需要進(jìn)行修改。最后是適用于不同場景的可定制協(xié)議,這些規(guī)則可能會(huì)隨著時(shí)代的變化而改變。

人工智能的崛起帶來了許多新挑戰(zhàn),不同文化和地區(qū)的倫理觀念可能會(huì)產(chǎn)生差異。在開源社區(qū)內(nèi)部,關(guān)于倫理規(guī)范的討論也引發(fā)了許多爭議。問題在于,應(yīng)該由誰來定義倫理道德?西方還是東方,還是其他文化?在不同地區(qū)的倫理觀念和數(shù)據(jù)隱私安全之間尋找平衡,是當(dāng)前急需解決的問題。

譚中意:Hugging Face(全球最大的模型托管平臺(tái)之一)托管著許多模型,這些模型都遵循不同的許可證,大致可以分成三類:第一類是傳統(tǒng)的開源軟件許可證,例如 GPL、LGPL、AGPL 等;第二類是與知識(shí)共享和創(chuàng)意共享相關(guān)的許可證,如 CC 系列,這些許可證通常在圖片、音頻、視頻等領(lǐng)域流行,涵蓋了共享、商用等不同條件;第三類是針對(duì)模型和數(shù)據(jù)專有的許可證,例如"BigScience OpenRAIL-M"、"CreativeML OpenRAIL-M"等。目前,關(guān)于模型和數(shù)據(jù)的許可證違規(guī)引發(fā)的法律訴訟相對(duì)較少,許可證的發(fā)展正處于多樣性并存的階段,但隨著人工智能的發(fā)展,這方面的法律案例會(huì)逐漸增多,推動(dòng)行業(yè)進(jìn)一步規(guī)范和發(fā)展。

AI 許可證應(yīng)助力產(chǎn)業(yè)發(fā)展,不要教條化

CSDN:在制定開源許可證時(shí),如何平衡全球適用性和地區(qū)差異?未來會(huì)出現(xiàn)一個(gè)全球公認(rèn)的統(tǒng)一標(biāo)準(zhǔn)嗎?

譚中意:中國在過去幾十年逐漸完善產(chǎn)業(yè)發(fā)展規(guī)則。如果一個(gè)產(chǎn)業(yè)缺乏規(guī)則,人們必定小心謹(jǐn)慎,而有了規(guī)范,就意味著可以更加積極地前進(jìn),促進(jìn) ToB 和 ToC 應(yīng)用的繁榮發(fā)展,對(duì)國內(nèi)的人工通用智能發(fā)展會(huì)產(chǎn)生巨大的推動(dòng)。

制定一個(gè)適用于 AI 模型的全球通用許可證相當(dāng)有難度。因?yàn)槟P腕w現(xiàn)人的價(jià)值觀,而價(jià)值觀帶有地域特性,很難兼顧全球性和普適性。所以我認(rèn)為,模型許可證可能在某些方面具備全球性,在某些方面又需要根據(jù)不同地區(qū)的特點(diǎn)來制定。所以要制定一個(gè)理論上適配所有地區(qū)法律的完美許可證不太實(shí)際,即使制定了也未必能得到實(shí)際應(yīng)用和普及。業(yè)界現(xiàn)在需要滿足工業(yè)界需求,能讓開發(fā)者、上下游容易理解和應(yīng)用的許可證。所以我認(rèn)為,當(dāng)前不必追求創(chuàng)造出完美、適用于所有情況的理想許可證,解決當(dāng)前問題、促進(jìn) AI 產(chǎn)業(yè)發(fā)展并朝著正向迭代的許可證更重要。

劉天棟:在歐盟的人工智能法案和中國的生成式人工智能管理辦法中,對(duì)數(shù)據(jù)和生成式人工智能的管理都設(shè)置了相當(dāng)嚴(yán)格的限制。因此開源許可證不需要涵蓋以上重復(fù)的內(nèi)容,而應(yīng)該專注于開源本身,將法律交由法律,將倫理交由倫理。無論是軟件還是大模型,都應(yīng)該鼓勵(lì)開放。開源模型許可證應(yīng)該遵循簡單明了的原則,鼓勵(lì)大家分享和傳播軟件、模型。無論是用于培訓(xùn)、重新訓(xùn)練還是重新分發(fā),都應(yīng)該是自由的。

在數(shù)據(jù)方面,特別是涉及到個(gè)人隱私的數(shù)據(jù),無論哪個(gè)國家都需要更加謹(jǐn)慎,考慮數(shù)據(jù)的隱私和安全。同時(shí),不要混淆開源軟件和數(shù)據(jù)隱私的問題。開源軟件和模型應(yīng)當(dāng)繼續(xù)開放,而數(shù)據(jù)隱私問題可以通過國家法規(guī)和責(zé)任追溯來保護(hù)。

孟偉:新技術(shù)剛開始發(fā)展的時(shí)候可能都會(huì)比較混亂,因不同意見和利益而博弈,但隨著時(shí)間的推移,肯定會(huì)趨于統(tǒng)一。遵循分久必合、合久必分的規(guī)律。

對(duì)于 AI 的許可證,國內(nèi)已經(jīng)開始行動(dòng),已經(jīng)有兩大標(biāo)準(zhǔn)機(jī)構(gòu)在制定開源大模型的許可證,如“紙鳶”開放人工智能模型許可證,木蘭系列許可證,其中開源數(shù)據(jù)的許可證已經(jīng)相對(duì)完善。隨著大模型許可證等相關(guān)問題的逐步凸顯,一些案件和案例會(huì)讓人們更加認(rèn)識(shí)到問題的重要性。我們已經(jīng)在積極地探討和解決這些問題,以確保開源領(lǐng)域的健康發(fā)展。

CSDN:企業(yè)在選擇開源模型、選擇協(xié)議許可證時(shí),如何能幫助他們的產(chǎn)業(yè)更好地落地?

譚中意:盡管大家對(duì)某些許可證存在一些爭議,但目前來說,AI 統(tǒng)一使用Apache License 2.0 是最容易選擇的,不管是代碼、模型還是數(shù)據(jù)。因?yàn)檫@是在軟件開源世界中被廣泛認(rèn)同為商業(yè)友好、兼顧軟件作者和使用者利益的許可證,也是理解成本最低的。使用它是相對(duì)來說最方便開發(fā)者采納。

但是,企業(yè)在選擇軟件、模型和數(shù)據(jù)的時(shí)候,許可證只是一個(gè)很小的部分,首先要考慮的是它是否能解決企業(yè)的問題。如果本身不能解決問題,即使它使用比較友好的許可證企業(yè)也不會(huì)采納它。所以,在成本范圍內(nèi)滿足開發(fā)者需求最關(guān)鍵,許可證只是一個(gè)影響因素。

回應(yīng) AI 的召喚,踏上星辰大海之征程

CSDN:過于強(qiáng)大的 AI 容易讓人類產(chǎn)生危機(jī)感,你如何看待此類困境?

孟偉:這不僅僅是一個(gè)挑戰(zhàn),也是一個(gè)機(jī)遇?傆幸恍╊I(lǐng)域,機(jī)器無法取代人類,比如人際關(guān)系和情感上的交流。好比我和譚老師之間工作之外還存在情感交流,這種同志間的友誼是機(jī)器無法復(fù)制的。在人工智能迅猛發(fā)展的未來,我們需要充分發(fā)揮自己的情感價(jià)值,而不是僅僅機(jī)械地從事勞動(dòng)。我鼓勵(lì)程序員更多地走出來,加入各種朋友圈子,互相交流、學(xué)習(xí),不僅是在知識(shí)上的交流,也在情感上真誠地互動(dòng)。

劉天棟:人是不會(huì)被取代的,你應(yīng)該向外探索、接受和融合。未來人類唯一的出路就是改造自我,同時(shí)享有 AI 的智能和機(jī)器的長壽,如此才能夠征服星辰大海。而當(dāng)下我們只能朝著新的方向前進(jìn),去探索未知。勇敢地迎接未來,摒棄悲觀情緒。

人工智能領(lǐng)域有很多專家以及深度學(xué)習(xí)大牛聯(lián)合起來,呼吁制止人工智能的快速發(fā)展,但我認(rèn)為這樣的呼吁并沒有太大的用處。就像著名科幻小說《三體》里的警示:不要回答!不要回答!但我們依然不會(huì)停下探索的腳步。專家們對(duì)人工智能的呼喚也是如此,你不應(yīng)該回答,但你一定會(huì)回答,因?yàn)楹闷嫘氖菬o法遏制的,這就是人類的本性。勇敢地面對(duì)未知,而不是回避。將人工智能與人類結(jié)合,迎接未來,我認(rèn)為要擁有一種樂觀的態(tài)度。

CSDN:對(duì) AI 開源的未來,你有哪些關(guān)注的議題?

譚中意:目前我非常關(guān)注大模型的應(yīng)用開發(fā),即 LLMOps。在大模型領(lǐng)域,能夠從事開發(fā)基礎(chǔ)模型的人相對(duì)較少,而能夠從事開發(fā)行業(yè)模型的人也不多,更多的工作是將大模型的能力應(yīng)用到各行各業(yè),并與現(xiàn)有的軟件應(yīng)用相結(jié)合,稱之為大模型應(yīng)用開發(fā)。星策社區(qū)最近不斷在組織此類活動(dòng),邀請(qǐng)從事大模型應(yīng)用開發(fā)的同行分享經(jīng)驗(yàn)并交流體會(huì)。我認(rèn)為,未來的很多年里這都是一個(gè)熱點(diǎn)問題。

孟偉:就我所在的通信行業(yè)而言,我們的關(guān)注點(diǎn)已逐漸從通用的大模型轉(zhuǎn)向了如何將其應(yīng)用于通信行業(yè)。特別是在 5G 向 6G 的演進(jìn)過程中,如何將人工智能及其能力(算法,算力,數(shù)據(jù)等)內(nèi)生于 6G 網(wǎng)絡(luò)中,成了我們目前重點(diǎn)研究領(lǐng)域。

劉天棟:Let's cross the boundries together, 一起攜手跨越邊界,是我正在做的,也是開源社的使命。最近參加一些國際會(huì)議發(fā)現(xiàn),亞洲尤其是中國的代表,聲量實(shí)在太少了。我希望中國的聲音能夠被更多的國際基金會(huì)、開源社區(qū)、政府機(jī)構(gòu)以及企業(yè)聽到,將開源傳播出去。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港