當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > AI 開源許可證的法律與倫理之博弈

AI 開源許可證的法律與倫理之博弈
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-08-18 14:03:02 瀏覽：222439次

導(dǎo)讀：整理 | 曾浩辰責(zé)編 | 何苗出品| 《開談》CSDN（ID：CSDNnews）人工智能正以閃電般的速度席卷世界，AI 的開源許可與標(biāo)準(zhǔn)就像是這波浪潮中的一道道引水渠，引導(dǎo)著 AI 健康、安全有序地開放發(fā)展。但其本身也存在一些爭議：許可證的制定究竟是依賴倫理共識(shí)，...

整理 | 曾浩辰責(zé)編 | 何苗

出品| 《開談》CSDN（ID：CSDNnews）

人工智能正以閃電般的速度席卷世界，AI 的開源許可與標(biāo)準(zhǔn)就像是這波浪潮中的一道道引水渠，引導(dǎo)著 AI 健康、安全有序地開放發(fā)展。但其本身也存在一些爭議：許可證的制定究竟是依賴倫理共識(shí)，還是完美的法律法規(guī)？

CSDN《開談》欄目以“AGI 時(shí)代的開源協(xié)議”為主題，邀請(qǐng)到開源社聯(lián)合創(chuàng)始人，Apache 軟件基金會(huì)正式會(huì)員劉天棟；中興通訊開源戰(zhàn)略總監(jiān)，LF AI & Data 董事會(huì)主席孟偉；LF AI & Data TAC 成員兼生成式 AI 委員會(huì)發(fā)起人譚中意，以 AI 的開源協(xié)議為切入點(diǎn)，探討 AI 治理的發(fā)展脈絡(luò)。

劉天棟從開源協(xié)作共享的角度，探討了許可證技術(shù)和道德的悖論，發(fā)人深思。孟偉分析了 AI 開源與傳統(tǒng)開源的不同之處，幫人們理清了 AI 開源充滿挑戰(zhàn)之處，并悄然將 AI 嵌入了 6G 通信的未來藍(lán)圖。而譚中意將目光聚焦于大模型應(yīng)用，力圖將 AI 的威力在各個(gè)領(lǐng)域展現(xiàn)無遺。

讓我們一同進(jìn)入 AI 開源的奇幻旅程，看看它究竟給帶來怎樣的精彩篇章。

精彩觀點(diǎn)搶先看：

孟偉：傳統(tǒng)的開源通常涵蓋程序員的智力產(chǎn)出，是其腦力勞動(dòng)的結(jié)晶。在 AI 開源中，這種情況更為復(fù)雜，它所涵蓋的內(nèi)容不僅限于人類智慧的輸出或者腦力勞動(dòng)，還包括了數(shù)據(jù)和算力兩個(gè)重要方面。

劉天棟：人工智能的呼喚就是如此，你不應(yīng)該回答，但你一定會(huì)回答，因?yàn)楹闷嫘氖菬o法遏制的，這就是人類的本性。

譚中意：如果一個(gè)產(chǎn)業(yè)缺乏規(guī)則，人們就會(huì)小心謹(jǐn)慎，而有了規(guī)范，就意味著可以更加積極地前進(jìn)。這將促進(jìn) TOB（企業(yè)對(duì)企業(yè)）和 TOC（企業(yè)對(duì)消費(fèi)者）應(yīng)用的繁榮發(fā)展。未來的很多年，將大模型的能力應(yīng)用到各行各業(yè)都是一個(gè)熱點(diǎn)問題。

AI 開源許可仍處在百花齊放的早期階段

CSDN：如何看待 AI 的開源？它和傳統(tǒng)開源有什么不同？

孟偉：傳統(tǒng)的開源通常僅涵蓋程序員的智力產(chǎn)出，是其腦力勞動(dòng)的結(jié)晶。而 AI 領(lǐng)域的開源則更為復(fù)雜，它不僅涵蓋人類智慧的輸出或者腦力勞動(dòng)，還包括兩個(gè)重要方面：數(shù)據(jù)和算力。

數(shù)據(jù)在 AI 開源中具有關(guān)鍵地位，缺乏數(shù)據(jù)支持的大模型幾乎無法構(gòu)建。數(shù)據(jù)不僅僅代表個(gè)體的腦力勞動(dòng)產(chǎn)物，還牽涉到諸如人類隱私、倫理、合規(guī)等一系列問題。這使得數(shù)據(jù)在開源領(lǐng)域成為一個(gè)不可忽視的倫理和合規(guī)考量要素。

AI 開源還涉及到算力問題。在大模型興起前，開源項(xiàng)目主要源自歐美等技術(shù)較為先進(jìn)的國家。隨著大模型的興起，中東地區(qū)的石油生產(chǎn)國投入了大量金錢支撐算力資源，推動(dòng)了大模型的研發(fā)。算力也可能會(huì)影響到開源項(xiàng)目的平衡，并帶來一定的成本挑戰(zhàn)。

CSDN：開源許可證是如何被制定的？

孟偉：許可證的制定過程與制定標(biāo)準(zhǔn)的過程相似。它通常涉及到多次征求意見，最終形成一個(gè)被廣泛認(rèn)可的版本。這個(gè)過程可能由一個(gè)牽頭單位組織，可以是民間組織，也可以是官方機(jī)構(gòu)。這個(gè)過程類似于制定行業(yè)標(biāo)準(zhǔn)，旨在確保許可證的內(nèi)容具有廣泛的適用性和認(rèn)可度。

許可證在國內(nèi)更常被視為一種約定或者合同協(xié)議，類似于網(wǎng)站登錄時(shí)所遇到的用戶協(xié)議。當(dāng)我們點(diǎn)擊“同意”時(shí)，實(shí)際上是與網(wǎng)站達(dá)成了一種協(xié)議關(guān)系，即我們同意遵守其協(xié)議內(nèi)容。與此不同，在一些西方國家，特別是美國，許可證更多地涉及到版權(quán)和知識(shí)產(chǎn)權(quán)，究竟是一種“合同（contract）”，還是單純的“許可證（license）”，還存在一定的爭議。

CSDN：目前，業(yè)界開源的大語言模型越來越多，性能也越來越強(qiáng)大。但一些知名的大模型如 LLaMa 、Falcon-40B 等，其開源協(xié)議卻頻繁引發(fā)爭議，業(yè)界關(guān)于 AI 的開源許可證和法規(guī)標(biāo)準(zhǔn)有哪些？

劉天棟：我們可以將法規(guī)劃分為不同層級(jí)。最高層次的法律法規(guī)通常具有較高的一致性，這是因?yàn)樗鼈兘?jīng)過多層立法和審批程序，具有較強(qiáng)的可持續(xù)性。然后是標(biāo)準(zhǔn)，這些標(biāo)準(zhǔn)在中間層級(jí)上變化較快，一致性相對(duì)較低。接下來是許可證，它更具靈活性，有多種類型，其中包括開源許可證。再往下是定制化的商業(yè)合同，可以根據(jù)需要進(jìn)行修改。最后是適用于不同場景的可定制協(xié)議，這些規(guī)則可能會(huì)隨著時(shí)代的變化而改變。

人工智能的崛起帶來了許多新挑戰(zhàn)，不同文化和地區(qū)的倫理觀念可能會(huì)產(chǎn)生差異。在開源社區(qū)內(nèi)部，關(guān)于倫理規(guī)范的討論也引發(fā)了許多爭議。問題在于，應(yīng)該由誰來定義倫理道德？西方還是東方，還是其他文化？在不同地區(qū)的倫理觀念和數(shù)據(jù)隱私安全之間尋找平衡，是當(dāng)前急需解決的問題。

譚中意：Hugging Face（全球最大的模型托管平臺(tái)之一）托管著許多模型，這些模型都遵循不同的許可證，大致可以分成三類：第一類是傳統(tǒng)的開源軟件許可證，例如 GPL、LGPL、AGPL 等；第二類是與知識(shí)共享和創(chuàng)意共享相關(guān)的許可證，如 CC 系列，這些許可證通常在圖片、音頻、視頻等領(lǐng)域流行，涵蓋了共享、商用等不同條件；第三類是針對(duì)模型和數(shù)據(jù)專有的許可證，例如"BigScience OpenRAIL-M"、"CreativeML OpenRAIL-M"等。目前，關(guān)于模型和數(shù)據(jù)的許可證違規(guī)引發(fā)的法律訴訟相對(duì)較少，許可證的發(fā)展正處于多樣性并存的階段，但隨著人工智能的發(fā)展，這方面的法律案例會(huì)逐漸增多，推動(dòng)行業(yè)進(jìn)一步規(guī)范和發(fā)展。

AI 許可證應(yīng)助力產(chǎn)業(yè)發(fā)展，不要教條化

CSDN：在制定開源許可證時(shí)，如何平衡全球適用性和地區(qū)差異？未來會(huì)出現(xiàn)一個(gè)全球公認(rèn)的統(tǒng)一標(biāo)準(zhǔn)嗎？

譚中意：中國在過去幾十年逐漸完善產(chǎn)業(yè)發(fā)展規(guī)則。如果一個(gè)產(chǎn)業(yè)缺乏規(guī)則，人們必定小心謹(jǐn)慎，而有了規(guī)范，就意味著可以更加積極地前進(jìn)，促進(jìn) ToB 和 ToC 應(yīng)用的繁榮發(fā)展，對(duì)國內(nèi)的人工通用智能發(fā)展會(huì)產(chǎn)生巨大的推動(dòng)。

制定一個(gè)適用于 AI 模型的全球通用許可證相當(dāng)有難度。因?yàn)槟Ｐ腕w現(xiàn)人的價(jià)值觀，而價(jià)值觀帶有地域特性，很難兼顧全球性和普適性。所以我認(rèn)為，模型許可證可能在某些方面具備全球性，在某些方面又需要根據(jù)不同地區(qū)的特點(diǎn)來制定。所以要制定一個(gè)理論上適配所有地區(qū)法律的完美許可證不太實(shí)際，即使制定了也未必能得到實(shí)際應(yīng)用和普及。業(yè)界現(xiàn)在需要滿足工業(yè)界需求，能讓開發(fā)者、上下游容易理解和應(yīng)用的許可證。所以我認(rèn)為，當(dāng)前不必追求創(chuàng)造出完美、適用于所有情況的理想許可證，解決當(dāng)前問題、促進(jìn) AI 產(chǎn)業(yè)發(fā)展并朝著正向迭代的許可證更重要。

劉天棟：在歐盟的人工智能法案和中國的生成式人工智能管理辦法中，對(duì)數(shù)據(jù)和生成式人工智能的管理都設(shè)置了相當(dāng)嚴(yán)格的限制。因此開源許可證不需要涵蓋以上重復(fù)的內(nèi)容，而應(yīng)該專注于開源本身，將法律交由法律，將倫理交由倫理。無論是軟件還是大模型，都應(yīng)該鼓勵(lì)開放。開源模型許可證應(yīng)該遵循簡單明了的原則，鼓勵(lì)大家分享和傳播軟件、模型。無論是用于培訓(xùn)、重新訓(xùn)練還是重新分發(fā)，都應(yīng)該是自由的。

在數(shù)據(jù)方面，特別是涉及到個(gè)人隱私的數(shù)據(jù)，無論哪個(gè)國家都需要更加謹(jǐn)慎，考慮數(shù)據(jù)的隱私和安全。同時(shí)，不要混淆開源軟件和數(shù)據(jù)隱私的問題。開源軟件和模型應(yīng)當(dāng)繼續(xù)開放，而數(shù)據(jù)隱私問題可以通過國家法規(guī)和責(zé)任追溯來保護(hù)。

孟偉：新技術(shù)剛開始發(fā)展的時(shí)候可能都會(huì)比較混亂，因不同意見和利益而博弈，但隨著時(shí)間的推移，肯定會(huì)趨于統(tǒng)一。遵循分久必合、合久必分的規(guī)律。

對(duì)于 AI 的許可證，國內(nèi)已經(jīng)開始行動(dòng)，已經(jīng)有兩大標(biāo)準(zhǔn)機(jī)構(gòu)在制定開源大模型的許可證，如“紙鳶”開放人工智能模型許可證，木蘭系列許可證，其中開源數(shù)據(jù)的許可證已經(jīng)相對(duì)完善。隨著大模型許可證等相關(guān)問題的逐步凸顯，一些案件和案例會(huì)讓人們更加認(rèn)識(shí)到問題的重要性。我們已經(jīng)在積極地探討和解決這些問題，以確保開源領(lǐng)域的健康發(fā)展。

CSDN：企業(yè)在選擇開源模型、選擇協(xié)議許可證時(shí)，如何能幫助他們的產(chǎn)業(yè)更好地落地？

譚中意：盡管大家對(duì)某些許可證存在一些爭議，但目前來說，AI 統(tǒng)一使用Apache License 2.0 是最容易選擇的，不管是代碼、模型還是數(shù)據(jù)。因?yàn)檫@是在軟件開源世界中被廣泛認(rèn)同為商業(yè)友好、兼顧軟件作者和使用者利益的許可證，也是理解成本最低的。使用它是相對(duì)來說最方便開發(fā)者采納。

但是，企業(yè)在選擇軟件、模型和數(shù)據(jù)的時(shí)候，許可證只是一個(gè)很小的部分，首先要考慮的是它是否能解決企業(yè)的問題。如果本身不能解決問題，即使它使用比較友好的許可證企業(yè)也不會(huì)采納它。所以，在成本范圍內(nèi)滿足開發(fā)者需求最關(guān)鍵，許可證只是一個(gè)影響因素。

回應(yīng) AI 的召喚，踏上星辰大海之征程

CSDN：過于強(qiáng)大的 AI 容易讓人類產(chǎn)生危機(jī)感，你如何看待此類困境？

孟偉：這不僅僅是一個(gè)挑戰(zhàn)，也是一個(gè)機(jī)遇�？傆幸恍╊I(lǐng)域，機(jī)器無法取代人類，比如人際關(guān)系和情感上的交流。好比我和譚老師之間工作之外還存在情感交流，這種同志間的友誼是機(jī)器無法復(fù)制的。在人工智能迅猛發(fā)展的未來，我們需要充分發(fā)揮自己的情感價(jià)值，而不是僅僅機(jī)械地從事勞動(dòng)。我鼓勵(lì)程序員更多地走出來，加入各種朋友圈子，互相交流、學(xué)習(xí)，不僅是在知識(shí)上的交流，也在情感上真誠地互動(dòng)。

劉天棟：人是不會(huì)被取代的，你應(yīng)該向外探索、接受和融合。未來人類唯一的出路就是改造自我，同時(shí)享有 AI 的智能和機(jī)器的長壽，如此才能夠征服星辰大海。而當(dāng)下我們只能朝著新的方向前進(jìn)，去探索未知。勇敢地迎接未來，摒棄悲觀情緒。

人工智能領(lǐng)域有很多專家以及深度學(xué)習(xí)大牛聯(lián)合起來，呼吁制止人工智能的快速發(fā)展，但我認(rèn)為這樣的呼吁并沒有太大的用處。就像著名科幻小說《三體》里的警示：不要回答！不要回答！但我們依然不會(huì)停下探索的腳步。專家們對(duì)人工智能的呼喚也是如此，你不應(yīng)該回答，但你一定會(huì)回答，因?yàn)楹闷嫘氖菬o法遏制的，這就是人類的本性。勇敢地面對(duì)未知，而不是回避。將人工智能與人類結(jié)合，迎接未來，我認(rèn)為要擁有一種樂觀的態(tài)度。

CSDN：對(duì) AI 開源的未來，你有哪些關(guān)注的議題？

譚中意：目前我非常關(guān)注大模型的應(yīng)用開發(fā)，即 LLMOps。在大模型領(lǐng)域，能夠從事開發(fā)基礎(chǔ)模型的人相對(duì)較少，而能夠從事開發(fā)行業(yè)模型的人也不多，更多的工作是將大模型的能力應(yīng)用到各行各業(yè)，并與現(xiàn)有的軟件應(yīng)用相結(jié)合，稱之為大模型應(yīng)用開發(fā)。星策社區(qū)最近不斷在組織此類活動(dòng)，邀請(qǐng)從事大模型應(yīng)用開發(fā)的同行分享經(jīng)驗(yàn)并交流體會(huì)。我認(rèn)為，未來的很多年里這都是一個(gè)熱點(diǎn)問題。

孟偉：就我所在的通信行業(yè)而言，我們的關(guān)注點(diǎn)已逐漸從通用的大模型轉(zhuǎn)向了如何將其應(yīng)用于通信行業(yè)。特別是在 5G 向 6G 的演進(jìn)過程中，如何將人工智能及其能力（算法，算力，數(shù)據(jù)等）內(nèi)生于 6G 網(wǎng)絡(luò)中，成了我們目前重點(diǎn)研究領(lǐng)域。

劉天棟：Let's cross the boundries together, 一起攜手跨越邊界，是我正在做的，也是開源社的使命。最近參加一些國際會(huì)議發(fā)現(xiàn)，亞洲尤其是中國的代表，聲量實(shí)在太少了。我希望中國的聲音能夠被更多的國際基金會(huì)、開源社區(qū)、政府機(jī)構(gòu)以及企業(yè)聽到，將開源傳播出去。