展會(huì)信息港展會(huì)大全

重建“巴別塔”?微軟試用AI破譯印度方言
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-02 07:42:11   瀏覽:2756次  

導(dǎo)讀:按照不同的統(tǒng)計(jì)方法,印度至少有120種語(yǔ)言,還有1300種本族語(yǔ),本族語(yǔ)是印度專有說(shuō)法,指的是當(dāng)?shù)胤窖。印度政府承認(rèn)22種語(yǔ)言,但主要使用兩種語(yǔ)言:印地語(yǔ)和英語(yǔ),其中印地語(yǔ)的使用范圍主要在印度北部。另外還有成千上萬(wàn)印度人兩種語(yǔ)言都不會(huì)。 來(lái)看看科技...

按照不同的統(tǒng)計(jì)方法,印度至少有120種語(yǔ)言,還有1300種“本族語(yǔ)”,“本族語(yǔ)”是印度專有說(shuō)法,指的是當(dāng)?shù)胤窖。印度政府承認(rèn)22種語(yǔ)言,但主要使用兩種語(yǔ)言:印地語(yǔ)和英語(yǔ),其中印地語(yǔ)的使用范圍主要在印度北部。另外還有成千上萬(wàn)印度人兩種語(yǔ)言都不會(huì)。

來(lái)看看科技巨頭微軟的AI for Good計(jì)劃,即利用人工智能解決健康、環(huán)境保護(hù)和人類發(fā)展方面問(wèn)題的綜合計(jì)劃。美國(guó)微軟在印度嘗試了人工智能幾種新用途,例如一款用人工智能告訴農(nóng)民播種最佳時(shí)間的應(yīng)用,還有一款模型用衛(wèi)星圖像預(yù)測(cè)自然災(zāi)害對(duì)弱勢(shì)群體可能造成的危害。

圖片來(lái)源:COURTESY OF MICROSOFT

不過(guò)微軟及人工智能研究人員對(duì)印度的語(yǔ)言難題尤其感興趣,希望能從其他角度獲得突破。“印度很復(fù)雜,所以能成為多語(yǔ)言環(huán)境的試驗(yàn)場(chǎng),”微軟亞洲區(qū)總裁艾哈邁德馬扎里表示。“如果能在印度解決問(wèn)題打通方案,就能應(yīng)付全世界的難題。”

小語(yǔ)言模型和大語(yǔ)言模型

2023年5月,微軟推出了Jugalbandi聊天機(jī)器人,也是AI for Good計(jì)劃的旗艦項(xiàng)目之一。聊天機(jī)器人主要服務(wù)對(duì)象是農(nóng)民,特別是不會(huì)說(shuō)印度流行語(yǔ)言,又希望了解或獲得申請(qǐng)獎(jiǎng)學(xué)金之類公共服務(wù)的農(nóng)民。

Jugalbandi利用當(dāng)?shù)匮芯繉?shí)驗(yàn)室AI4Bharat開發(fā)的大語(yǔ)言模型解析查詢,發(fā)現(xiàn)相關(guān)信息,然后用母語(yǔ)生成容易理解的答案。(目前,Jugalbandi可以翻譯印度22種官方語(yǔ)言中的10種。)

(之前《財(cái)富》雜志將微軟與人工智能和Jugalbandi的合作列入2023年《改變世界的公司》榜單。)

微軟的另一項(xiàng)計(jì)劃名叫VeLLM,或“大語(yǔ)言模型通用授權(quán)”,主要目標(biāo)是改進(jìn)GPT處理不太流行的語(yǔ)言時(shí)的效果。GPT是OpenAI開發(fā)的模型,也是ChatGPT的基,F(xiàn)今多數(shù)大語(yǔ)言模型處理全球幾種主要流行語(yǔ)言時(shí)效果最好,主要是英語(yǔ)和漢語(yǔ),因?yàn)檫@兩種語(yǔ)言的數(shù)據(jù)太多。低資源語(yǔ)言由于數(shù)據(jù)稀缺,想用來(lái)訓(xùn)練人工智能困難很大。

VeLLM是Shiksha等其他人工智能實(shí)驗(yàn)的基矗Shiksha是生成式人工智能機(jī)器人,能幫教師快速用非英語(yǔ)創(chuàng)建新課程,從而省下更多精力用于教學(xué)。

“參與式”設(shè)計(jì)

在微軟印度研究院(Microsoft Research India)首席研究員卡利卡巴厘等工程師看來(lái),只注重走可愛風(fēng),然而無(wú)法反映印度農(nóng)村生活方式的技術(shù)解決方案不一定行得通。

長(zhǎng)期以來(lái),技術(shù)專家一直把位于南亞的印度當(dāng)成試驗(yàn)場(chǎng),希望證明低價(jià)的筆記本電腦、實(shí)惠的互聯(lián)網(wǎng)和智能手機(jī)應(yīng)用能改善印度農(nóng)村的生活質(zhì)量。

然而,巴厘嚴(yán)肅指出,并非每項(xiàng)計(jì)劃都很成功。她記得有個(gè)項(xiàng)目里設(shè)計(jì)師嘗試開發(fā)能幫印度農(nóng)婦獲取重要信息的游戲。

“農(nóng)婦輕蔑地瞥了一眼開發(fā)人員,”她說(shuō)。“她們說(shuō)‘你認(rèn)為我們有時(shí)間玩游戲?’”

因此,巴厘說(shuō)團(tuán)隊(duì)采取“參與式”設(shè)計(jì)過(guò)程。“我們?cè)诜⻊?wù)的社區(qū)住了很久,讓用戶自己提出對(duì)技術(shù)的具體需求,或者希望解決問(wèn)題的方式,”她說(shuō)。

不僅是社會(huì)公益

當(dāng)然,微軟對(duì)人工智能的興趣不僅在于社會(huì)公益方面的潛力。這家美國(guó)科技巨頭正開發(fā)自家的人工智能產(chǎn)品,部署在Azure云計(jì)算系統(tǒng)。微軟也是ChatGPT開發(fā)方OpenAI的關(guān)鍵支持者。過(guò)去一年,人工智能熱火朝天推動(dòng)微軟股價(jià)上漲了65%,市值達(dá)到3萬(wàn)億美元,成為美國(guó)市值第一。

馬扎里認(rèn)為微軟在亞洲有很多機(jī)會(huì),因?yàn)閬喼?ldquo;各行業(yè)和地區(qū)的變革和轉(zhuǎn)型速度令人難以置信”。他舉出亞洲公司利用微軟生成式人工智能服務(wù)的幾個(gè)案例:阿里巴巴旗下的東南亞電商平臺(tái)Lazada用微軟工具創(chuàng)建了東南亞第一個(gè)電商聊天機(jī)器人。

然而,即便微軟在印度的實(shí)驗(yàn)對(duì)公司底線不會(huì)造成直接影響,還是能為公司的未來(lái)提供重要經(jīng)驗(yàn)教訓(xùn)。

“通過(guò)AI for Good和其他試點(diǎn)計(jì)劃中的合作關(guān)系,我們能發(fā)現(xiàn)推進(jìn)人工智能安全和保障方面的早期信號(hào),”馬扎里說(shuō)。隨后相關(guān)經(jīng)驗(yàn)教訓(xùn)可用于制定新技術(shù)“急需的護(hù)欄政策”。

巴厘知道,她的工作與微軟對(duì)人工智能的整體商業(yè)興趣很難區(qū)分。

“為了讓使用技術(shù)有困難的人們先用上技術(shù),這些還只是早期嘗試,”她說(shuō)。“未來(lái)他們有望順利用上技術(shù),當(dāng)然也會(huì)用微軟的產(chǎn)品。”(財(cái)富中文網(wǎng))

AI技術(shù)進(jìn)展及其應(yīng)用,將是3月27-28日于香港舉行的《財(cái)富》創(chuàng)新論壇(Fortune Innovation Forum)上的焦點(diǎn)議題之一。這次論壇將集技術(shù)與行業(yè)專家、投資者和全球大企業(yè)的領(lǐng)導(dǎo)者于一堂,討論在快速變化的世界中,企業(yè)如何抓住機(jī)遇,探索“新增長(zhǎng)戰(zhàn)略”。

譯者:梁宇

審校:夏林

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: 重建 巴別塔 微軟 試用 破譯 印度 方言

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港