日韩一区精品视频一区二区,永久黄网站色视频免费,日本国产精品

表格增強(qiáng)生成TAG登場：解鎖AI自然語言與數(shù)據(jù)庫的完美結(jié)合

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-09-10 14:28:58 瀏覽：1836次

導(dǎo)讀：機(jī)器之心報(bào)道編輯：陳陳與 Text2SQL 或 RAG 不同，TAG 充分利用了數(shù)據(jù)庫系統(tǒng)和 LLM 的功能。人工智能已經(jīng)改變了人們的工作方式和與數(shù)據(jù)交互的方式�；叵霂啄昵�，研究人員必須編寫 SQL 查詢和代碼才能從大量數(shù)據(jù)中提取有用信息。如今，他們只需輸入問題，...

機(jī)器之心報(bào)道

編輯：陳陳

與 Text2SQL 或 RAG 不同，TAG 充分利用了數(shù)據(jù)庫系統(tǒng)和 LLM 的功能。

人工智能已經(jīng)改變了人們的工作方式和與數(shù)據(jù)交互的方式�；叵霂啄昵埃芯咳藛T必須編寫 SQL 查詢和代碼才能從大量數(shù)據(jù)中提取有用信息。如今，他們只需輸入問題，由語言模型驅(qū)動的底層系統(tǒng)會完成其余工作，讓用戶只需與數(shù)據(jù)對話即可立即獲得答案。

這些新系統(tǒng)向數(shù)據(jù)庫提供自然語言交互，這種轉(zhuǎn)變?nèi)〉昧素S碩成果，但仍存在一些問題。從本質(zhì)上講，這些系統(tǒng)仍然無法處理各種查詢。

本文，來自 UC 伯克利和斯坦福大學(xué)的研究人員現(xiàn)在正努力用一種名為表格增強(qiáng)生成 (TAG，Table-Augmented Generation) 的新方法來解決這一問題。

論文地址：https://arxiv.org/pdf/2408.14717

項(xiàng)目地址：https://github.com/TAG-Research/TAG-Bench

論文標(biāo)題：Text2SQL is Not Enough: Unifying AI and Databases with TAG

TAG 是一種統(tǒng)一且通用的范式，用于回答數(shù)據(jù)庫中的自然語言問題。TAG 模型代表了 LM 和數(shù)據(jù)庫之間未曾探索過的廣泛交互。

TAG 是如何工作的

目前，當(dāng)用戶對自定義數(shù)據(jù)源提出自然語言問題時，主要采用兩種方法：文本到 SQL 或檢索增強(qiáng)生成 (RAG)。

雖然這兩種方法都能很好地完成工作，但當(dāng)問題變得復(fù)雜并超出系統(tǒng)能力時，用戶就會遇到問題。

舉例來說，文本到 SQL 的方法（這是一種將文本提示轉(zhuǎn)換為數(shù)據(jù)庫可以執(zhí)行的 SQL 查詢）僅關(guān)注可以用關(guān)系代數(shù)表達(dá)的自然語言問題，但只能查詢用戶可能想要詢問的一小部分問題。

相似的，RAG 只能通過對數(shù)據(jù)庫中的一個或幾個數(shù)據(jù)記錄的點(diǎn)查找來回答相關(guān)的查詢。這種方法專注于直接從數(shù)據(jù)庫中檢索特定信息點(diǎn)，而不涉及更復(fù)雜的數(shù)據(jù)處理或分析。

然而，對于商業(yè)用戶來說，他們的問題通常需要復(fù)雜的領(lǐng)域知識、世界知識、精確計(jì)算和語義推理的組合。

為了解決這一問題，該研究提出了 TAG 系統(tǒng)，其實(shí)現(xiàn)主要包含三個步驟：查詢合成、查詢執(zhí)行和答案生成。

TAG 模型很簡單，但功能強(qiáng)大，由以下三個方程定義：

值得注意的是，TAG 模型統(tǒng)一了之前的方法，包括 Text2SQL 和 RAG，它們僅代表了 TAG 的特殊情況并且僅能解決有限的用戶問題子集。

查詢合成

首先，LM 推斷哪些數(shù)據(jù)與回答問題相關(guān)，并將輸入轉(zhuǎn)換為該數(shù)據(jù)庫的可執(zhí)行查詢（不僅僅是 SQL）。

其中，syn 函數(shù)接受自然語言請求并生成要由數(shù)據(jù)庫系統(tǒng)執(zhí)行的查詢。對于給定的用戶請求，此步驟負(fù)責(zé) (a) 推斷哪些數(shù)據(jù)與回答請求相關(guān)，以及 (b) 執(zhí)行語義解析以將用戶請求轉(zhuǎn)換為可由數(shù)據(jù)庫系統(tǒng)執(zhí)行的查詢。此查詢可以使用任何查詢語言。論文示例中使用了 SQL。

如圖 1 所示，該查詢的問題是「總結(jié)票房最高的被認(rèn)為是經(jīng)典的愛情電影的評論」。在這里，數(shù)據(jù)源包含有關(guān)每部電影的名字、收入、類型和相關(guān)評論的信息。在此步驟中，系統(tǒng)利用 LM 的語義推理能力來生成 SQL 查詢，該查詢使用來自數(shù)據(jù)源的電影標(biāo)題、評論、收入和類型的屬性。

查詢執(zhí)行

在查詢執(zhí)行階段，exec 函數(shù)在數(shù)據(jù)庫系統(tǒng)中執(zhí)行查詢，獲取表。此步驟利用數(shù)據(jù)庫查詢引擎對大量存儲的數(shù)據(jù)進(jìn)行有效地查詢。

如圖 1 所示，數(shù)據(jù)庫查詢是用 SQL 編寫的 selection 和 ranking 查詢，它返回包含相關(guān)行的表。查詢使用 LM 執(zhí)行選擇，根據(jù)電影名字評估哪些電影是經(jīng)典電影，并使用標(biāo)準(zhǔn)類型過濾器查找愛情電影。查詢還根據(jù)收入對結(jié)果進(jìn)行排名，以查找票房最高的電影。如圖所示，結(jié)果表包含電影泰坦尼克號的評論。

答案生成

在這一步中，gen 函數(shù)使用 LM 生成用戶自然語言請求 R 的答案 A。

還是以圖 1 為例，在 TAG pipeline 最后階段，輸出有關(guān)泰坦尼克號的評論摘要作為對原始用戶請求的回答。在示例中，相關(guān)數(shù)據(jù) 被編碼為字符串，供模型處理。編碼表與原始用戶請求一起傳遞給 LM。為了獲得答案，此步驟利用模型對評論列的語義推理能力來總結(jié)評論。

實(shí)驗(yàn)及結(jié)果

表 1 顯示了每種方法的精確匹配準(zhǔn)確率和執(zhí)行時間。如表所示，在選定的 BIRD （一個數(shù)據(jù)集，用于測試 LMs 的文本到 sql 的能力）查詢類型中，研究者發(fā)現(xiàn)手寫 TAG（hand-written TAG）基線始終能達(dá)到 40% 或更高的精確匹配準(zhǔn)確率，而其他基線的準(zhǔn)確率均未超過 20%。

具體而言，Text2SQL 在所有基線上的表現(xiàn)都不佳，執(zhí)行準(zhǔn)確率不超過 20%，但在 Ranking 查詢上的表現(xiàn)尤其糟糕，準(zhǔn)確率只有 10%，因?yàn)樵S多 Ranking 查詢需要對文本進(jìn)行推理。Text2SQL + LM 在各個基線上的表現(xiàn)都同樣糟糕，但在基于匹配和比較的查詢上表現(xiàn)更差，準(zhǔn)確率只有 10%。

對于 RAG，可以看到它在所有查詢類型中都不能正確回答單個查詢，這表明 RAG 不適合這個領(lǐng)域的查詢。

手寫 TAG 總體上正確回答了 55% 的查詢，在比較查詢中表現(xiàn)最佳，精確匹配準(zhǔn)確率為 65%。由于精確排序商品的難度較高，該基線在所有查詢類型（排名查詢除外）中的表現(xiàn)始終良好，準(zhǔn)確率超過 50%�？傮w而言，與標(biāo)準(zhǔn)基線相比，此方法的準(zhǔn)確率提高了 20% 至 65%。

表 2 表明，由于省略了答案生成步驟，vanilla Text2SQL 在需要 LM 推理的查詢上表現(xiàn)較差，精確匹配準(zhǔn)確率為 10%。與此同時，RAG 基線和 Retrieval + LM Rank 基線在所有查詢類型上都表現(xiàn)不好，只能正確回答一個查詢。相比之下，手寫 TAG 基線在需要知識的查詢和需要推理的查詢上都實(shí)現(xiàn)了超過 50% 的準(zhǔn)確率。

值得注意的是，除了提供卓越的準(zhǔn)確率外，手寫 TAG 方法還提供了高效的實(shí)現(xiàn)，與其他基線相比，執(zhí)行時間少用了 1/3。手寫基線對所有查詢的平均耗時為 2.94 秒。

最后，該研究定性分析了每個基線在聚合查詢上的結(jié)果。圖 2 為一個示例展示，查詢的內(nèi)容為「提供有關(guān)雪邦國際賽車場的比賽資料」。

結(jié)果顯示，RAG 基線只能提供有關(guān)部分比賽的信息，因?yàn)榇蠖鄶?shù)相關(guān)比賽都無法被檢索到。另一方面，Text2SQL + LM 基線無法利用 DBMS 中的任何信息，僅依賴于參數(shù)知識并且不提供進(jìn)一步的分析。

相比較來說，手寫基線提供了 1999 年至 2017 年在雪邦國際賽道舉行的所有比賽的詳盡摘要。

參考鏈接：

https://venturebeat.com/data-infrastructure/table-augmented-generation-shows-promise-for-complex-dataset-querying-outperforms-text-to-sql/

表格增強(qiáng)生成TAG登場：解鎖AI自然語言與數(shù)據(jù)庫的完美結(jié)合
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-09-10 14:28:58 瀏覽：1836次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

表格增強(qiáng)生成TAG登場：解鎖AI自然語言與數(shù)據(jù)庫的完美結(jié)合 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-09-10 14:28:58 瀏覽：1836次