展會信息港展會大全

【2023云棲】郭瑞杰:阿里云搜索產(chǎn)品智能化升級
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-16 14:49:47   瀏覽:7696次  

導(dǎo)讀:本文根據(jù) 2023 云棲大會演講實錄整理而成,演講信息如下: 演講人:郭瑞杰 | 阿里云資深技術(shù)專家、搜索負(fù)責(zé)人 演講主題:阿里云搜索產(chǎn)品智能化升級發(fā)布 近日在2023云棲大會上,阿里云搜索負(fù)責(zé)人郭瑞杰對阿里云搜索產(chǎn)品智能化升級發(fā)布,在全場景的搜索細(xì)分領(lǐng)...

本文根據(jù) 2023 云棲大會演講實錄整理而成,演講信息如下:

演講人:郭瑞杰 | 阿里云資深技術(shù)專家、搜索負(fù)責(zé)人

演講主題:阿里云搜索產(chǎn)品智能化升級發(fā)布

近日在2023云棲大會上,阿里云搜索負(fù)責(zé)人郭瑞杰對阿里云搜索產(chǎn)品智能化升級發(fā)布,在全場景的搜索細(xì)分領(lǐng)域,提供智能化產(chǎn)品能力,包括基于大模型的開放搜索(OpenSearch)LLM智能問答版和向量檢索版,以及面向日志和文本分析場景的Elasticsearch Serverless版等。

基于企業(yè)專屬大模型的對話式搜索

開放搜索(OpenSearch)LLM智能問答版是一站式SaaS化對話式搜索解決方案,內(nèi)置通義千問以及第三方開源大語言模型,用戶可基于業(yè)務(wù)數(shù)據(jù)搭建企業(yè)專屬模型。產(chǎn)品內(nèi)部集成了段落切分、向量化模型、向量引擎、檢索增強(qiáng)大模型等對話式搜索的全鏈路能力,并可以做到分鐘級PoC,小時級正式上線。與開源大模型相比,有更高的準(zhǔn)確率基線,答案準(zhǔn)確率提升大概20%,幻覺減少40%。開放搜索做了大量的推理優(yōu)化,token生成速度提升2-3倍,GPU資源使用量減少50%。

識林是一個專注在制藥合規(guī)領(lǐng)域進(jìn)行知識收集整理的平臺,為藥企提供從藥物研發(fā)、生產(chǎn)到變更等全生命周期的法律法規(guī)檢索、咨詢服務(wù)。在今年上半年,識林基于OpenSearch構(gòu)建了大語言模型的智能問答體系,現(xiàn)在已經(jīng)無需用戶通過關(guān)鍵詞反復(fù)的檢索,通過瀏覽法律法規(guī)原文獲取答案,而是以自然語言的方式向提問,識林平臺理解問題意圖,通過大模型快速的到最終答案,并清晰的展示參考依據(jù)。

同時,阿里云推出了基于開放搜索問答版構(gòu)建的智能學(xué)術(shù)論文助手SmartArxiv,支持學(xué)術(shù)調(diào)研、速讀論文、方法對比、文獻(xiàn)綜述等功能,幫助解決學(xué)術(shù)界“信息過載”的問題。目前已在ModelScope官網(wǎng)創(chuàng)空間上線,用戶可免費(fèi)使用。

https://modelscope.cn/studios/smart_arxiv_opensearch/SmartArXiv

相比開源引擎,向量檢索性能提升3倍

開放搜索向量檢索版在本次的全新升級中,從原來的PaaS形態(tài)演化成了Serverless形態(tài),易用性顯著改善。核心引擎升級到新引擎VectorStore,性能大幅提升,支持千億數(shù)據(jù)毫秒級響應(yīng),實時數(shù)據(jù)秒級更新,與業(yè)界主流開源向量引擎相比檢索性能提升3倍以上,內(nèi)存占用降低到50%。并支持標(biāo)簽+向量混合檢索等能力,提供從圖像向量化到向量存儲查詢的端到端圖搜場景解決方案。

VectorStore差異化特點是高性能,做了大量的向量檢索算法的性能優(yōu)化,千億級別向量數(shù)據(jù)毫秒級查詢響應(yīng),向量更新秒級可見。做了大量數(shù)據(jù)壓縮優(yōu)化,支持非全內(nèi)存加載,更低的成本。作為阿里自研的向量引擎,在淘寶個性化搜索、推薦、多模態(tài)搜索,以及近期的各種大模型應(yīng)用中廣泛應(yīng)用。VectorStore的執(zhí)行框架基于Havenask引擎,后面也將在Havenask中完整開源。

成本降低70%的Elasticsearch Serverless版

阿里云檢索分析服務(wù) Elasticsearch 正式推出兼容開源、按需使用的Serverless產(chǎn)品,用戶不再需要手動分配資源,平臺會根據(jù)業(yè)務(wù)流量波動,自動調(diào)度決定資源的增加或縮減,秒級彈性擴(kuò)縮,真正實現(xiàn)負(fù)載與資源動態(tài)匹配的按量付費(fèi),減少閑置資源冗余成本支出;贗ndexing Service索引構(gòu)建服務(wù)以及OpenStore存儲服務(wù),阿里云從硬件選型、集群架構(gòu)、內(nèi)核性能進(jìn)行了全方位優(yōu)化,實現(xiàn)寫入性能提升150%,單位數(shù)據(jù)存儲成本降低70%。同時,阿里云Easticsearch已集成最新的8.9版本,并基于ESRE組件(Elasticsearch Relevance Engine)提供AI增強(qiáng)能力,包括RRF混合排序算法,第三方模型集成、部署和管理等。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港