展會信息港展會大全

昆侖萬維:天工通用大模型推理能力超過GPT-3.5和LLaMA2
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-19 19:03:36   瀏覽:7845次  

導(dǎo)讀:北京商報(bào)訊(記者 楊月涵)9月16日,昆侖萬維發(fā)布消息稱,在權(quán)威推理榜單Benchmark GSM8K 測試中,昆侖萬維自研的通用基座大模型天工大模型以80%的正確率脫穎而出,大幅領(lǐng)先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),標(biāo)志著天工大模型的推理能力達(dá)到全球領(lǐng)先...

北京商報(bào)訊(記者 楊月涵)9月16日,昆侖萬維發(fā)布消息稱,在權(quán)威推理榜單Benchmark GSM8K 測試中,昆侖萬維自研的通用基座大模型天工大模型以80%的正確率脫穎而出,大幅領(lǐng)先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),“標(biāo)志著天工大模型的推理能力達(dá)到全球領(lǐng)先,接近GPT-4”。

消息提到,天工大模型不僅在推理性能上有著強(qiáng)大的競爭力,在MMLU、C-EVAL、HumanEval等三項(xiàng)數(shù)據(jù)集測試中也同樣表現(xiàn)出色。在MMLU數(shù)據(jù)集測試中,天工大模型以65%準(zhǔn)確率超越了LLaMA-65B的63.4%;在C-EVAL數(shù)據(jù)集測試中,天工大模型以65%準(zhǔn)確率超越了GPT3.5的54.4%。在HumanEval數(shù)據(jù)集測試中,天工大模型以37.2%的準(zhǔn)確率超過了PaLM-540B(26.2%)、LLaMA-65B(23.7%)、LLaMa2 -70B(30.5%)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港