通義千問(wèn)7B預(yù)訓(xùn)練模型在多個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中表現(xiàn)出色,中英文能力遠(yuǎn)超國(guó)內(nèi)外同等規(guī)模開(kāi)源模型,部分能力甚至“躍級(jí)”趕超12B、13B尺寸開(kāi)源模型。

在英文能力測(cè)評(píng)基準(zhǔn)MMLU上,通義千問(wèn)7B模型得分超過(guò)一眾7B、12B、13B主流開(kāi)源模型。該基準(zhǔn)包含57個(gè)學(xué)科的英文題目,考驗(yàn)人文、社科、理工等領(lǐng)域的綜合知識(shí)和問(wèn)題解決能力。

在中文常識(shí)能力測(cè)評(píng)基準(zhǔn)C-Eval上,通義千問(wèn)在驗(yàn)證集和測(cè)試集中都是得分最高的7B開(kāi)源模型,展現(xiàn)了扎實(shí)的中文能力。相比英文世界熱鬧的AI開(kāi)源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問(wèn)的加入有望為開(kāi)源社區(qū)提供更多選擇,推動(dòng)中國(guó)AI開(kāi)源生態(tài)建設(shè)。

在數(shù)學(xué)解題能力評(píng)測(cè)GSM8K、代碼能力評(píng)測(cè)HumanEval等基準(zhǔn)上,通義千問(wèn)7B模型也有不俗表現(xiàn),勝過(guò)所有同等尺寸開(kāi)源模型和和部分大尺寸開(kāi)源模型。

阿里云表示,開(kāi)源大模型可以幫助用戶(hù)簡(jiǎn)化模型訓(xùn)練和部署的過(guò)程,用戶(hù)不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。

開(kāi)源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要。今年7月,阿里云宣布將促進(jìn)中國(guó)大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開(kāi)發(fā)工具等全方位服務(wù)。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務(wù)AI開(kāi)發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機(jī)構(gòu)貢獻(xiàn)的1000多款開(kāi)源模型,已經(jīng)成為中國(guó)大模型開(kāi)源第一門(mén)戶(hù)。

附:開(kāi)源地址

魔搭ModelScope:

https://modelscope.cn/models/qwen/Qwen-7B/summary;https://modelscope.cn/models/qwen/Qwen-7B/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B

分享到

xiesc

相關(guān)推薦