基于大模型評(píng)測(cè)平臺(tái)OpenCompass全集測(cè)試,日日新·商量大語言模型SenseChat V4,綜合整體評(píng)測(cè)成績(jī)水平比肩GPT-4

商湯??新·商量??模型數(shù)據(jù)分析版本(SenseChat-DataAnalysis V4)發(fā)布,在數(shù)據(jù)分析場(chǎng)景下的數(shù)據(jù)測(cè)試集(1000+題目)中以85.71%的正確率超過GPT4,支持復(fù)雜表格、多表格、多文件的理解,實(shí)現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)運(yùn)算、比較分析、趨勢(shì)分析,預(yù)測(cè)性分析、可視化等常見數(shù)據(jù)分析任務(wù),賦能財(cái)務(wù)分析、商業(yè)分析、銷售預(yù)測(cè)、市場(chǎng)分析、宏觀分析等多個(gè)應(yīng)用場(chǎng)景。

商湯推出的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”(SenseChat-Medical V4),在本次更新中實(shí)現(xiàn)了更強(qiáng)的多輪對(duì)話與上下文理解能力、以及更豐富的工具調(diào)用能力,有效實(shí)現(xiàn)專業(yè)醫(yī)學(xué)問答及復(fù)雜醫(yī)學(xué)任務(wù)推理,并支持更多模態(tài)醫(yī)學(xué)文件的智能解讀和交互問答?!按筢t(yī)”在兩項(xiàng)行業(yè)權(quán)威評(píng)測(cè)——2023年職業(yè)藥劑師考試大模型評(píng)測(cè)、中文醫(yī)療大語言模型開放評(píng)測(cè)平臺(tái)MedBench中,均實(shí)現(xiàn)綜合評(píng)分排名第二,性能逼近GPT-4,其中職業(yè)藥劑師考試大模型評(píng)測(cè)中的兩個(gè)細(xì)分方向性能已超越GPT-4。

2023年職業(yè)藥劑師考試大模型評(píng)測(cè)結(jié)果,“大醫(yī)”綜合評(píng)分排名第二,并在兩個(gè)細(xì)分方向上性能超越GPT-4

覆蓋13個(gè)醫(yī)學(xué)場(chǎng)景的大醫(yī)Web端展示頁(yè)面

多模態(tài)是人工智能大模型重要的技術(shù)演進(jìn)方向,日日新·商量多模態(tài)大模型(SenseChat-Vision V4)全新推出,其擁有300億參數(shù),圖文理解能力處于全球領(lǐng)先水平,在權(quán)威評(píng)測(cè)基準(zhǔn)測(cè)試集MME Benchmark上綜合得分排名首位,綜合得分達(dá)2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業(yè)等多個(gè)實(shí)際場(chǎng)景落地應(yīng)用,助力千行百業(yè)的產(chǎn)業(yè)升級(jí)。

多模態(tài)大模型權(quán)威綜合基準(zhǔn)測(cè)試MME Benchmark可以從定位、名人識(shí)別、景點(diǎn)識(shí)別、OCR、數(shù)學(xué)計(jì)算等14個(gè)維度來系統(tǒng)綜合評(píng)測(cè)模型的能力。

日日新·商量多模態(tài)大模型可回答交通場(chǎng)景中圖文內(nèi)容理解等復(fù)雜任務(wù)

商湯自研的日日新·秒畫文生圖大模型(SenseMirageV4)較此前版本,參數(shù)量提升至百億量級(jí),通過Mixture of text experts、Spatial-aware CFG等算法優(yōu)化,語義理解能力與圖像質(zhì)感細(xì)節(jié)表現(xiàn)顯著增強(qiáng),可達(dá)成電影級(jí)海報(bào)生成水平。同時(shí)結(jié)合Adversarial Distillation算法,秒畫SenseMirage-Turbo V4版本也對(duì)外發(fā)布,相較于V4基礎(chǔ)版本,可達(dá)到10倍推理加速效果。

秒畫SenseMirage V4全新升級(jí),電影級(jí)圖片一鍵生成

率先支持不同模態(tài)工具調(diào)用的Function call & Assistants API 版本來了,大模型時(shí)代的專屬開發(fā)助手

大模型的能力前沿且豐富,為助力更多開發(fā)人員及相關(guān)行業(yè)更便捷、高效地用好大模型,商湯推出??新·商量大語言模型Function call & Assistants API 版本

??新·商量大語言模型Function call & Assistants API 版本為開發(fā)人員提供一個(gè)靈活、高度可定制的工具調(diào)用框架,提供了聯(lián)網(wǎng)搜索,代碼解釋,圖文問答,??圖等多種?具調(diào)?,?持商湯??新?模型體系,賦能多?業(yè)場(chǎng)景。

與其他同類產(chǎn)品相比,??新·商量大語言模型Function call & Assistants API 版本率先支持不同模態(tài)的工具調(diào)用,能夠支持圖文結(jié)合的多模態(tài)交互和數(shù)據(jù)分析代碼執(zhí)行結(jié)果的直觀呈現(xiàn),從而解決更加復(fù)雜的問題,讓各種應(yīng)?程序中集成AI功能變得更加簡(jiǎn)單和?效。

通過??新·商量大語言模型Function call & Assistants API,輕松調(diào)用內(nèi)置工具實(shí)現(xiàn)多模態(tài)交互(注:展示效果有加速處理)

創(chuàng)新場(chǎng)景應(yīng)用加速落地,商湯“日日新”大模型體系持續(xù)賦能多產(chǎn)業(yè)升級(jí)

大模型的出現(xiàn)帶來了人機(jī)交互范式的巨大轉(zhuǎn)換,依托商湯“日日新Sensenova”能力的快速迭代,小浣熊家族再添新成員——數(shù)據(jù)分析工具 “辦公小浣熊”,重塑大模型時(shí)代的應(yīng)用產(chǎn)品形態(tài)。

辦公小浣熊是一款無需編程或復(fù)雜操作即可使用的數(shù)據(jù)分析工具。通過自然語言輸入,辦公小浣熊結(jié)合商湯大模型體系的意圖識(shí)別、邏輯理解、代碼生成能力,自動(dòng)將數(shù)據(jù)轉(zhuǎn)化為有意義的分析結(jié)果和可視化圖表。得益于商湯大模型體系的強(qiáng)大中文理解能力,該產(chǎn)品更適應(yīng)中國(guó)的數(shù)據(jù)分析需求。

辦公小浣熊演示頁(yè)面:輸入表格,輕松get 分析報(bào)告。體驗(yàn)入口:https://raccoon.sensetime.com/

產(chǎn)品形態(tài)的出現(xiàn)是大模型技術(shù)落地應(yīng)用的嘗試之一,自2023年4月10日商湯“日日新SenseNova”問世以來,企業(yè)用戶超過3000家,覆蓋行業(yè)包括互聯(lián)網(wǎng)、游戲、文旅、教育、醫(yī)療健康、金融和編程等。

商湯始終推動(dòng)降低大模型使用門檻,拓展人工智能落地場(chǎng)景,讓大模型真正在行業(yè)里用起來,未來將持續(xù)推進(jìn)“日日新SenseNova”大模型體系建設(shè),實(shí)現(xiàn)創(chuàng)新場(chǎng)景應(yīng)用,不斷推動(dòng)大模型前置化,讓更多智能走向更多場(chǎng)景、更多行業(yè),攜手行業(yè)生態(tài)邁向AGI時(shí)代。

分享到

songjy

相關(guān)推薦