與此同時,訊飛星火4.0 Turbo的底座能力也迎來了全面升級,其圖文處理、數(shù)學運算以及長文本理解能力均得到了顯著提升。
此外,科大訊飛還首次推出了混域知識搜索技術,旨在更有效地解決行業(yè)與企業(yè)的痛點問題。作為國內智能翻譯領域的領航者,科大訊飛還推出了星火語音同傳大模型,這是業(yè)界首個具備端到端語音到語音同聲傳譯能力的大模型,其語音同傳的時延最短可達5秒以內。
文字編輯| 宋雨涵
1
底座能力全新升級,變得更懂行業(yè)
七大能力全面提升
在此次發(fā)布會上,訊飛星火4.0 Turbo的底座能力迎來了全面革新,七大核心功能均實現(xiàn)了顯著提升,并與OpenAI最新推出的GPT-4進行了全面對標。升級的核心亮點在于針對行業(yè)與企業(yè)面臨的實際難題,特別是在數(shù)學運算、行業(yè)知識掌握、圖文識別處理、長文本理解等方面進行了深度優(yōu)化。
得益于訊飛星火X1提供的高質量合成數(shù)據(jù),訊飛星火4.0 Turbo的數(shù)學運算能力顯著增強,能夠在數(shù)學教育、金融分析及科研推演等多個領域為用戶提供更精準的輔助。圖文識別能力作為企業(yè)高效處理行業(yè)及私域數(shù)據(jù)的基礎,在此次升級中也得到了大幅提升。針對醫(yī)療體檢報告、法律文書、學術論文、企業(yè)合同等復雜文檔,以及含有復雜表格、雜亂排版、手寫公式、手寫合同等特殊情況的文檔,訊飛星火4.0 Turbo的圖文識別能力實現(xiàn)了通用文檔版面分析和文字識別準確率的40%提升,復雜表格結構和潦草手寫文字識別準確率更是提升了60%,極大地提高了高價值數(shù)據(jù)的獲取效率。對比測試結果顯示,訊飛星火4.0 Turbo的圖文識別性能遠超國內外同類產品。
此外,升級后的訊飛星火4.0 Turbo還增強了文檔要素檢測能力,知識切分和構建的粒度更加精細,有效防止了大模型幻覺的發(fā)生。同時,推出的掃描文檔解析極速版,使文檔理解速度提升了10倍以上,處理一份500頁的項目文件,從掃描、識別到解析的全過程僅需2分鐘。
長文本處理能力一直是用戶關注的焦點,特別是在企業(yè)知識問答等嚴謹應用場景中。為此,訊飛星火推出了基于智能體的全新長文本處理框架,并首次在行業(yè)內實現(xiàn)了句子級溯源功能。該框架優(yōu)化了超長注意力機制,利用大規(guī)模網(wǎng)頁和書籍數(shù)據(jù)進行知識關聯(lián)合成,使知識回復的錯誤率降低了40%,句子級溯源效果甚至超越了GPT-4,有效解決了大模型幻覺導致的反復溯源確認問題。
考慮到用戶在撰寫報告、進行調研等工作中需要大量搜集信息和整理資料,訊飛星火結合圖文、長文本處理能力的提升以及行業(yè)應用經驗,率先推出了混域知識搜索技術。該技術能夠整合個人知識、企業(yè)知識、業(yè)務系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)及互聯(lián)網(wǎng)信息,實現(xiàn)綜合搜索,用戶只需一次提問即可獲得全面搜索結果,極大提升了信息搜索效率。
2
唯一全國產算力訓練
全國產算力,勇闖無人區(qū)
訊飛星火推出的深度推理模型X1,作為昇騰算力體系的首款原生深度推理模型,其誕生歷程充滿了挑戰(zhàn)與創(chuàng)新。技術團隊在利用國產算力進行模型訓練時,面臨了數(shù)據(jù)構建、框架優(yōu)化、模型驗證等一系列復雜難題,這些難題使得團隊不得不投入額外的時間與精力。在這一過程中,團隊缺乏成功案例的指引,只能依靠自身的努力,逐步攻克每一個難關,最終成功實現(xiàn)了技術突破。
經過不懈努力,訊飛星火的算法不僅成功適配了國產算力,而且在算力消耗更少的情況下,達到了業(yè)界領先水平,推出了能夠與國際頂尖模型相媲美的X1模型。這一成就不僅彰顯了團隊的技術實力,也為中國在深度推理模型領域的發(fā)展貢獻了重要力量。
回顧星火大模型的發(fā)展歷程,團隊始終堅定地走全國產化路線。在與華為的合作中,雙方秉持著“勇闖無人區(qū)”的精神,不斷突破全國產算力和大模型的技術上限,致力于為世界提供另一種可靠的選擇。這一過程中,訊飛星火與華為攜手共進,共同推動了中國在人工智能領域的發(fā)展與進步。
3
華為昇騰:國產算力王者
昇騰(Ascend)則是華為在AI芯片領域的杰作。作為華為AI計算產業(yè)的重要組成部分,昇騰系列AI芯片旨在提供高效、安全、智能的算力服務,以滿足不同行業(yè)對AI算力的需求。
昇騰系列AI芯片采用了先進的芯片設計和優(yōu)化技術,使得其計算性能和能效比均處于行業(yè)領先地位。同時,昇騰還支持分布式計算和并行處理,能夠高效地處理大規(guī)模的人工智能任務。在安全性方面,昇騰系列AI芯片采用了嚴格的安全設計,確保用戶數(shù)據(jù)和業(yè)務系統(tǒng)的安全。
昇騰的應用場景同樣廣泛。在智能制造領域,昇騰可以幫助企業(yè)實現(xiàn)自動化生產、工藝優(yōu)化、質量檢測等智能化應用。在智慧城市領域,昇騰可以助力政府實現(xiàn)智能化管理和服務,提升城市治理效率。在醫(yī)療健康領域,昇騰可以輔助醫(yī)生進行精準的診斷和治療,提高醫(yī)療服務水平。此外,昇騰還在教育、科研、交通等多個領域發(fā)揮著重要作用。
華為昇騰軟件生態(tài)
華為昇騰不僅提供硬件產品,還圍繞這些硬件構建了完整的軟件生態(tài)。
異構計算架構CANN:類似于英偉達CUDA的架構,負責調度分配計算到對應的硬件上,提高硬件性能的利用率。2024年華為全聯(lián)接大會上,全新發(fā)布的CANN 8.0版本新增了200多個深度優(yōu)化的基礎算子、80多個融合算子以及100多個通信、矩陣運算等API,極大地加速了原生創(chuàng)新進程。
AI計算框架昇思MindSpore):華為自主研發(fā)的深度學習框架,支持云、邊、端靈活部署,全場景覆蓋,已成為國產框架市占率第一。
全流程開發(fā)工具鏈MindStudio:為開發(fā)者提供簡單易用的開發(fā)工具,支持從算子開發(fā)、模型訓練、模型推理到應用開發(fā)的全流程,降低開發(fā)門檻。
相關閱讀推薦:
華為又一大動作!昇思人工智能框架峰會:開源4年份額達30%,成為發(fā)展最快AI框架
結語
科大訊飛推出的訊飛星火X1深度推理大模型,以其全國產算力平臺上的獨特地位,以及在教育、醫(yī)療等關鍵領域的成功應用,展現(xiàn)了其在AI領域的深厚實力。同時,訊飛星火4.0 Turbo底座能力的全面升級,以及混域知識搜索技術的推出,進一步提升了其在行業(yè)應用中的競爭力。
而華為昇騰作為國產算力王者,其高效的計算性能和廣泛的應用場景,為AI產業(yè)的快速發(fā)展提供了有力支撐。展望未來,訊飛與華為將繼續(xù)攜手共進,共同推動中國人工智能領域的發(fā)展,為世界提供更多可靠的選擇。