
Aladdin大模型開發(fā)利器:解鎖千億參數(shù)模型的“效率密鑰”——九章云極總監(jiān)智能算力前沿技術論壇演講預告
導讀 當千億參數(shù)模型從實驗室走向產業(yè)主戰(zhàn)場,一場關乎效率與成本的“開發(fā)馬拉松”正在上演。在2025年這個AI大模型爆發(fā)元年,千億參數(shù)模型已從實驗室走向產業(yè)落地。然而,開發(fā)者正面臨訓練周期長、算力成本高、調試復雜的“三重困境” 在這樣的背景下...
導讀 當千億參數(shù)模型從實驗室走向產業(yè)主戰(zhàn)場,一場關乎效率與成本的“開發(fā)馬拉松”正在上演。在2025年這個AI大模型爆發(fā)元年,千億參數(shù)模型已從實驗室走向產業(yè)落地。然而,開發(fā)者正面臨訓練周期長、算力成本高、調試復雜的“三重困境” 在這樣的背景下...
導讀 深夜突襲!DeepSeek-V3攜6850億參數(shù)“偷襲”代碼界,Claude 3.7瑟瑟發(fā)抖?——AI基建再掀技術革命。 2025年3月25日,當全球AI巨頭還在為發(fā)布會排期時,中國團隊DeepSeek已悄然在Hugging Face...
作為一名制造企業(yè)軟件內部的軟件開發(fā)者,如何才能更好的助力公司的數(shù)字化轉型?王嘉琪和他的團隊走出了一條或許可以“復制”的道路。 王嘉琪是博世汽車電子事業(yè)部的數(shù)字化產品開發(fā)經(jīng)理,他領導的團隊善用 Mendix 低代碼對工廠數(shù)字化項目進行規(guī)劃與開...
2025年3月24日,傳神語聯(lián)A紀元系列線上發(fā)布活動的第一天,傳神語聯(lián)重磅發(fā)布任度雙腦深度思考大模型-T1(以下簡稱任度大模型-T1),為大模型領域貢獻了又一創(chuàng)新性成果。 那么,你或許會好奇,在大模型層出不窮的今天,傳神語聯(lián)為什么還執(zhí)著于推...
近日,浪潮信息宣布推出元腦CPU推理服務器,可高效運行DeepSeek和千問QwQ等新一代大推理模型。元腦CPU推理服務器NF8260G7和NF8480G7設計采用4顆高性能通用CPU和多通道內存系統(tǒng),通過先進的張量并行策略和AMX加速技術...
在近日舉行的主題為“有云處皆智能”的2025浪潮云戰(zhàn)略發(fā)布會上,浪潮云率先發(fā)布分布式智能云戰(zhàn)略,計劃半年內完成現(xiàn)有分布式云節(jié)點的升級,今年內落地分布式智能云節(jié)點超過1000個,成為“智慧系統(tǒng)的全場景運營商”,實現(xiàn)“有云處皆智能”的戰(zhàn)略愿景。...
導讀 在人工智能狂飆突進的今天,神經(jīng)網(wǎng)絡模型的規(guī)模已突破千億參數(shù)門檻,訓練過程中所需的內存消耗呈指數(shù)級增長。以GPT-4為代表的多模態(tài)大模型,其訓練內存需求甚至超過1000GB。然而,GPU顯存容量受制于物理芯片規(guī)格,傳統(tǒng)訓練方法面臨“內存...
導讀 當Mamba遇上Transformer,計算效率與推理速度的革命性躍遷 3月21日,中國科技巨頭騰訊與全球芯片霸主英偉達幾乎同步發(fā)布基于Mamba-Transformer混合架構的新一代大模型,分別推出混元T1與Nemotron-H系...
近年來,AI Agent領域迎來了重大突破,Monica.im中國團隊研發(fā)的通用型AI Agent產品“Manus”正式全球發(fā)布。這款產品在GAIA基準測試中表現(xiàn)卓越,性能超越OpenAI同層次大模型“Deep Research”。它不僅僅...
我是想都不敢想,英特爾前CEO,Pat Gelsinger,剛剛退休,就成為英偉達GTC 2025現(xiàn)場嘉賓,在Acquired 播客活動中發(fā)表演講,美夢成真,英偉達夢里都會笑醒了吧! 英特爾前CEOPat Gelsinger(右一) 當然作...