近日,DeepSeek憑借其低成本、高性能的大模型研發(fā)成果,迅速引發(fā)了全球科技界的關(guān)注。浪潮云聯(lián)合沐曦股份、銓興科技等生態(tài)伙伴,發(fā)布預置DeepSeek-R1和DeepSeek-V3模型的海若一體機,率先實(shí)現671B DeepSeek大模型國產(chǎn)GPU單機推理服務(wù),為行業(yè)客戶(hù)提供大模型智能應用落地的一體化解決方案。
一站式大模型交付,開(kāi)啟行業(yè)智能新篇
為解決行業(yè)大模型落地面臨的算力多樣適配難、數據不出域、模型微調效率低、推理服務(wù)性能差、模型服務(wù)交付慢等問(wèn)題,海若一體機通過(guò)優(yōu)化算法框架和加速庫、軟硬全棧調優(yōu)等方式,提供模型微調、模型推理、智能體編排、智能體應用等服務(wù),以完備的方案為行業(yè)客戶(hù)提供大模型場(chǎng)景化應用一站式交付。
開(kāi)箱即用:海若一體機提供從算力、平臺、大模型到應用的一體化交付方案,能夠實(shí)現1-3天完成整體交付,開(kāi)箱即用。
推理優(yōu)化:海若一體機量身定制了極致優(yōu)化的推理加速方案,基于軟硬件融合調優(yōu),大模型的推理性能可大幅提升,解碼生成速度提升185.7%,平均首字時(shí)延降低55.9%。
安全增強:具備知識庫細粒度權限管控能力,提供私有化部署方案,防止數據泄露,支持模型輸入輸出安全檢測,保證內容合法合規。
開(kāi)放兼容:支持浪潮海若、DeepSeek、GPT-4、通義千問(wèn)等主流大模型;支持EmBedding、ReRanker、ASR、TTS多類(lèi)型;內置模型池適配沐曦、昇騰等多種芯片,根據場(chǎng)景、性能、預算靈活選擇。
規格多樣:?jiǎn)⒑桨、進(jìn)階版、旗艦版等多種規格,可根據模型參數和應用規模靈活選擇。
全棧產(chǎn)品矩陣,精準匹配算力需求
面向行業(yè)客戶(hù)的多樣場(chǎng)景需求,海若一體機推出三種規格,提供DeepSeek從671B到1.5B多種參數的預置大模型,用戶(hù)可根據業(yè)務(wù)場(chǎng)景靈活選型,實(shí)現精度與效率的最佳平衡。浪潮云聯(lián)合銓興科技研發(fā)高顯存的海若一體機,支持單機部署DeepSeek 671B參數大模型,釋放極致性能。
接入DeepSeek系列模型,賦能智能體開(kāi)發(fā)
目前,海若AgentOS已正式上架DeepSeek-R1和DeepSeek-V3模型。此次接入的模型已全面融合海若推理鏈路,集成海若獨家內容安全模塊,實(shí)現模型安全增強與企業(yè)級高可用保障,同時(shí)支持完善的日志分析和告警,助力用戶(hù)安全穩定地構建智能體應用。AgentOS平臺致力于為用戶(hù)提供全流程、一站式的智能體開(kāi)發(fā)服務(wù),平臺支持接入各類(lèi)大語(yǔ)言模型,支持模型的一鍵部署,并具備模型管理和監控能力,大大降低了用戶(hù)在模型管理上的技術(shù)門(mén)檻和時(shí)間成本。同時(shí),平臺提供知識庫管理、可視化工作流編排和豐富的工具組件,結合模型實(shí)現生產(chǎn)級智能體開(kāi)發(fā),簡(jiǎn)化模型開(kāi)發(fā)流程,將為開(kāi)發(fā)者和行業(yè)用戶(hù)帶來(lái)更快、更高效、更便捷的智能體開(kāi)發(fā)和應用體驗。
當前,智能體已成為新型應用生態(tài)的關(guān)鍵入口。海若一體機作為大模型生產(chǎn)力平臺,將助力客戶(hù)管理模型、智能體、私域知識庫等大模型資產(chǎn),推動(dòng)行業(yè)智能化升級,重塑大模型落地行業(yè)格局,引領(lǐng)智能經(jīng)濟新時(shí)代。