2月6日晚間,華為中國官方微博發(fā)文稱(chēng),華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺,全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶(hù)AI應用快速落地。

華為稱(chēng),ModelEngine作為大模型訓練、推理和應用開(kāi)發(fā)的AI平臺,提供從數據預處理到模型訓練、優(yōu)化及部署的一站式服務(wù)。此次ModelEngine基于昇騰AI芯片,通過(guò)推理框架優(yōu)化和MoE存算協(xié)同,提供動(dòng)態(tài)換入換出和全局統一緩存,實(shí)現推理高并發(fā)和低時(shí)延,用戶(hù)通過(guò)ModelEngine體驗DeepSeek更加快速高效的推理能力。
ModelEngine全面支持DeepSeek系列模型R1&V3 671B以及蒸餾系列模型,開(kāi)發(fā)者可通過(guò)ModelEngine實(shí)現“一鍵部署”,省去硬件選型、兼容性驗證和環(huán)境配置等繁瑣步驟,大幅降低企業(yè)AI應用門(mén)檻。此外,ModelEngine通過(guò)其高度的開(kāi)放性和模塊化設計,極大地縮短了DeepSeek的本地部署時(shí)間。
ModelEngine提供負載均衡、模型安全接入、多用戶(hù)配額管理等高階特性,支持大規模生產(chǎn)環(huán)境下的穩定運行。某證券公司引入DCS AI全棧解決方案后,運維成本降低42%。

圖片來(lái)源:每日經(jīng)濟新聞 劉國梅 攝
值得注意的是,2月4日晚間,華為計算微信公眾號發(fā)文表示,DeepSeek-R1系列模型的開(kāi)源,因其出色的性能和低廉的開(kāi)發(fā)成本,已引發(fā)全球的熱切討論和關(guān)注。潞晨科技攜手昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek-R1系列推理API,及云鏡像服務(wù)。

華為計算稱(chēng),在本次發(fā)布中,潞晨以自研國產(chǎn)推理引擎為技術(shù)底座,成功實(shí)現了昇騰算力與DeepSeek-R1系列模型的推理適配優(yōu)化,性能表現與使用高端GPU持平,為開(kāi)發(fā)者提供高效、靈活、穩定的AI推理服務(wù),助力企業(yè)實(shí)現降本增效,加速智能業(yè)務(wù)基于中國軟硬件體系快速部署落地。
據華為云官方微信公眾號2月1日消息,DeepSeek-R1開(kāi)源后引發(fā)全球用戶(hù)和開(kāi)發(fā)者關(guān)注。經(jīng)過(guò)硅基流動(dòng)和華為云團隊連日攻堅,現在,雙方聯(lián)合首發(fā)并上線(xiàn)基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。

該服務(wù)具備以下特點(diǎn):
1、得益于自研推理加速引擎加持,硅基流動(dòng)和華為云昇騰云服務(wù)支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。
2、提供穩定的、生產(chǎn)級服務(wù)能力,讓模型能夠在⼤規模生產(chǎn)環(huán)境中穩定運行,并滿(mǎn)足業(yè)務(wù)商⽤部署需求。華為云昇騰云服務(wù)可以提供澎湃、彈性、充足的算力。
另?yè)䥽页慊ヂ?lián)網(wǎng)平臺消息,目前DeepSeek-R1、V3、Coder等系列模型已上線(xiàn)該平臺。用戶(hù)無(wú)需下載到本地部署,即可在線(xiàn)完成DeepSeek系列模型的推理、部署及定制化訓練與開(kāi)發(fā)。

據深圳商報,為促進(jìn)超算算力一體化運營(yíng),打造國家算力底座,科技部于2023年啟動(dòng)了國家超算互聯(lián)網(wǎng)部署工作,2024年4月平臺正式上線(xiàn)。截至目前,已有數百家應用、數據、模型等服務(wù)商入駐。
此次上線(xiàn)的模型涵蓋了1.5B到14B的蒸餾模型,以及7B到32B的DeepSeek Chatbot可視化界面,近期還會(huì )陸續上線(xiàn)32B、70B等更多版本。
超算互聯(lián)網(wǎng)官微2月4日晚間發(fā)布文章稱(chēng),DeepSeek-R1因其游刃有余的用戶(hù)需求響應能力,尤其是其獨特的“深度思考(DeepThink)”模式及卓越的推理能力,在這個(gè)春天絕響全球。為了讓更多領(lǐng)域的用戶(hù)切實(shí)便捷地進(jìn)行體驗,超算互聯(lián)網(wǎng)平臺第一時(shí)間上線(xiàn)了DeepSeek Chatbot可視化界面功能。

圖片來(lái)源:視覺(jué)中國
據證券時(shí)報,DeepSeek的熱度居高不下。此前,英偉達、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。
國內幾大云服務(wù)平臺——華為云、騰訊云、阿里云、百度智能云、京東云、字節跳動(dòng)旗下火山引擎等,也相繼宣布接入DeepSeek系列模型,部分平臺推出了超低價(jià)格方案及限時(shí)免費服務(wù)。
國內三大運營(yíng)商旗下的聯(lián)通云、天翼云、移動(dòng)云等平臺也宣布接入DeepSeek模型。
1月24日,著(zhù)名投資公司A16z的創(chuàng )始人馬克·安德森發(fā)文稱(chēng),Deepseek-R1是他見(jiàn)過(guò)的最令人驚嘆、最令人印象深刻的突破之一,而且還是開(kāi)源的,它是給世界的一份禮物。最具煽動(dòng)性的評價(jià)來(lái)自ScaleAI創(chuàng )始人亞歷山大·王。他說(shuō):過(guò)去十年來(lái),美國可能一直在A(yíng)I競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會(huì )“改變一切”。
DeepSeek日前發(fā)布其最新開(kāi)源模型DeepSeek-R1,用較低的成本達到了接近于OpenAI開(kāi)發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長(cháng)期以來(lái)“堆算力”的路徑依賴(lài),其影響還波及了資本市場(chǎng)。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過(guò)顯著(zhù)提高數據質(zhì)量和改進(jìn)模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說(shuō),DeepSeek的模型現在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個(gè)數量級。
國泰君安指出,DeepSeek-R1以MIT License完全開(kāi)源模型權重,并允許商用模型蒸餾,為開(kāi)發(fā)者提供了二次創(chuàng )新的自由空間。這一策略推動(dòng)中國首次在通用大模型開(kāi)源領(lǐng)域占據技術(shù)制高點(diǎn),增強全球AI 話(huà)語(yǔ)權。同時(shí),開(kāi)源生態(tài)可能加速行業(yè)技術(shù)路線(xiàn)趨同,通用大模型因同質(zhì)化加劇競爭,只有擁有真正領(lǐng)先技術(shù)的企業(yè)才能在這種趨勢中留存。因此,此次國產(chǎn)開(kāi)源模型的突破有望重塑全球AIGC技術(shù)路線(xiàn)及產(chǎn)業(yè)格局。