丁香五月婷婷国产AV_91福利国产在线观看国产黑色丝袜_精品少妇爆乳无码aⅴ区_国产伦精品一区二区三区免费

AI推理算力需求即將爆發(fā),深圳云天勵(lì)飛加注推理芯片|界面新聞

AI推理算力需求即將爆發(fā),深圳云天勵(lì)飛加注推理芯片|界面新聞

jushumin 2025-08-19 百度 57 次瀏覽 0個(gè)評(píng)論

界面新聞?dòng)浾?| 梁寶欣

界面新聞編輯 | 林騰

AI推理芯片正成為人工智能行業(yè)新的涌入方向。

7月25日,2025年世界人工智能大會(huì)期間,界面新聞?dòng)浾吡私獾?,深圳云天?lì)飛(688343.SH)宣布全面聚焦AI推理芯片,圍繞邊緣計(jì)算、云端大模型推理、具身智能三大場(chǎng)景,目標(biāo)是國(guó)產(chǎn)算力“加速器”。

云天勵(lì)飛董事長(zhǎng)兼CEO陳寧告訴界面新聞等媒體,2025年成為人工智能發(fā)展的重要轉(zhuǎn)折點(diǎn)——大模型技術(shù)達(dá)到新的成熟高度,模型調(diào)用成本顯著降低。AI從“專家工具”逐步演變?yōu)椤叭窕A(chǔ)設(shè)施”。AI正從訓(xùn)練時(shí)代邁入推理時(shí)代,預(yù)示著推理算力需求將迎來爆發(fā)式增長(zhǎng)。

今年以來,以DeepSeek R1為代表的新一代大模型加速發(fā)展,推動(dòng)AI產(chǎn)業(yè)的深度變革。中信建投證券研報(bào)指出,DeepSeek?R1在長(zhǎng)CoT數(shù)據(jù)微調(diào)基礎(chǔ)上應(yīng)用強(qiáng)化學(xué)習(xí),除性能提升外,DeepSeekR1采用GRPO強(qiáng)化學(xué)習(xí)策略,專門優(yōu)化數(shù)學(xué)推理任務(wù),減少計(jì)算資源消耗,實(shí)現(xiàn)更低的成本。推理成本來看,R1模型價(jià)格只有OpenAI?o1模型的幾十分之一,具有極高的性價(jià)比優(yōu)勢(shì)。

除此之外,中信建投證券研報(bào)還提到,三大增量助力推理算力需求加速,一是各家互聯(lián)網(wǎng)大廠加速AI與原有業(yè)務(wù)結(jié)合,二是Agent和深度思考推理的結(jié)合,三是多模態(tài)加速滲透。

AI推理算力需求即將爆發(fā),深圳云天勵(lì)飛加注推理芯片|界面新聞

陳寧表示,未來AI可能全面重塑我們身邊的各類電子產(chǎn)品——從智能耳機(jī)、智能眼鏡等可穿戴設(shè)備,到掃地機(jī)器人、冰箱等家用電器,再到電動(dòng)汽車,幾乎所有電子設(shè)備的形態(tài)與功能都將被重新定義。這些設(shè)備將具備“主動(dòng)工作”的能力,能像人類一樣開口交流,理解復(fù)雜指令、主動(dòng)回應(yīng)需求甚至解決實(shí)際問題??梢灶A(yù)見,未來各類智能設(shè)備,也能通過更人性化的交互,實(shí)現(xiàn)功能的躍升與體驗(yàn)的革新。而這一切場(chǎng)景的落地,都離不開AI 推理芯片的底層支撐。

推理算力需求的爆發(fā),核心依賴AI推理芯片——這是云天勵(lì)飛選擇聚焦該領(lǐng)域的關(guān)鍵背景。

從AI芯片的分類來看,根據(jù)所承擔(dān)任務(wù)的不同,可分為訓(xùn)練芯片和推理芯片。其中,推理芯片主要負(fù)責(zé)利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè),需綜合考量單位能耗算力、時(shí)延、成本等多方面指標(biāo)。

雖然當(dāng)前AI推理芯片市場(chǎng)仍處于藍(lán)海階段,其市場(chǎng)規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場(chǎng)仍較小,但預(yù)計(jì)未來三至五年內(nèi),AI推理芯片的增長(zhǎng)速度將大幅超越訓(xùn)練芯片。陳寧說。

針對(duì)各類應(yīng)用場(chǎng)景,云天勵(lì)飛已開發(fā)出?DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max?和?DeepEdge200?四款芯片。

據(jù)了解,2023年11月 ,云天勵(lì)飛正式發(fā)布面向邊緣人工智能的DeepEdge10系列推理芯片,其核心定位便是滿足邊緣端對(duì)千億參數(shù)大模型的部署需求支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類不同架構(gòu)的主流模型。

從技術(shù)底層來看DeepEdge10系列芯片采用的是“算力積木”架構(gòu),通過D2D?Chiplet技術(shù)、C2C?Mesh技術(shù)和C2C?Mesh?Torus技術(shù),將多個(gè)標(biāo)準(zhǔn)計(jì)算單元像搭積木一樣,封裝成不同算力的芯片和多芯片互連的可擴(kuò)展計(jì)算系統(tǒng),覆蓋8T-256T算力需求,可實(shí)現(xiàn)7B、14B、130B、671B等不同參數(shù)量大模型的推理,賦能各類智算推理硬件產(chǎn)品。

云天勵(lì)飛CTO李愛軍表示,算力積木架構(gòu)實(shí)現(xiàn)了兩方面核心能力:一方面是算力的縱向拓展(scaleup),即在單個(gè)計(jì)算節(jié)點(diǎn)內(nèi)聚合更多算力——通過該架構(gòu),可在一個(gè)封裝內(nèi)最多集成8個(gè)算力積木,形成統(tǒng)一算力。這一架構(gòu)源于2020年對(duì)GPT等算法的分析,目前已在Edge10芯片上落地,實(shí)現(xiàn)了單個(gè)封裝內(nèi)集成8個(gè)積木、達(dá)成128T推理算力的單芯片成果。

另一方面是通過C2C?Mesh技術(shù)(結(jié)合Mesh互聯(lián)與Mesh?Torus技術(shù))實(shí)現(xiàn)算力擴(kuò)展:將多個(gè)節(jié)點(diǎn)首尾連接形成更大規(guī)模的算力池,從而支撐MoE架構(gòu)大模型的推理。

目前,DeepEdge10芯片平臺(tái)已成功適配DeepSeekR1系列模型、QwQ-32B模型及國(guó)產(chǎn)鴻蒙操作系統(tǒng)。

從經(jīng)營(yíng)數(shù)據(jù)來看,2024年云天勵(lì)飛營(yíng)收增長(zhǎng)了81%;今年一季度,這一增速進(jìn)一步提升至160%。云天勵(lì)飛管理層表示,展望下半年,隨著AI推理算法的迭代、算力需求的攀升以及AI應(yīng)用的持續(xù)拓展,有信心繼續(xù)保持高速增長(zhǎng)的態(tài)勢(shì)。

  • 美聯(lián)儲(chǔ)goolsbee希望經(jīng)濟(jì)延續(xù)高效解答、解釋與落實(shí)?-遠(yuǎn)離虛假的假推廣局
  • 最新的實(shí)況8哪個(gè)隊(duì),實(shí)況足球8最新更新隊(duì)伍解析,揭秘最強(qiáng)隊(duì)伍!
  • 小米回應(yīng)博主質(zhì)疑其訂單取消:數(shù)字解答、解釋與落實(shí)?,看穿不實(shí)的偽裝
  • 首個(gè)ITU-T國(guó)際標(biāo)準(zhǔn)正式立項(xiàng)標(biāo)準(zhǔn)分析、解釋與落實(shí)-抵制欺詐的假推廣像
  • 戳穿:直播電商監(jiān)管新規(guī)將征求意見務(wù)實(shí)釋義、解釋與落實(shí)?,抵制虛假渲染術(shù)
  • 轉(zhuǎn)載請(qǐng)注明來自浙江久大氣動(dòng)液壓有限公司,本文標(biāo)題:《AI推理算力需求即將爆發(fā),深圳云天勵(lì)飛加注推理芯片|界面新聞》

    百度分享代碼,如果開啟HTTPS請(qǐng)參考李洋個(gè)人博客
    每一天,每一秒,你所做的決定都會(huì)改變你的人生!

    發(fā)表評(píng)論

    快捷回復(fù):

    驗(yàn)證碼

    評(píng)論列表 (暫無評(píng)論,57人圍觀)參與討論

    還沒有評(píng)論,來說兩句吧...

    Top