久久久久国产免费-亚洲成av人影院无码不卡-免费在线观看黄色-中文字幕av高清片-亚洲最大的成人网-校园春色亚洲激情-日韩在线观看一区二区-亚洲专区中文字幕-97伦伦午夜电影理伦片-亚洲精品国产v片在线观看-欧美自拍偷拍一区-hodv一21134铃原爱蜜莉在线-日韩国产精品一区二区-中国精品妇女性猛交bbw-欧美一卡2卡3卡4卡新区在线

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

DeepSeek下一代技術(shù)曝光:“原生稀疏注意力”!

2025-07-31 來源:電子工程專輯 原創(chuàng)文章
892

關(guān)鍵詞: DeepSeek 原生稀疏注意力 算法硬件協(xié)同 長文本處理 ACL2025

在今年1月突然爆火之后幾個(gè)月來,DeepSeek下一代技術(shù)一直值得期待。

近日,DeepSeek的下一代技術(shù)“原生稀疏注意力”(NSA)在ACL 2025大會上提前曝光,同時(shí)由DeepSeek創(chuàng)始人梁文鋒作為通訊作者與北京大學(xué)等機(jī)構(gòu)聯(lián)合發(fā)表的論文榮獲最佳論文獎(jiǎng)。這一成果標(biāo)志著DeepSeek在長文本處理和計(jì)算效率方面取得了重大突破。

據(jù)悉,ACL 2025的投稿量高達(dá)8360篇,是歷史上最卷的一屆,競爭異常激烈。盡管如此,DeepSeek與北京大學(xué)合作的論文憑借其創(chuàng)新性和實(shí)用性,成功脫穎而出,獲得了最佳論文獎(jiǎng)。該論文不僅在技術(shù)上具有突破性,還在學(xué)術(shù)界和工業(yè)界引發(fā)了廣泛關(guān)注。

核心技術(shù)貢獻(xiàn):動態(tài)分層稀疏策略

傳統(tǒng)稀疏注意力方法通常通過固定的稀疏模式(如滑動窗口、全局-局部組合)來降低計(jì)算復(fù)雜度,但這往往以犧牲模型性能為代價(jià)。NSA的革命性在于它采用了一種動態(tài)、分層的稀疏策略,通過三條精心設(shè)計(jì)的并行注意力分支協(xié)同工作,實(shí)現(xiàn)了效率與能力的完美平衡 :

1.壓縮注意力(Compression Attention) :此分支負(fù)責(zé)捕捉全局的、粗粒度的信息模式。它類似于人類快速瀏覽文章以抓住核心大意,通過對輸入序列進(jìn)行壓縮,高效地構(gòu)建全局上下文表征。

2.選擇性注意力(Selective Attention) :此分支聚焦于序列中最關(guān)鍵的詞塊(token),執(zhí)行更精細(xì)的計(jì)算。這好比人類在閱讀時(shí)對重點(diǎn)段落進(jìn)行精讀,確保模型不會錯(cuò)過最重要的語義信息。

3.滑動注意力(Sliding Attention) :此分支專注于處理局部的、相鄰的上下文信息,確保模型對文本細(xì)節(jié)的理解不丟失。這相當(dāng)于人類逐字逐句地閱讀,保證了局部語境的連貫性。

這種動態(tài)分層設(shè)計(jì)并非簡單地丟棄信息,而是通過智能算法,將計(jì)算資源動態(tài)地分配到最需要的地方,從而在大幅降低計(jì)算密度的同時(shí),最大程度地保留了模型的表達(dá)能力 。

關(guān)鍵創(chuàng)新點(diǎn):算法與硬件的協(xié)同革命

NSA的另一大突破在于它不僅僅是算法層面的創(chuàng)新,更是算法與現(xiàn)代GPU硬件深度協(xié)同優(yōu)化的典范。該機(jī)制實(shí)現(xiàn)了端到端的“原生可訓(xùn)練”模式,意味著它在訓(xùn)練階段就能高效運(yùn)行,而非像某些早期稀疏方法那樣需要復(fù)雜的工程改造或只能在推理階段使用 。通過對計(jì)算圖、內(nèi)存訪問模式進(jìn)行深度優(yōu)化,NSA能夠充分利用GPU的并行計(jì)算能力,實(shí)現(xiàn)了驚人的性能提升。

與傳統(tǒng)全注意力模型相比,NSA在多個(gè)維度上表現(xiàn)出顯著優(yōu)勢:

  • 速度提升:在處理64k長度序列時(shí),NSA在解碼階段速度提升11.6倍,前向傳播提升9倍,反向傳播提升6倍。

  • 性能超越:在9個(gè)評測指標(biāo)中,采用NSA預(yù)訓(xùn)練的27B參數(shù)模型有7個(gè)超越了全注意力基線。

  • 長文本處理能力:在LongBench基準(zhǔn)測試中,NSA取得了0.469的平均分,不僅超越了全注意力基線(+0.032),還大幅領(lǐng)先其他稀疏注意力方法。

  • 數(shù)學(xué)推理能力:在AIME 24測試中,NSA-R在8k上下文設(shè)置下的準(zhǔn)確率達(dá)到0.121,而全注意力模型僅為0.046;在16k上下文下,NSA-R仍保持0.146的準(zhǔn)確率,遠(yuǎn)超全注意力的0.092。

ACL2025評選出4篇最佳論文

ACL 2025 是國際計(jì)算語言學(xué)協(xié)會(ACL)于 2025 年 7 月 27 日至 8 月 1 日在奧地利維也納舉行的第 63 屆年度會議。該會議是自然語言處理(NLP)領(lǐng)域的頂級學(xué)術(shù)會議之一,其主題為“NLP 模型的泛化”,旨在探討如何增強(qiáng)模型在多任務(wù)、多語言、多領(lǐng)域和多數(shù)據(jù)分布下的魯棒性和可靠性。ACL2025最終評選出了4篇最佳論文。

  1. 《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》
    該論文由北京大學(xué)、DeepSeek和華盛頓大學(xué)合作完成,作者包括Jingyang Yuan、Huazuo Gao等。論文提出的稀疏注意力(NSA)模型在長文本處理方面表現(xiàn)出色,將處理速度提高了最多11倍,性能超過了全注意力模型。該模型專為硬件優(yōu)化設(shè)計(jì),推動了高效大型語言模型的發(fā)展。

  2. 《A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive》
    該論文由Sarath Sivaprasad、Pramod Kaushik、Sahar Abdelnabi和Mario Fritz共同撰寫,來自CISPA亥姆霍茲信息安全中心、TCS研究院和微軟。論文探討了大語言模型(LLM)在生成內(nèi)容時(shí)的行為模式,指出其不僅反映數(shù)據(jù)中的常見情況,還會系統(tǒng)性地偏向“理想化”狀態(tài)。這一現(xiàn)象可能帶來決策偏見和倫理問題。

  3. 《Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs》
    該論文由Angelina Wang、Michelle Phan、Daniel E. Ho和Sanmi Koyejo共同撰寫,來自斯坦福大學(xué)。論文挑戰(zhàn)了當(dāng)前AI公平性研究的主流觀點(diǎn),提出“差異意識”(DiffAware)和“情境意識”(CtxtAware)的概念,強(qiáng)調(diào)在適當(dāng)情況下識別和區(qū)別對待不同群體的重要性。

  4. 《Language Models Resist Alignment: Evidence From Data Compression》
    該論文由北京大學(xué)人工智能研究院的研究人員撰寫,包括Jiaming Ji、Kaile Wang等。論文揭示了大語言模型在對齊訓(xùn)練過程中存在“彈性”現(xiàn)象,即模型傾向于維持其原始行為和知識分布,抗拒對齊訓(xùn)練帶來的改變。這一發(fā)現(xiàn)對實(shí)現(xiàn)真正穩(wěn)固、深入的對齊具有重要意義。

ACL2025的4篇最佳論文分別涉及稀疏注意力技術(shù)、LLM的行為模式、AI公平性、以及模型對齊的彈性,展示了自然語言處理領(lǐng)域的最新研究成果和創(chuàng)新方向。




主站蜘蛛池模板: 草莓视频免费观看| 裸体性生活视频| yy11111111| www.成人免费视频| 国产伦精品一区二区三区在线 | 黑人一级片| 91新网站| 男性吹潮教程chinese| 视频污| 欧美国产小视频| 日本在线无| 午夜视频欧美| 欧美放荡性医生videos| 日韩av综合网站| 日韩的一区二区| 在线观看色网站| 国产女优在线| 波多野结衣最新番号| 巨粗高h双龙筋肉体育生| 亚洲美女久久久| 久久在线| 日本japanese丰满白浆| 掀开裙子手指伸进去搅动| 亚洲色图欧美激情| 亚洲激情视频一区| 日韩香蕉网| 极品久久| 四级片网站| 亚洲美女自拍偷拍| 纲手被艹| 这里只有精品在线视频观看| 国产毛片高清| 午夜精品一区二区三区视频| 名校风暴在线观看免费高清完整| 国产天堂一区| 在线观看911视频| 国产香蕉在线| 好妈妈在线| 久操社区| 成人动漫网站| 亚洲在线色| 黄色片在线免费看| 成人伊人| 操极品少妇| 欧美日韩在线观看一区二区| 亚洲图片欧美色图| 在线免费视频一区二区| 欧美伦理一区二区三区| 亚洲一区二区在线视频| 中国女人毛茸茸| 伦理黄色片| 一级特黄aa大片免费播放| 性无码专区无码| 91日批| sm网站在线观看| 日本gay壮熊无套xx| 男人手机天堂| 日本不卡一区二区| 免费看又黄又无码的网站| 天天成人| xxx综合网| 国内精品少妇| 亚洲第一色网站| 树大招风汉语普通话版| 色婷婷中文| 羞羞的视频网站| www.玖玖玖| 久久e热| 日本护士毛茸茸| 天堂av手机在线| 日韩avav| freeexxx性护士hd另类| 五月婷影院| 黄色影音| 大尺度吻床戏调情视频| 国产freexxxx性播放麻豆| 福利姬视频在线观看| 成人一区二| 毛片黄片免费看| 午夜诱惑影院| 神马一区二区三区| 操比网站| 久久久久久五月天| av成人在线免费观看| 日韩高清不卡一区二区三区 | 污视频免费在线看| 少妇饥渴难耐| 一级黄毛片| 成人免费网站在线| 黄色亚洲视频| 国产亚洲欧美在线精品| 99精品视频在线观看免费| 日韩性生活| 中国一级免费毛片| 黄色一级片免费| 欧美性bbb| 久久久精品视频免费观看| 床上激情网站| 九九热久久免费视频|