快訊

MLB/道奇MVP 3星剩孤星還是贏小熊 大谷翔平雙安挺山本由伸奪勝

下戰帖?馬斯克才推AI聊天機器人 DeepSeek發布新研究成果

中國大陸深度求索(DeepSeek)宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱NSA)。圖/路透社
中國大陸深度求索(DeepSeek)宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱NSA)。圖/路透社

人工智慧(AI)大戰愈演愈烈,科技富豪馬斯克今天發布最新版AI聊天機器人Grok 3後,中國深度求索(DeepSeek)也宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱NSA)。

據中國媒體第一財經今天報導,DeepSeek官方18日在海外社交平台X上發布了一篇純技術論文報告,主要內容是關於「原生稀疏注意力」。據官方介紹,這是一種用於超快速長文本訓練與推理、硬體對齊且可原生訓練的稀疏注意力機制。

報告宣稱,NSA針對現代硬體進行了優化設計,能加速推理過程,同時降低預訓練成本,且不犧牲性能。NSA在通用基準測試、長文本任務和基於指令的推理,均能達到或超越全注意力模型的表現。NSA為提高效率同時保持模型能力提供了一個有前景的方向。

在這篇名題為「原生稀疏注意力:硬體對齊且可原生訓練的稀疏注意力機制」(Native Sparse Attention:Hardware-Aligned and Natively Trainable Sparse Attention)的論文署名中,DeepSeek創始人梁文鋒也是共同作者。

另一方面,馬斯克(Elon Musk)旗下人工智慧新創公司xAI於台灣時間18日發布最新版AI聊天機器人Grok 3。馬斯克表示,Grok 3的運算能力是前一代的10倍,並稱它「聰明得嚇人」,又指「Grok目標是要理解宇宙」。

法新社報導形容,馬斯克希望Grok 3將在ChatGPT及中國的DeepSeek等對手競爭激烈的AI市場中占有一席之地。

DeepSeek 梁文鋒 馬斯克

延伸閱讀

英媒:OpenAI擬向董事授予特殊投票權 防範惡意收購

美國紀念總統日 多地反川普示威高喊「拒絕國王」

美民間團體買「開除馬斯克」廣告 華郵簽約後卻拒絕刊登

馬斯克要求獲取美國公民的納稅數據

相關新聞

美擬對中國船隻收取高額停泊費 中國船東協會:違反國際規則及美法律

路透社報導,據路透社週四看到的一份聲明稱,中國船東協會反對美國提出的對擁有或訂購中國船隻的遠洋貨運公司徵收高額港口進入費...

大陸2月製造業PMI創3個月新高 學者:受政策預期、關稅戰急單影響

大陸國家統計局1日發布數據顯示,2月製造業採購經理指數(PMI)為50.2%,比上月上升1.1個百分點,並創3個月新高。...

赴習近平座談會沒在怕?他坐姿鬆弛如官老爺 驚人背景曝光

中國國家主席習近平16日會晤民營企業,參與會議的企業家陣容受矚。座位安排上,王傳福和雷軍中間有一位坐姿特別的企業家,他微...

挨轟陸客不來衝擊觀光產業 邱垂正:七成民眾支持小兩會

針對陸客來台議題,國民黨立委王育敏14日在立法院質詢時指,台灣觀光出入境人次逆差達899萬人次,產值逆差更高達6,922...

相隔13月 陸物價指數再轉負

大陸國家統計局昨發布,大陸二月居民消費物價指數(CPI)年減百分之○點七,較上個月大減一點二個百分點,時隔十三個月再度負...

美再加徵10%關稅 陸外交部:中國人不信邪、不怕鬼

美國宣布3月4日起對大陸輸美產品再次加徵10%關稅,覆蓋大多數大陸輸美產品。大陸方面則於4日午間宣布四項措施反制美國。大...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。