DeepSeek | FOCUS | DeepSeek-V3.2再革新,硬撼閉源算力躍進

02/12/2025

  OpenAI旗下閉源大模型ChatGPT迎來3歲生日之際,中國「開源之神」DeepSeek周一(1日)傍晚發布兩款新模型「贈興」--DeepSeek-V3.2及DeepSeek-V3.2-Speciale,不僅完美展示思考有多快、推理有多深,且續維持令人驚嘆的成本效益,被視作開源大模型引領AI平權的又一里程碑。

 

GPT5用戶破8億,惟接連翻車

 

  當ChatGPT的周活躍用戶突破8億,8月登場的旗艦模型GPT‑5卻接連翻車,包括將簡單方程「5.9 = X + 5.11」解作「X=-0.21」,把俄勒岡州(Oregon)標為「Onegon」……引發僅是GPT-4o「換皮」、實則毫無突破的猜疑。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

8月登場的旗艦模型GPT‑5接連翻車。

 

 

  不過,剛橫空出世的DeepSeek-V3.2,不僅正確解答「猴子有666根香蕉,每次最多背66根香蕉,可是猴子每走1米就要吃1根香蕉,問猴子最多能走多遠?」這樣的經典「燒腦」題,更問鼎全球首個斬獲2025年「頂尖四賽(國際奧數、中國奧數、國際大學生設計總決賽、國際信息學奧林匹克)」金牌的大模型。

 

「稀疏注意力」機制提升效率

 

  能答題或許不算特殊本領,畢竟谷歌旗下Gemini 3亦擅長跑分/屠榜,並獲數學家陶哲軒認證,以10分鐘解決百年數學難題(Erdosproblem/367)。今次V3.2的最大突破,當屬引入「DeepSeek 稀疏注意力(DSA)」機制,大幅提升處理長上下文的效率。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek稀疏注意力(DSA)在MLA架構下的工作流程。

 

  例如,試想像DSA是位圖書館館長,當讀者提出「通俗解釋量子糾纏」的查詢,其既不會讀完圖書館裏每一本書的每一頁,來搜尋「量子糾纏」這個關鍵詞,也不會死板地徑直前往擺放物理學分類的書架,而是融會貫通精選科學、人文、歷史等適配書籍,並深度處理如何「通俗」解釋。

 

  此得益於V3.2配置的「閃電索引器(lightning indexer)」微型神經網絡,以及「細粒度選擇機制(fine-grained token selection mechanism)」,既大幅降低計算量,亦保持高準確率。

 

想得更深,成本僅為對手零頭

 

  除了V3.2又快、又好、又省,同日推出的V3.2-Speciale更旨在探究延伸思考的潛力,在強化學習中移除長度懲罰(length penalty),並整合早前DeepSeekMath-V2的數據集和獎勵機制,允許猜想、試錯、修正、自我驗證,相當於模拟人類探索式的深度推理。此正正是其在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro的原因,惟世界級編程競賽等推理任務仍略輸於Gemini-3。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek-V3.2-Speciale在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro。

 

  按每百萬Token輸出計,GPT-5需10美元,而DeepSeek-V3.2及V3.2-Speciale僅為0.42美元,相當於前者的零頭,再次印證中國開源大模型能憑藉獨特架構和訓練範式,超越西方閉源大模型單純的算力、參數軍備競賽。

 

  值得一提的是,DeepSeek僅將今次版本命名為V3.2(V3、V3.1分別為去年12月、今年8月發布),或意味就挑戰閉源模型的複雜任務(DeepSeek坦言,過去數個月,閉源模型和開源模型之間的效能差距正在擴大),V4將成扭轉戰局的關鍵一役,且拭目以待。

撰文:金子安

【樂本健11月限時優惠!】 憑獨家優惠碼【ETN2511】,購物滿$500即送免費禮品► 了解詳情

延伸閱讀

More
  • 道瓊斯工業平均指數
    跌 48,458.05
    -245.96 (-0.505%)
  • 標準普爾500指數
    跌 6,827.41
    -73.59 (-1.066%)
  • 納斯達克綜合指數
    跌 23,195.17
    -398.69 (-1.690%)
精選預託證券 More
00003 香港中華煤氣
按盤價(HKD)︰升7.640
變動率︰+11.852%
較港股︰+6.41%
00016 新鴻基地產
按盤價(HKD)︰升98.964
變動率︰+2.333%
較港股︰-0.29%
02318 中國平安
按盤價(HKD)︰升62.747
變動率︰+1.574%
較港股︰-1.57%
00388 香港交易所
按盤價(HKD)︰跌396.012
變動率︰-1.813%
較港股︰-1.44%
精選中資美股 More
TAL 好未來
按盤價(USD)︰升11.510
變動率︰+3.694%
NTES 網易
按盤價(USD)︰升139.140
變動率︰+2.114%
BIDU 百度
按盤價(USD)︰跌125.010
變動率︰-2.572%
IQ 愛奇藝
按盤價(USD)︰跌1.950
變動率︰-4.412%
精選美股 More
RIVN
Rivian Automotive
按盤價(USD)︰升18.420
變動率︰+12.112%
INTC
英特爾
按盤價(USD)︰跌37.810
變動率︰-4.303%
AMD
超威半導體
按盤價(USD)︰跌210.780
變動率︰-4.810%
RBLX
Roblox Corp
按盤價(USD)︰跌88.510
變動率︰-6.180%
美國指數之報價延遲最少15分鐘。
美股之報價延遲最少15分鐘。
美國時間為 : 13/12/2025 17:24 EST
港股之報價延遲最少15分鐘,更新時間為:12/12/2025 18:00
美國指數之報價延遲最少15分鐘。
美國時間為 : 13/12/2025 17:24 EST
顯示更多
緊貼市況
  • 02643 曹操出行
  • 41.440
  • 02591 銀諾醫藥-B
  • 34.180
  • 00241 阿里健康
  • 5.330
  • 02276 康耐特光學
  • 55.000
  • 00506 中國食品
  • 4.790
  • 00152 深圳國際
  • 8.300
  • 目標︰$10.00
  • 00005 滙豐控股
  • 117.300
  • 目標︰$114.80或以上
  • 01336 新華保險
  • 48.780
  • 目標︰--
  • 02382 舜宇光學科技
  • 67.450
  • 目標︰$84.90
  • 01050 嘉利國際
  • 2.610
  • 目標︰$4.00
  • 00700 騰訊控股
  • 616.000
  • 03690 美團-W
  • 102.400
  • 00941 中國移動
  • 86.500
  • 09988 阿里巴巴-W
  • 154.100
  • 02318 中國平安
  • 63.750
  • 03998 波司登
  • 4.770
  • 目標︰--
  • 00108 國銳生活
  • 3.240
  • 目標︰--
  • 01288 農業銀行
  • 5.550
  • 目標︰$6.10
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 12/12/2025 18:00
中國指數之報價為即時更新,資料更新時間為 12/12/2025 16:30
期指之報價為即時更新,資料更新時間為 13/12/2025 03:00
緊貼市況之報價延遲最少15分鐘,資料更新時間為 12/12/2025 16:40
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

大國博弈

貨幣攻略

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康