體育播報3月14日宣據《白鯨實驗室》爆料,DeepSeek V4 和姚順雨領銜操刀的混元新模型,均預計將于下個月(2026 年 4 月)發布。
值得一提的是,回顧今年以來的多次爆料,無論是春節還是3月首周,DeepSeek V4的發布日期傳聞均一一落空。

3 月 11 日,OpenRouter 新上線了兩個神秘模型——Healer Alpha 與 Hunter Alpha。OpenRouter 頁面顯示,Healer Alpha 被描述為具備視覺、聽覺、推理與行動能力的前沿全模態模型;社區因此迅速將其與尚未發布的新一代國產模型聯系起來,據稱捕捉到了「系統提示詞中要求嚴格遵守中國法律法規」。
據悉,DeepSeek V4 將于 4 月正式上線。作為梁文鋒打磨已久的多模態大模型,DeepSeek V4 除了代碼能力躍升,還會在長期記憶上取得突破。這一方向與 DeepSeek 團隊近幾個月的公開研究脈絡基本一致。
2026 年 1 月,梁文鋒署名論文《Conditional Memory via Scalable Lookup》提出「條件記憶」機制;2025 年 12 月的《mHC: Manifold-Constrained Hyper-Connections》則繼續指向底層架構優化。
兩篇論文都在嘗試處理 Transformer 在記憶、訓練穩定性和長上下文上的瓶頸。梁文鋒過去半年的主要工作,是補齊 DeepSeek 在視覺內容處理和 AI 搜索上的短板。為強化 AI 搜索能力,DeepSeek 早在去年就已與百度展開合作。
梁文鋒這次為 DeepSeek V4 設定的關鍵迭代方向,正是長期記憶能力。DeepSeek V4 還將深度適配國產芯片,并有望成為首個完全跑在國產算力生態上的大模型。
有點細LCK美工制作Bin賽事封面:三個按鈕單眼皮內雙雙眼皮
體育播報3月17日宣 先鋒賽BLG戰勝了BFX,LCK美工制作了五局比賽的賽事封面,其中第一局給Bin哥做的賽事封面,右邊...
2026-03-18
深度學習2.0來了馬斯克點贊Kimi技術報告:稱其研究令人印象深刻
體育播報3月17日宣 16日月之暗面Kimi發布技術報告,對大模型十年沒有變化的核心結構殘差連接行重新設計,使每一...
2026-03-18
張安達51霍爾沃斯晉級斯諾克世界公開賽32強,與肖國棟會師
體育播報3月17日宣 斯諾克世界公開賽64進32輪次,張安達擊敗對手,將戰肖國棟。2026斯諾克世界公開賽64進32輪次...
2026-03-18
前LPL解說suki分享自拍照:想我了嗎
體育播報3月17日宣 前LPL解說suki分享自拍照:想我了嗎。
2026-03-18
居然還在增長!虎牙25年財報:全年總收入增長至65億
體育播報3月17日宣3月17日下午,虎牙公司公布了2025年第四季度及全年財報。全年來看,虎牙公司總收入同比增長至...
2026-03-18