一、Step-2 mini 的基本介紹
2025 年 1 月 20 日,階躍星辰推出 Step-2 mini,它是 Step-2 系列語言模型的新品。參數量小但性價比高,僅用 3% 左右的參數量就保有 Step-2 80% 以上的性能。計算處理速度快,輸入 4000tokens 時平均首字時延僅 0.17 秒。定價親民,輸入 1 元 / 百萬 token,輸出 2 元 / 百萬 token。
技術架構上,采用自主研發的新型注意力機制架構 MFA 及其變體 MFA-Key-Reuse,相比常用的 MHA 架構,節省近 94% 的 KV 緩存開銷,推理速度更快,成本更低,在對響應速度要求高的場景優勢明顯。

二、Step-2 mini 的相關介紹
Step-2 mini 源于強大的 Step-2 語言模型,Step-2 于 2024 年表現出色,在指令遵從能力方面,在 LiveBench 的 IFAverage 測試中位列全球第五。
Step-2 采用的 MoE 架構通過選擇性激活部分專家網絡提升性能和計算效率。階躍星辰選擇從頭開始訓練的策略,雖難度大、資源投入高,但能提升模型性能上限。
Step-2 mini 繼承了 Step-2 的優秀特質,并在參數量、性價比、生成速度等方面改進優化,MFA 架構與 MoE 架構分別在推理速度和整體性能上做出貢獻。
三、Step-2 mini 的應用場景
(一)文本生成相關應用
可用于快速生成文字內容的場景,如撰寫新聞簡訊、商業文案、創意寫作等。
(二)交互領域
適用于智能聊天機器人開發或優化,如小型在線客服、社交聊天 APP、在線教育平臺的智能答疑等。
(三)作為基礎模塊協助其他系統
可嵌入其他軟件系統或工作流程,如自動化文檔處理、智能寫作輔助工具、代碼批注生成等。
四、Step-2 mini 的使用方式
用戶可在階躍星辰開放平臺調用其 API 接口使用,按規定輸入數據并接收輸出,輸入按 1 元 / 百萬 token 計費,輸出按 2 元 / 百萬 token 付費。使用時要合理評估輸入任務,參考官方開發文檔掌握準確方法。
五、Step-2 mini 的優缺點
(一)優點
-
性價比高
適合預算有限的小型企業、創業團隊和個人開發者,以低成本獲得較好的語言處理能力。 -
生成速度快
在實時性要求高的場景如實時聊天和新聞編寫中表現出色,能及時回復和快速出稿。 -
推理成本低
采用的架構節省 KV 緩存開銷,降低計算開銷,能應對更多交互請求。
(二)缺點
-
參數量有限帶來的性能局限
處理高度復雜和深度推理任務時可能吃力,如復雜學術研究論文創作。 -
可能不太適合大規模深度定制
相對緊湊的結構和性能設定,可能不適合企業級大型定制項目。