訊飛星火X1:開啟深度推理新時代的 AI 模型
星火深度推理模型X1的概述
星火深度推理模型X1是科大訊飛于2025年1月15日發(fā)布的一款大模型。它是國內(nèi)首個基于全國產(chǎn)算力平臺訓(xùn)練的具備深度思考和推理能力的大模型。
在具體的展示中,科大訊飛研究院的研究員們通過讓訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題等方式展示其性能,它不僅能夠準(zhǔn)確給出答案,還能對解題思路和步驟進(jìn)行詳細(xì)拆解。例如在數(shù)學(xué)方面,它覆蓋小學(xué)、初中、高中、大學(xué)全學(xué)段數(shù)學(xué),輸入或拍照輸入數(shù)學(xué)題目等復(fù)雜問題都能進(jìn)行解答。并且,該模型的中文數(shù)學(xué)能力在國內(nèi)處于領(lǐng)先地位。此外,訊飛星火X1還體現(xiàn)了深度推理模型的三大典型特征:化繁為簡,將復(fù)雜問題分步拆解簡化;進(jìn)行自我探索和反思驗證;基于答案正確與否的優(yōu)質(zhì)反饋信息進(jìn)行強化訓(xùn)練。

星火深度推理模型X1的特點
基于全國產(chǎn)算力平臺訓(xùn)練
星火深度推理模型X1的一大特點是基于全國產(chǎn)算力平臺訓(xùn)練。這一過程面臨諸多挑戰(zhàn),如訓(xùn)練推理強交互、高吞吐推理優(yōu)化以及國產(chǎn)算子優(yōu)化等問題。科大訊飛與華為合作成功攻克了這些難題,才最終訓(xùn)練得到這個模型。如此一來,這個模型標(biāo)志著國產(chǎn)算力在大模型訓(xùn)練領(lǐng)域的新突破,使中國在人工智能領(lǐng)域的自主性和可控性得到了進(jìn)一步提升,擺脫了對國外算力技術(shù)的依賴。
接近人類的慢思考解題方式
該模型的解題過程更接近人類的慢思考方式。與通用大模型相比差異明顯,在解答題目過程中,它不是簡單地直接給出結(jié)果,而是像人類思考問題一樣,逐步推進(jìn)。比如在解答數(shù)學(xué)題目時,它會展現(xiàn)推理邏輯,從分析條件、運用原理到得出結(jié)論的整個過程,就像一個學(xué)生在認(rèn)真做解題步驟一樣。例如面對大學(xué)生數(shù)學(xué)案例題,它回答邏輯嚴(yán)密,能夠根據(jù)題干進(jìn)行預(yù)設(shè),并且注釋清晰。對于小學(xué)生常見問題“1 + 1為什么等于2?”,它根據(jù)自然數(shù)的定義、定義加法運算以及應(yīng)用定義計算得出結(jié)果,不過對小學(xué)生理解來說可能有些抽象。
表現(xiàn)能力優(yōu)秀且用更少的算力
訊飛星火X1在多項考試中成績亮眼,如小初高(含競賽)、大學(xué)(含競賽)、AIME、MATH500等。并且它以較少的算力,就實現(xiàn)了業(yè)界一流的效果,多項指標(biāo)處于國內(nèi)領(lǐng)先的地位。這不僅體現(xiàn)了其高效的運算能力,也顯示出模型在設(shè)計和算法優(yōu)化上的優(yōu)勢,能夠在硬件資源有限的情況下發(fā)揮出強大的推理和解決問題的能力,降低了運行成本,提高了使用效率,在模型性能與資源利用之間找到了較好的平衡。
具備深度推理的三大典型特征
一是化繁為簡,它可以將復(fù)雜的問題進(jìn)行分步拆解簡化。這有助于對于一些大型、復(fù)雜問題進(jìn)行細(xì)化處理,轉(zhuǎn)化為一個個小的、易于解決的子問題,例如對于復(fù)雜的數(shù)學(xué)證明題或者多步驟的應(yīng)用題,它按照步驟一點一點深入分析,使解答過程更有條理。二是進(jìn)行自我探索和反思驗證,在接受問題后,模型能夠自主探索解題思路,并在得到初步結(jié)果后進(jìn)行反思驗證,從而保證答案的準(zhǔn)確性。三是基于答案正確與否的優(yōu)質(zhì)反饋信息進(jìn)行強化訓(xùn)練,這一特征使模型能夠不斷地進(jìn)化、提升自身的能力,根據(jù)之前問題回答的情況調(diào)整策略,變得更加智能和準(zhǔn)確。
星火深度推理模型X1的應(yīng)用場景
教育領(lǐng)域的應(yīng)用
該模型率先在教育場景落地,有著廣泛的應(yīng)用意義。首先,在之前科大訊飛聯(lián)合中國教育科學(xué)研究院發(fā)布基于“問題鏈”的高中數(shù)學(xué)智能教師助手過程中,已經(jīng)開始部署星火X1,并且已經(jīng)得到了眾多教研員和老師的好評。例如一些老師反饋,使用該模型輔助教學(xué)后,數(shù)學(xué)解題的推理過程和思路對于教學(xué)變得更加清晰了。其次,對于學(xué)生來說,在產(chǎn)品應(yīng)用到訊飛AI學(xué)習(xí)機(jī)等設(shè)備之后,將對孩子學(xué)習(xí)的診斷和推薦指導(dǎo)更加精準(zhǔn)。可以根據(jù)每個學(xué)生不同的學(xué)習(xí)情況,進(jìn)行有針對性的輔導(dǎo)。例如提供個性化的學(xué)習(xí)方案,針對學(xué)生的錯題分析知識點漏洞,進(jìn)而推薦適合補充知識內(nèi)容的練習(xí)習(xí)題等,從而更好地實現(xiàn)因材施教,并且這種能力還會隨著技術(shù)的融入持續(xù)升級。
醫(yī)療領(lǐng)域的應(yīng)用
在醫(yī)療領(lǐng)域,星火深度推理模型X1的模型策略已經(jīng)取得了初步驗證成效。它可使得專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控的準(zhǔn)確率均達(dá)90%,例如在四川大學(xué)華西醫(yī)院的呼吸內(nèi)科、骨科等科室以及與北京安貞醫(yī)院的合作項目中均有很好的表現(xiàn)。在華西醫(yī)院,依托訊飛星火醫(yī)療大模型的技術(shù)優(yōu)勢和X1算法的系統(tǒng),在處理診療行為記錄、手術(shù)術(shù)式質(zhì)控等復(fù)雜質(zhì)控任務(wù)的準(zhǔn)確率已經(jīng)達(dá)到90%,顯著提升了質(zhì)控人效及復(fù)雜內(nèi)容質(zhì)控效果;與北京安貞醫(yī)院合作的多模態(tài)大模型心臟超聲診斷決策系統(tǒng),也展示了訊飛星火X1在醫(yī)療領(lǐng)域提高診斷效率和質(zhì)量方面的潛力。科大訊飛還宣布將在2025年上半年發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,以確保其深層次診斷推理效果和質(zhì)控能力繼續(xù)保持業(yè)界領(lǐng)先的地位,從而進(jìn)一步推動整個醫(yī)療行業(yè)向智能化發(fā)展。
對企業(yè)的輔助作用
企業(yè)在日常辦公中往往面臨著大量的數(shù)據(jù)處理、信息提供、數(shù)學(xué)計算等多方面工作內(nèi)容,訊飛星火X1的數(shù)學(xué)能力能夠助力數(shù)學(xué)有關(guān)的工作,如金融分析中的風(fēng)險評估計算、科研推演中的數(shù)據(jù)模型分析。企業(yè)中的大量文檔需要進(jìn)行處理,無論是圖文識別還是長文本能力的提升都有助于企業(yè)對文檔類資料的整理,這也是科大訊飛星火4.0Turbo升級的方向,目前它在基礎(chǔ)數(shù)學(xué)能力、圖文識別能力和長文本能力等多方面能力指標(biāo)提升顯著,圖文識別能力的升級也能有效處理企業(yè)合同等文檔,并大幅提升高價值數(shù)據(jù)的獲取能力,在一定程度上可以幫助提高企業(yè)的辦公效率和決策準(zhǔn)確性。
星火深度推理模型X1與其他模型的比較
和通用大模型相比
-
解題過程的差異:星火深度推理模型X1的解題過程更接近人類的慢思考方式,而常見的通用大模型可能更側(cè)重于基于大量數(shù)據(jù)的模式識別得出結(jié)果,相對缺乏這種類似人類由步驟導(dǎo)向得出答案的過程。比如在數(shù)學(xué)題目解答中,星火深度推理模型X1不僅給出答案,更注重邏輯推理步驟,通用大模型可能只是給出答案而缺少詳細(xì)的思考推理過程闡述。
-
算力需求方面:星火深度推理模型X1可以用更少的算力實現(xiàn)業(yè)界一流的效果并且多項指標(biāo)國內(nèi)第一,而一些通用大模型可能需要更高的算力資源消耗來達(dá)到較好的性能表現(xiàn),這反映了星火深度推理模型X1在優(yōu)化算法、數(shù)據(jù)利用效率等方面的獨到之處。
和國外同類型模型相比
-
本地化優(yōu)勢:訊飛星火X1基于全國產(chǎn)算力平臺訓(xùn)練,針對國內(nèi)教育、醫(yī)療等場景應(yīng)用效果良好且表現(xiàn)出獨特優(yōu)勢,例如中文數(shù)學(xué)能力國內(nèi)第一。由于國外模型在開發(fā)基準(zhǔn)、針對群體等方面與國內(nèi)不同,所以星火深度推理模型X1對于國內(nèi)市場的特定需求、中文語境下的語義理解等方面存在獨特的優(yōu)勢。并且在涉及國家安全、民族性等因素下,使用國內(nèi)自主研發(fā)的模型在數(shù)據(jù)保密、符合國情的服務(wù)等方面更有保障。
-
行業(yè)針對性方面:可能國外的模型更多傾向于國際化的商業(yè)布局、跨領(lǐng)域通用性,而星火深度推理模型X1已經(jīng)開始明確地在教育、醫(yī)療這類關(guān)乎國計民生且具有專業(yè)數(shù)據(jù)積累需求的行業(yè)中進(jìn)行具體深入的應(yīng)用探索,特別是在醫(yī)療領(lǐng)域內(nèi)復(fù)雜病歷內(nèi)涵質(zhì)控、專科輔助診斷等方面已經(jīng)初步驗證其成效,具有很強的行業(yè)針對性的先發(fā)優(yōu)勢。
如何使用星火深度推理模型X1
通過合理提問方式輸入問題
當(dāng)使用星火深度推理模型X1時,需要采用合適的提問方式,特別是在數(shù)學(xué)領(lǐng)域。從已有的測試案例來看,對于有明確解題指向的數(shù)學(xué)問題,模型能很好地應(yīng)對。例如輸入明確的數(shù)學(xué)題目,如中小學(xué)常見的數(shù)學(xué)應(yīng)用題或者大學(xué)的數(shù)學(xué)解題題目類型等,模型都可以接受輸入并進(jìn)行解答。但要注意問題的表達(dá)要盡可能清晰,以利于模型準(zhǔn)確理解需求,如果是拍照輸入數(shù)學(xué)題目的情況可能還需要確保圖片清晰度等因素不會影響識別準(zhǔn)確性,像大模型之家在測試中如果題目過長或者表述不清時它有時會提示換題嘗試等情況。
利用其在多領(lǐng)域的落地應(yīng)用
如果是教育工作者或者學(xué)生,可以利用它在教育領(lǐng)域的應(yīng)用。像它已經(jīng)應(yīng)用在一些輔助教學(xué)工具中,如科大訊飛聯(lián)合中國教育科學(xué)研究院發(fā)布的基于“問題鏈”的高中數(shù)學(xué)智能教師助手就已經(jīng)有所集成,那么可以使用此類工具,間接接入模型能力來輔助教學(xué)或者學(xué)習(xí)。在醫(yī)療方面,隨著基于該模型的醫(yī)療大模型不斷升級完善,醫(yī)療人員可以通過與之相配套的醫(yī)療診斷系統(tǒng)等工具,將患者病例等數(shù)據(jù)輸入相關(guān)系統(tǒng)中,借助模型進(jìn)行分析輔助診斷等操作。
等待更廣泛的應(yīng)用拓展
目前雖然已經(jīng)在教育、醫(yī)療等場景初步落地應(yīng)用,但是隨著科大訊飛等公司的持續(xù)開發(fā)推廣,相信未來會有更多的途徑和方法來方便用戶使用這個模型。例如它可能會整合到更多的智能硬件設(shè)備中,或者在更多企業(yè)場景下開發(fā)針對性的應(yīng)用接入該模型,進(jìn)而拓展使用方式和場景。并且可能隨著時間推移,用戶對于它的使用會越來越簡便化,就像目前大模型普遍隨著版本升級不斷優(yōu)化交互界面和操作方式一樣。