1月15日,科大訊飛發(fā)布了當(dāng)前全國(guó)產(chǎn)算力平臺(tái)上唯一的深度推理大模型——訊飛星火X1。該模型中文數(shù)學(xué)能力國(guó)內(nèi)第一,并率先應(yīng)用于教育、醫(yī)療等剛需場(chǎng)景。
同時(shí),訊飛星火4.0 Turbo底座能力再次迎來(lái)全新升級(jí),圖文、數(shù)學(xué)和長(zhǎng)文本能力顯著提升,并首發(fā)混域知識(shí)搜索技術(shù),進(jìn)一步解決行業(yè)、企業(yè)痛點(diǎn)。
此外,作為國(guó)內(nèi)智能翻譯領(lǐng)域的佼佼者,科大訊飛還推出了業(yè)界首個(gè)具備端到端語(yǔ)音到語(yǔ)音同傳能力的大模型——星火語(yǔ)音同傳大模型,最快語(yǔ)音同傳時(shí)延小于5秒。
01
訊飛星火X1中文數(shù)學(xué)能力國(guó)內(nèi)第一,
率先落地真實(shí)場(chǎng)景
一直以來(lái),訊飛星火堅(jiān)持走全國(guó)產(chǎn)化路線。盡管在全國(guó)產(chǎn)算力平臺(tái)上訓(xùn)練深度推理模型遭遇了諸多挑戰(zhàn),但科大訊飛攜手華為,成功攻克了訓(xùn)練推理強(qiáng)交互、高吞吐推理優(yōu)化以及國(guó)產(chǎn)算子優(yōu)化等一系列難題,最終成功訓(xùn)練出我國(guó)首個(gè)基于全國(guó)產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型——訊飛星火X1。
發(fā)布會(huì)上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競(jìng)賽題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準(zhǔn)確給出了這些題目的答案,還對(duì)解題思路和步驟進(jìn)行了詳細(xì)拆解。與通用大模型相比,其解題過(guò)程更接近人類的“慢思考”方式。
過(guò)程中,訊飛星火X1充分展現(xiàn)深度推理模型的三大典型特征:化繁為簡(jiǎn),將復(fù)雜問(wèn)題分步拆解簡(jiǎn)化;進(jìn)行自我探索和反思驗(yàn)證;基于答案正確與否的優(yōu)質(zhì)反饋信息進(jìn)行強(qiáng)化訓(xùn)練。
值得一提的是,訊飛星火X1在近期參加的小初高(含競(jìng)賽)、大學(xué)(含競(jìng)賽)、AIME、MATH 500等多項(xiàng)“考試”中成績(jī)十分亮眼,用更少的算力,實(shí)現(xiàn)了業(yè)界一流的效果,多項(xiàng)指標(biāo)國(guó)內(nèi)第一。
“大模型發(fā)展,應(yīng)用才是硬道理”是科大訊飛一直秉持的觀點(diǎn)。
目前,訊飛星火X1率先在教育等真實(shí)場(chǎng)景中實(shí)現(xiàn)了應(yīng)用落地。去年1024,科大訊飛聯(lián)合中國(guó)教育科學(xué)研究院發(fā)布了基于“問(wèn)題鏈”的高中數(shù)學(xué)智能教師助手。同時(shí)也正面向全國(guó)百個(gè)試點(diǎn)區(qū)域、聯(lián)合千名優(yōu)秀教研員和老師打造上萬(wàn)個(gè)優(yōu)秀案例。目前,星火X1已經(jīng)部署上述試點(diǎn)區(qū)域,并廣獲好評(píng),體驗(yàn)過(guò)的老師們紛紛表示,X1在一題多解、教學(xué)知識(shí)關(guān)聯(lián)、拓展學(xué)生高階思維等方面表現(xiàn)出色。訊飛星火X1也將成為學(xué)生和家長(zhǎng)的幫手,隨著相關(guān)技術(shù)的深度融入,科大訊飛AI學(xué)習(xí)機(jī)學(xué)習(xí)推薦和診斷將變得更加精準(zhǔn),解題思路和知識(shí)鏈條將更加清晰,后續(xù)也將持續(xù)升級(jí)。
醫(yī)療領(lǐng)域,訊飛星火X1的模型策略已取得初步驗(yàn)證成效,可使得??戚o助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控的準(zhǔn)確率均達(dá)90%。發(fā)布會(huì)上,科大訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級(jí)版,確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領(lǐng)先。
02
訊飛星火4.0 Turbo底座能力再升級(jí),
成為更懂行業(yè)的大模型
此次發(fā)布會(huì),訊飛星火4.0 Turbo底座能力實(shí)現(xiàn)了全新升級(jí),七大核心能力全面提升,全面對(duì)標(biāo)OpenAI 最新版的GPT-4o。此次升級(jí)最重要的特點(diǎn),是針對(duì)行業(yè)、企業(yè)的痛點(diǎn)問(wèn)題,在數(shù)學(xué)能力、行業(yè)知識(shí)、圖文識(shí)別、長(zhǎng)文本能力等能力上實(shí)現(xiàn)提升。
數(shù)學(xué)能力一直是訊飛星火的強(qiáng)項(xiàng),此次基于訊飛星火X1的高質(zhì)量合成數(shù)據(jù),訊飛星火4.0 Turbo的數(shù)學(xué)能力變得更強(qiáng),可以在數(shù)學(xué)教學(xué)、金融分析和科研推演等工作中更好的幫助用戶。
圖文識(shí)別能力直接關(guān)乎著企業(yè)能否高效的采編和利用行業(yè)、私域數(shù)據(jù),是大模型“學(xué)習(xí)”的基礎(chǔ)。在各行各業(yè)的實(shí)際工作中,經(jīng)常面臨圖文識(shí)別的“疑難雜癥”:如醫(yī)療的體檢報(bào)告、法院的文書、學(xué)術(shù)論文、企業(yè)合同等,還有復(fù)雜長(zhǎng)表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識(shí)別能力升級(jí),使得通用文檔版面分析、文字識(shí)別的準(zhǔn)確率相對(duì)提升了40%,復(fù)雜表格結(jié)構(gòu)、潦草手寫文字等方面的準(zhǔn)確率相對(duì)提升了60%,可以解決上述難題、大幅提升高價(jià)值數(shù)據(jù)的獲取能力。對(duì)比測(cè)試表明,訊飛星火4.0 Turbo的圖文識(shí)別能力顯著領(lǐng)先國(guó)內(nèi)外頂尖競(jìng)品。
此次升級(jí)還針對(duì)性地提升了文檔要素檢測(cè)能力,在知識(shí)切分和構(gòu)建的粒度上更加精細(xì)、準(zhǔn)確,能有效防止大模型幻覺(jué),同時(shí)發(fā)布了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對(duì)于一份500頁(yè)的項(xiàng)目文件,從掃描、識(shí)別到解析的全過(guò)程,僅需2分鐘即可全部完成。
大模型的長(zhǎng)文本能力一直是用戶關(guān)注的重點(diǎn),特別是在企業(yè)知識(shí)問(wèn)答這類嚴(yán)謹(jǐn)?shù)膽?yīng)用場(chǎng)景中,用戶對(duì)大模型幻覺(jué)的容忍度幾乎為零。因此,訊飛星火推出了基于智能體的全新長(zhǎng)文本框架,并行業(yè)首發(fā)了句子級(jí)溯源功能。這一新框架優(yōu)化了超長(zhǎng)注意力機(jī)制,同時(shí)利用大規(guī)模網(wǎng)頁(yè)和書籍?dāng)?shù)據(jù)進(jìn)行知識(shí)關(guān)聯(lián)式合成,使得知識(shí)回復(fù)的錯(cuò)誤率降低了40%,句子級(jí)溯源效果更是超越了GPT-4o,顯著緩解了問(wèn)答搜索服務(wù)中因大模型幻覺(jué)而需要反復(fù)溯源確認(rèn)的應(yīng)用落地難題。
考慮到不少用戶在寫報(bào)告、做調(diào)研這類工作時(shí),往往需要花費(fèi)大量時(shí)間搜集信息、整理資料,基于圖文、長(zhǎng)文本能力的提升和行業(yè)應(yīng)用能力的積累,訊飛星火行業(yè)首發(fā)了混域知識(shí)搜索技術(shù)。該技術(shù)能夠?qū)崿F(xiàn)對(duì)個(gè)人知識(shí)、企業(yè)知識(shí)、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索,用戶只需一次提問(wèn),即可獲得綜合搜索后的結(jié)果,大大提升信息搜索效率。
根據(jù)第三方數(shù)據(jù),2024年,訊飛星火在大模型中標(biāo)數(shù)量和中標(biāo)金額上取得“雙第一”,尤其是在能源、金融、汽車、運(yùn)營(yíng)商等行業(yè),與客戶共同打磨了近百個(gè)智能體應(yīng)用。
基于“技術(shù)+應(yīng)用”的不斷正向循環(huán),訊飛星火4.0 Turbo的行業(yè)能力全面提升,金融、油氣、能源、電力、鋼鐵、 航司等領(lǐng)域綜合能力的絕對(duì)提升全部超過(guò)10%,可以說(shuō)是“最懂行業(yè)的大模型”。
03
首發(fā)星火語(yǔ)音同傳大模型,
助力全系產(chǎn)品翻譯能力提升
作為國(guó)內(nèi)智能翻譯領(lǐng)域的領(lǐng)軍者,科大訊飛不僅擁有在業(yè)內(nèi)率先通過(guò)全國(guó)翻譯專業(yè)資格考試的機(jī)器翻譯系統(tǒng),且在最近連續(xù)3屆IWSLT國(guó)際口語(yǔ)機(jī)器翻譯比賽都獲得了冠軍。發(fā)布會(huì)上,科大訊飛帶來(lái)了在智能翻譯領(lǐng)域又一突破:針對(duì)日常對(duì)話、商務(wù)交流、行業(yè)翻譯等國(guó)際交流場(chǎng)景中的高難度同傳翻譯需求,發(fā)布了國(guó)內(nèi)首個(gè)具備端到端語(yǔ)音同傳能力的大模型——星火語(yǔ)音同傳大模型。
眾所周知,語(yǔ)音同傳的技術(shù)難度較高,“現(xiàn)在大模型能力的發(fā)展,結(jié)合訊飛在智能語(yǔ)音技術(shù)上的獨(dú)特算法積累,可以做端到端的語(yǔ)音同傳?!睋?jù)了解,該模型通過(guò)模仿人類同傳譯員的思維鏈路進(jìn)行訓(xùn)練,具備實(shí)時(shí)意群理解和切分、上下文語(yǔ)境精準(zhǔn)選詞以及碎片化信息重組的能力,這一特性使得星火語(yǔ)音同傳大模型在處理復(fù)雜句式和語(yǔ)境時(shí)表現(xiàn)出色,能夠迅速準(zhǔn)確地傳達(dá)原意。
技術(shù)測(cè)試結(jié)果顯示,即便將訊飛的語(yǔ)音同傳技術(shù)和國(guó)外最優(yōu)競(jìng)品的交傳技術(shù)對(duì)比,訊飛語(yǔ)音同傳在內(nèi)容完整度、信息準(zhǔn)確度以及語(yǔ)言質(zhì)量上都處于領(lǐng)先水平,同時(shí)星火語(yǔ)音同傳大模型還可以最快實(shí)現(xiàn)僅5秒的同傳時(shí)延,達(dá)到人類專家譯員的水平。
集成了最新的同傳技術(shù)的產(chǎn)品用起來(lái)怎么樣?訊飛翻譯機(jī)的產(chǎn)品經(jīng)理也進(jìn)行了演示。無(wú)論是海外旅游場(chǎng)景中的景點(diǎn)介紹,還是國(guó)際展會(huì)上的專業(yè)產(chǎn)品介紹,翻譯機(jī)能在短時(shí)間內(nèi)完成高質(zhì)量的英到中和中到英的雙向同傳任務(wù)。
除了端到端的語(yǔ)音同傳能力,星火語(yǔ)音同傳大模型還促進(jìn)了語(yǔ)音到文字翻譯效果的提升,使得科大訊飛全系產(chǎn)品的翻譯能力都得到顯著提升,在日常對(duì)話、單人演講、影視節(jié)目,包括場(chǎng)景更復(fù)雜、翻譯難度更高的多人會(huì)議等場(chǎng)景以及醫(yī)療等專業(yè)領(lǐng)域,為各種國(guó)際交流場(chǎng)景提供高質(zhì)量翻譯服務(wù)。
發(fā)布會(huì)最后,科大訊飛透露,針對(duì)語(yǔ)音到語(yǔ)音的同傳場(chǎng)景,訊飛翻譯機(jī)將會(huì)配置耳機(jī)、音箱、麥克風(fēng),在2025年推出商務(wù)套裝,滿足用戶在不同的商務(wù)洽談場(chǎng)景的使用需求。
- QQ:61149512