科大訊飛劉慶峰:人工智能未來會像水和電一樣,無所不在!
原創(chuàng)
2015-12-22 23:53:35

編者按:1956年最熱的兩個月,美國漢諾斯的達特茅斯學院中,一些科學家們正聚在一起,討論著看似對人類“無關(guān)痛癢”的話題:以機器模仿人類的學習及其他方面的智能。大家最終沒有達成共識,討論的內(nèi)容卻誕生出一個新名詞——人工智能。那年,也成了人工智能元年。

60年的時光,人工智能的發(fā)展經(jīng)歷著并不被眾人所知的起伏。而在這個被稱為“人工智能之年”的年份里,有人在嘈雜的人群中靜靜講述,有一天,人工智能將會像電影《超體》中的露西一樣,無處不在!


    【釘科技報道】12月21日,世界領(lǐng)先的語音交互及人工智能(英文簡稱A.I.)科研公司——科大訊飛,在北京國家會議中心召開了以“A.I.復始,萬物更新”為主題的2015年年度發(fā)布會。作為被稱為“人工智能之年”的2015年的收官大會,其內(nèi)容異彩紛呈,可以算得上是中國人工智能領(lǐng)域一場具有標志性意義的大會。

    人工智能的發(fā)展經(jīng)歷了什么樣的歷程?有哪些人工智能產(chǎn)品能為我們的工作、生活、學習帶來幫助?「訊飛超腦」為代表的科大訊飛人工智能技術(shù),獲得了哪些創(chuàng)新性、革命性的技術(shù)突破?以開啟人工智能新紀元為目標的科大訊飛都做出了解答。

    復始·更新:60年,一個輪回


   劉慶峰介紹,1956年的達特茅斯會議是人工智能研究的歷史起點,至今正好是一個60年甲子。在這60年的發(fā)展過程中,伴隨著計算機技術(shù)和民用科技突飛猛進的發(fā)展,人工智能研究本身經(jīng)歷了兩次波峰與波谷,而從2006年起始至今愈發(fā)升溫的人工智能熱,是第三次人工智能浪潮,而60年甲子的當下,正處于人工智能爆發(fā)的前夜。

    在這第三次浪潮中,中國、美國和歐洲,不約而同地將人類大腦研究上升為國家戰(zhàn)略科研高度,而以科大訊飛為代表的中國科學家與產(chǎn)業(yè)勢力,也是歷史上第一次與西方的同行們同步前進,共同推動人類科學技術(shù)的前沿探索。
    劉慶峰表示,人工智能未來會像水和電一樣無所不在。而在人工智能的三個層次——計算智能、感知智能和認知智能之中,前兩者機器的能力已經(jīng)超越人類,讓機器實現(xiàn)認知智能是目前人工智能科研的焦點,這也是人區(qū)別于動物的最本質(zhì)能力。
    而從人類自身的發(fā)展來看,產(chǎn)生認知智能的標志是語言的廣泛使用。所以,在第三次人工智能浪潮中,世界上眾多的科學家都不約而同地從“自然語言理解”這個研究方向上,尋找人工智能的突破口,亦即從語音與語言入手實現(xiàn)機器的認知革命。而科大訊飛也正是從這個方向上取得了令世人矚目的成就。
    訊飛超腦正在認知智能方向不斷突破

    從1998年成功研發(fā)出可實用的中文語音交互系統(tǒng)開始,至2014年發(fā)布“訊飛超腦”的這17年間,科大訊飛取得了讓行業(yè)和科技界矚目的一系列科研成就與產(chǎn)業(yè)化成果。

    科大訊飛的這些成果中,包括獲得NIST全球語種識別比賽的冠軍,JWSLT機器翻譯評測冠軍,在國內(nèi)替代人工進行英語口語測試與普通話級別考試,并在教育、車載、家居、通信、硬件和國家安全等眾多領(lǐng)域的產(chǎn)業(yè)化高速推進。這個過程中從一家大學生創(chuàng)業(yè)公司,成長成為目前市值超過500億的中國高科技公司。

    AIUI正式發(fā)布,訊飛超腦全新升級


    在產(chǎn)品發(fā)布環(huán)節(jié),劉慶峰首先定義了認知智能的三大核心支撐能力:人機交互、知識管理與推理學習。而隨后科大訊飛發(fā)布的訊飛超腦2.0科研項目,正是圍繞這三方面持續(xù)展開,不但賦予機器“能聽會說”的能力,還能賦予機器“能理解會思考”的能力。
    而在訊飛超腦的產(chǎn)業(yè)化應用產(chǎn)品層面,年會發(fā)布了對科大訊飛具有里程碑意義的人機交互新產(chǎn)品——AIUI。劉慶峰認為,在實際上已經(jīng)到來的“萬物互聯(lián)”時代,客觀上對人機交互提出了更高的要求。但是,一方面目前大多數(shù)設(shè)備沒有屏幕并且與用戶之間有一定的距離,另一方面隨時隨地的多方交互的需求越發(fā)明顯。于是,科大訊飛又在此次大會上定義了“萬物互聯(lián)”時代的人機語音交互標準,其基本能力應該包括三方面:遠場識別、全雙工、多輪交互。
    AIUI集成了包括雙全工技術(shù)、麥克風陣列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和內(nèi)容服務等——科大訊飛一些系列尖端科研成果和完善服務,代表業(yè)界最高水準的技術(shù)產(chǎn)品。開發(fā)者將可以一鍵獲取解決方案,通過集成麥克風陣列、集成SDK以及定制云端服務等方式。
    更自然的人機交互是:聽得懂方言

    

    年初,山東大漢被車載語音導航逼瘋的消息傳播甚廣。一個普通話不標準的山東人,在環(huán)境嘈雜的車上,遠距離與不那么智能的導航交流,產(chǎn)生的結(jié)果就是讓人抓狂的識別與交互。而本次發(fā)布會上,科大訊飛通過遠場抗噪、方言識別、全雙工交互、多輪對話、糾錯等系列技術(shù),成功打破了“山東大漢的困境”。

    科大訊飛通過定位、麥克風波束形成、回聲消除、抗混響、喚醒一系列技術(shù)形成的系統(tǒng)解決了遠距離識別問題。其次,科大訊飛實現(xiàn)了人機對話控制由單工(如手機語音助手的按一下說一下)轉(zhuǎn)變成全雙工(人和機器可以像打電話那樣同時聽和說)的交互轉(zhuǎn)變。

    多輪交互實現(xiàn)了機器對上下文連貫理解,使得人機交流不再是單調(diào)的一問一答,而是可以連續(xù)交流。再加上對話糾錯機制,人可以隨時糾正對話中雙方的錯誤,使說過的話不再是覆水難收。通過以上一系列技術(shù)形成的系統(tǒng),極大降低了環(huán)境、說法、習慣等對人機交互的干擾,實現(xiàn)高度自然的人機交互體驗。

    全學科閱卷+智學網(wǎng),訊飛超腦助力教育升級


    老師“忙”于改作業(yè)、判卷子、備授課,事倍功半;學生“盲”于做作業(yè)、找補習、問問題,低效重復;而教育資源“?!保瑪?shù)量多、來源廣,選擇難,雜亂無章更是給教學帶來極大困擾。劉慶峰用“忙”、“盲”、“茫”這三個字道出了教育面臨的窘境,而科大訊飛目前的技術(shù)進展正是解決以上問題的良方。
    劉慶峰表示,在訊飛超腦的應用層面,教育產(chǎn)業(yè)也是科大訊飛將自身科研成果產(chǎn)業(yè)化最成功的領(lǐng)域之一。目前,全國已經(jīng)有31個省市的8000萬師生在使用科大訊飛面向K12教育所推出的高科技教學與考評產(chǎn)品,有效解決了之前的教育行業(yè)困境,不僅實現(xiàn)了語音與文字的識別、合成與分類,并且實現(xiàn)了智能批改、全科閱卷、資源庫自動建設(shè)等真正具備“人工智能”的產(chǎn)品目標,為中國的整個教育體系實現(xiàn)夢寐以求的個性化教學提供了有力支撐。
    正是在此基礎(chǔ)上,作為科大訊飛的to C教育產(chǎn)品——智學網(wǎng)與E聽說具備非常可觀的市場價值。
    目前,科大訊飛中文作文機器閱卷技術(shù)在2015年合肥、安慶中學會考上已經(jīng)取得應用,人機閱卷對比結(jié)果顯示機器閱卷已經(jīng)相當準確!
    智學網(wǎng)秉承“基于大數(shù)據(jù)的發(fā)展性評價及教與學分析”的理念,以考試為切入點,可在線輔助老師完成出卷、閱卷、統(tǒng)分,將老師從繁瑣重復的閱卷工作中解放出來。同時,機器閱卷過程的全數(shù)字化,實現(xiàn)對學生答題數(shù)據(jù)的收集,通過對數(shù)據(jù)的分析,生成面對學校、班級、學生不同版本的專業(yè)化評測報告,以便老師進行針對性的教學,進而促進學生實現(xiàn)個性化的學習,極大提升學習效率。

    訊飛聽見:“即時語音轉(zhuǎn)寫”開啟知識管理新時代


    在發(fā)布會現(xiàn)場,科大訊飛全球首次將演講人董事長劉慶峰的演講同步轉(zhuǎn)寫成文字在大屏幕顯示,敢于接受現(xiàn)場數(shù)千參會者和數(shù)千萬觀看視頻直播觀眾的檢驗,并接受五名高級速錄師的挑戰(zhàn)?,F(xiàn)場識別正確率達到99%以上!這也標志著科大訊飛又一次在業(yè)界率先實現(xiàn)了演講和會議場景下的語音轉(zhuǎn)寫技術(shù)突破。

    針對大型會議、現(xiàn)場采訪、個人交流等場景下的內(nèi)容整理需求,科大訊飛集成了單麥克解混響技術(shù)、陣列解混響技術(shù)、口語化識別等眾多最新研究成果,全球首發(fā)智能“軟件+硬件+服務”于一體的語音科技產(chǎn)品——訊飛聽見,包括手機App(錄音寶)、PC端網(wǎng)站(www.iflyrec.com)、智能硬件(錄音筆)。
    PC端網(wǎng)站能夠?qū)崿F(xiàn)雙屏智能編輯、角色自動分離、音頻精準定位、快速按句回聽、發(fā)言實時上屏、格式多種多樣等功能,手機APP錄音寶則能解決常見的錄音回聽不方便、導出錄音復雜、錄音文件無法重命名等問題。同時,聽見錄音筆既增強了傳統(tǒng)錄音筆的錄音音質(zhì)、播放效果,更配備智能語音轉(zhuǎn)文字服務,三者的結(jié)合實現(xiàn)了“軟件+硬件+服務”的完美統(tǒng)一。
    劉慶峰表示,實際上,音文轉(zhuǎn)寫是當下都市生活的一種經(jīng)常性需求,在正式發(fā)布之前,錄音寶產(chǎn)品已經(jīng)有了超過100萬的用戶就是這種需求的證明。而隨著流媒體的不斷演進與普及,相信,在未來的圖文直播時代,科大訊飛的音文轉(zhuǎn)錄產(chǎn)品的價值將會更加凸顯。
    錄音寶、錄音筆與訊飛聽見網(wǎng)這三款新銳產(chǎn)品,將與訊飛輸入法(2.8億用戶)、靈犀語音助手(1.2億用戶)、DingDong智能音箱(2015年市場份額最大的WiFi音箱)、智學網(wǎng)、E聽說一道,構(gòu)成科大訊飛的To C產(chǎn)品線第一陣營,而科大訊飛還將繼續(xù)在To C業(yè)務的條線上,推出受市場歡迎的高科技產(chǎn)品。


    在實際上已經(jīng)到來的“萬物互聯(lián)時代”,語音為主,觸摸、圖像、手勢為輔,將成為人機交互的新常態(tài),而在這種人類生活的新常態(tài)中,人工智能技術(shù)的突破是用來延伸人類能力而非替代人類的。人工智能將使人類更幸福、更富想象力和創(chuàng)造力。

最新文章
1
家電銷售“金九月”,黑白大家電表現(xiàn)如何?
2
從iQOO13發(fā)布,看iQOO如何成為手機行業(yè)的“增長之王”?
3
戰(zhàn)略定力逐步發(fā)威華帝前三季凈利增長12.28%
4
飽和的家電市場 沖出一匹“黑馬”
5
四季度沖刺加速,各地家電以舊換新品類再擴容
6
又賣爆了!小米15系列線下銷量同比大漲40%
7
iOS 18.1升級率翻倍!蘋果Apple Intelligence立大功
8
以"可持續(xù)"為在華發(fā)展關(guān)鍵的索尼,要在進博會上讓人"穿越"春夏秋冬?
9
樣樣超Pro,新十年旗艦大作一加13售價 4499 元起
10
康佳電視“雙十一”大促來襲,G9 Pro等爆款機型開啟“千級分區(qū)普及風暴”
11
快手村釣系列賽貴州站圓滿落幕,超燃“村味”賽事魅力盡顯
12
快手上線短劇分銷撮合平臺,助力行業(yè)運營提效
13
M4蘋果MacBook Pro來了:雖仍是12999元起售 但告別了8GB內(nèi)存時代!
14
國產(chǎn)手機年終大戰(zhàn):集體漲價,影像退潮,AI接棒內(nèi)卷大旗
15
中國廣電5G最新數(shù)據(jù)公布:“三年破五”還能否如期實現(xiàn)?
16
光模塊企業(yè)“光”速布局喜迎收獲期
17
“國補”政策下電視行業(yè)迎發(fā)展機遇,這些趨勢將主導未來
18
一加13今天發(fā)布 關(guān)鍵配置一覽:屏幕全球首發(fā)!
19
四季度沖刺加速,各地家電以舊換新品類再擴容
20
觀察:從小米15系列發(fā)布,看小米“人車家全生態(tài)”的高端勢能
關(guān)于我們

微信掃一掃,加關(guān)注

商務合作
  • QQ:61149512