4月12日,中國移動(dòng)在首鋼園國家冬季訓(xùn)練中心速滑館舉辦“5G新通話,預(yù)見新未來”產(chǎn)品發(fā)布會(huì),正式發(fā)布5G新通話產(chǎn)品,并宣布部分終端已在全國支持5G VoNR超清通話業(yè)務(wù),打造可視化、多媒體、高感知、全交互的全新媒體。
5G新通話可以讓通話雙方實(shí)現(xiàn)語音轉(zhuǎn)文字,同時(shí)還可以在屏幕上實(shí)時(shí)翻譯,讓通話人在聽見的同時(shí),“看懂”通話的內(nèi)容。看似好理解的技術(shù),背后蘊(yùn)藏的大量“黑科技”,例如語音識(shí)別、口語理解、語音同傳等等,非深厚的AI語音技術(shù)積累不可為。
這些背后的“黑科技”,主要來自智能語音和人工智能的頭部企業(yè)科大訊飛,因此,科大訊飛也成為了中國移動(dòng)5G新通話的官方合作伙伴。
5G“殺手級(jí)應(yīng)用”,今年7月后覆蓋所有新上機(jī)型
在發(fā)布會(huì)上,中國移動(dòng)市場(chǎng)經(jīng)營部總經(jīng)理首建國介紹,與互聯(lián)網(wǎng)的語音視頻通話相比,5G新通話能夠基于中國移動(dòng)5G網(wǎng)絡(luò),實(shí)現(xiàn)高清視頻通話,通話質(zhì)量穩(wěn)定,幾乎沒有時(shí)延,且電話呼入不中斷。同時(shí),結(jié)合AI技術(shù),5G新通話可以在通話過程中實(shí)現(xiàn)中英文實(shí)時(shí)翻譯、語音轉(zhuǎn)文字等功能,此外還提供了屏幕共享、遠(yuǎn)程協(xié)作等特色功能。首建國還介紹說,目前5G新通話功能正陸續(xù)在各大手機(jī)終端進(jìn)行適配,到今年7月,所有終端新推出機(jī)型都將支持5G新通話。
從5G新通話所展示的功能來看,有望成為一款“5G殺手級(jí)應(yīng)用”。在這一被業(yè)界普遍看好的業(yè)務(wù)背后,5G網(wǎng)絡(luò)是核心基礎(chǔ),媒體互動(dòng)是重要功能擴(kuò)展,終端支持是保障,其中還有一個(gè)關(guān)鍵,就是AI智能語音技術(shù)。
不僅聽見,還能看懂
科大訊飛是北京2022年冬奧會(huì)和冬殘奧會(huì)官方自動(dòng)語音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商。
資料顯示,面向冬奧會(huì)場(chǎng)景的多語種語音及語言服務(wù)平臺(tái),采用了科大訊飛的“自動(dòng)語音轉(zhuǎn)換與翻譯”技術(shù),支持60個(gè)語種語音合成、69個(gè)語種語音識(shí)別、168個(gè)語種機(jī)器翻譯和6個(gè)語種交互理解,其中重點(diǎn)語種翻譯準(zhǔn)確率達(dá)到了95%,平均每句翻譯響應(yīng)時(shí)間不超過0.5秒。
口語化的流暢體驗(yàn)
通話場(chǎng)景下有大量的口語化表達(dá),口語化表達(dá)不同于規(guī)范的書面文本,一般表現(xiàn)為內(nèi)容表述不符合語法規(guī)范、語氣詞過重、重復(fù)冗余等,這使得直譯時(shí)出現(xiàn)明顯的“機(jī)翻”痕跡,給機(jī)器翻譯在通話場(chǎng)景中的應(yīng)用提出了更高的挑戰(zhàn)。
科大訊飛的技術(shù)負(fù)責(zé)人介紹,針對(duì)5G新通話口語化場(chǎng)景優(yōu)化,采取了三大措施:一是人機(jī)協(xié)同標(biāo)注常用口語數(shù)據(jù),并補(bǔ)充口語雙語訓(xùn)練;二是系統(tǒng)性運(yùn)用了無監(jiān)督/弱監(jiān)督訓(xùn)練方法,基于大量口語化表達(dá)的源、目標(biāo)語言單語數(shù)據(jù),采用自訓(xùn)練、回譯算法等強(qiáng)化翻譯模型和語言模型,對(duì)口語化表達(dá)特性實(shí)現(xiàn)增強(qiáng)訓(xùn)練;三是針對(duì)語音識(shí)別后處理階段,設(shè)計(jì)語氣詞順滑、規(guī)整等模塊,將口語化表達(dá)盡可能書面化,從而減少機(jī)翻“痕跡”,幫助用戶更好地理解。
冠軍的底氣
中國移動(dòng)5G新通話背后的人工智能技術(shù),來源于科大訊飛23年來堅(jiān)持源頭技術(shù)自主創(chuàng)新的深厚積累,科大訊飛在人工智能語音識(shí)別、機(jī)器翻譯、語義理解等技術(shù)領(lǐng)域處于國際領(lǐng)先地位,在諸多國際技術(shù)賽事中取得冠軍。
在語音識(shí)別領(lǐng)域,科大訊飛參加了2021年OpenASR國際低資源多語種語音識(shí)別挑戰(zhàn)賽15個(gè)語種受限賽道和7個(gè)語種非受限賽道,全部取得第一;在機(jī)器翻譯領(lǐng)域,先后獲得了2018年IWSLT國際口語機(jī)器翻譯評(píng)測(cè)比賽端到端任務(wù)第一和2021年IWSLT國際口語機(jī)器翻譯評(píng)測(cè)比賽英德語音同傳、文本同傳和英日文本同傳全部三個(gè)同傳賽道冠軍;在多語言理解領(lǐng)域,獲得世界權(quán)威多語言理解評(píng)測(cè)XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)四項(xiàng)任務(wù)中的三項(xiàng)最好成績,標(biāo)志著科大訊飛多語言理解與跨語言遷移能力再上新臺(tái)階。在語義評(píng)測(cè)領(lǐng)域,在第十六屆國際語義評(píng)測(cè)SemEval 2022的比賽中,科大訊飛從30余支參賽隊(duì)伍中脫穎而出,獲得“多語種新聞相似度評(píng)測(cè)任務(wù)”和“多語種慣用語識(shí)別任務(wù)”兩項(xiàng)冠軍。
以數(shù)智化技術(shù)構(gòu)建美好世界是人類共同的希冀。5G新通話只是5G+AI有機(jī)融合的一小步,我們有理由相信,在中國擁有全球規(guī)模最大的5G精品網(wǎng)絡(luò),擁有世界領(lǐng)先的人工智能自主核心技術(shù),科大訊飛和中國移動(dòng)這樣深度協(xié)同的模式,將會(huì)讓5G+AI發(fā)揮更大的融合倍增效應(yīng),必將加速推進(jìn)科技創(chuàng)新、推動(dòng)數(shù)智化轉(zhuǎn)型,共創(chuàng)人工智能美好新世界。