亚洲成人一区在线_久久综合九色综合欧美98_久久精品一区二区三区不卡牛牛 _亚洲成人在线网站

您現在的位置: 通信界 >> 市場動態 >> 新聞正文  
 
vivo攜手昆侖芯、wenet助力提升語音識別效果與性能,共建開源生態
[ 通信界 / 靜姝 / m.sese521.com / 2022/11/28 22:03:11 ]
 

語音識別是AI領域的一項重要基礎服務,同樣也是vivo AI體系中舉足輕重的能力,是Jovi輸入法、Jovi語音助手等應用的基石。打造高準確率、高性能的語音識別引擎,才能給vivo億級的語音用戶帶來良好的體驗。基于wenet端到端語音識別工具,vivo結合自身業務場景進行深度優化,成功研發離線和流式識別引擎,支撐vivo語音業務的快速發展。



隨著用戶量的快速增⻓,語音識別性能問題凸顯,CPU推理方案在峰值場景TP99延時較高,且難以滿足高算力的業務場景。為確保良好的用戶體驗、進一步提升產品及服務質量,性能優化、降本增效勢在必行。


vivo AI工程中心在模型推理加速積累了多年經驗,為此自研一套語音識別流式推理引擎。引擎支持動態batching、顯存池、數據分桶排序等特性,同時支持CPU和GPU,并在GPU上取得了不錯的加速效果。


昆侖芯科技深耕AI加速領域十余年,專注打造擁有強大通用性、易用性和高性能的通用人工智能芯片,并持續精進在芯片架構、軟件棧、工程化系統層級等方面的技術實力。目前,昆侖芯科技已實現兩代通用AI芯片產品的量產及落地應用,通過用算力賦能不同場景中的 AI 應用,驅動千行百業的智能化轉型。


為進一步降本增效以及提升用戶體驗,vivo AI工程中心同步啟動AI多元算力項目,聯合昆侖芯科技,在語音識別場景首先展開研發共建,深入合作,并已取得階段性突破進展。


vivo自研語音識別流式推理引擎


整個引擎包括四部分:


1.wenet解碼器,包括前端處理(特征、VAD等)->encoder->語言模型(wfst)->decoder流程;


2.數據調度,動態batching、分桶排序等;


3..Runtime適配層,抽象模型推理接口,便于適配不同推理后端;


4.Runtime層,后端推理層包括onnxruntime、GPU、昆侖芯的XpuRT等。



自研引擎特點:


支持多batch流式請求,多batch能充分發揮硬件計算性能;


動態batchting,根據實際請求會在一定時間自動組裝batch,便于提升引擎的并發吞吐能力;


分桶排序,減少多batch的無效padding,減少無效計算量;


顯存池,高并發下流式識別緩存會頻繁申請和釋放,通過顯存池優化了這部分開銷,提高性能。


另外針對語言模型(wfst)優化:


語言模型的lattice-faster-decoder過程有千萬/秒的小對象內存申請(ForwardLink和BackpointerToken),通過將小對象合并大對象的池化方案,一次wfst的search從14ms減少到5ms;


線程模型優化。默認的線程模型是一個會話一個pthread線程,在GPU方案中,每秒數千線程創建系統負載較大,通過將pthread線程優化為bthread;


對象復用。將AsrDecoder池化復用,減少內存的動態申請,cpu性能提升27%。


昆侖芯高性能推理庫方案


AI推理引擎面臨的最大技術挑戰——同時滿足業務快速靈活迭代和硬件高性能。面對該挑戰,昆侖芯科技團隊為vivo提供了兩種解決方案:基于圖編譯引擎方案和基于高性能推理庫方案。綜合業務和性能的雙重考量,vivo團隊最終選擇了高性能推理庫方案。該方案基于昆侖芯API高性能算子庫自研模型推理大算子,主要由Encocer和Decoder兩個大算子組成。


高性能推理庫特點:


支持動態shape,性能與靜態shape無異,相比”靜態模擬動態“可節省大量寶貴的顯存資源;


支持多batch流式推理,解決流式推理一大難題,特別是cache管理;


深度圖優化,使用了昆侖芯豐富的圖融合優化,如:ffn_kernel_fusion、attention_fusion等,可變長優化技術等;


不同量化策略,FP16/INT8動態靜態量化以及混合量化;


定制算子融合,如ConforermEncoder的RelPos相關計算可以融合為rel_pos_fusion_kernel等;


自動化工具,模型一鍵導入等。



性能測試


對比不同后端的性能數據onnxruntime(cpu)、165w GPU、昆侖芯XPU。


硬件配置:



整體來看,在FP16量化后不同后端均達到精度無損,昆侖芯高性能推理庫方案單卡并發達到了1400路,相比CPU的350路的最大并發,性能提升約4倍,首字和尾字耗時也大大降低,降本增效明顯。單機單卡的測試外,也進行了單機4卡的壓測,單機4卡GPU和4卡R200均達到了4000路并發。


相對主流165w GPU方案,昆侖芯語音識別高性能推理庫方案通過構建大算子的方式也為業務根據自身特性做針對性融合、量化、裁剪提供了更加便捷、更加有用的工具。


昆侖芯在wenet中開源XPU支持


wenet是國內最大的語音開源社區,致力于推動語音技術落地, “共創共贏”。昆侖芯是wenet中支持的首款新型異構AI推理芯片,基于昆侖芯第二代推理卡模型推理采用語音高性能推理庫的非流式解碼方案,目前源碼已合入到wenet主線。第二階段,昆侖芯、vivo、wenet社區三方聯手,將共同推出圖引擎和高性能庫兩種后端推理,支持多batch流式解碼,模型優化到部署端到端的解決方案,為客戶業務落地持續賦能。


未來,昆侖芯將持續發揮在推理生態的領先優勢,助力語音業務用戶體驗不斷優化,同時也將與社區緊密合作,協力共建wenet國產生態。

 

作者:靜姝 合作媒體:通信界 編輯:顧北

 

 

 
 熱點新聞
普通新聞 同級最強!天璣8200實測成績放出,iQOO Neo7 SE神機配神U
普通新聞 中國信通院:我國部署超 7900 張 5G 行業虛擬專網
普通新聞 省內首個智慧康養平臺,點亮“銀發族”數智生活
普通新聞 中國移動與中國寶武簽署戰略合作框架協議
普通新聞 云巨頭深陷高管離職風波!三千億美元市值已蒸發一大半
普通新聞 中國軟件三十年:煙塵隱入,夾縫重生
普通新聞 馬斯克世界首富之位被LVMH老板短暫超越
普通新聞 蘋果將推“高級數據保護”功能 允許用戶對更多iCloud備份數據進行加
普通新聞 臺積電加大對美投資建廠,半導體關鍵技術會外流嗎?
普通新聞 數字化融入生活方方面面,紅帽助力客戶實現多維轉型
普通新聞 愛立信移動市場報告:2028年5G簽約數將超過50億
普通新聞 我國將邁入百億物聯發展征途 分三階段實現
普通新聞 黑客帝國重現?馬斯克腦機公司將開展人體試驗:有點瘋狂
普通新聞 OpenAI發布新作:ChatGPT聊天機器人
普通新聞 2023年人工智能發展預測 企業如何成功采用AI?
普通新聞 愛立信:5G增長快于以往任何一代移動通信
普通新聞 突破千萬大關之后 被誤讀低估的VR
普通新聞 臺積電1nm新廠計劃已上報 將落地新竹
普通新聞 三大運營商股價創年內新高,新發展模型下價值如何重估?
普通新聞 解密“個人信息保護認證”
  版權與免責聲明: ① 凡本網注明“合作媒體:通信界”的所有作品,版權均屬于通信界,未經本網授權不得轉載、摘編或利用其它方式使用。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:通信界”。違反上述聲明者,本網將追究其相關法律責任。 ② 凡本網注明“合作媒體:XXX(非通信界)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。 ③ 如因作品內容、版權和其它問題需要同本網聯系的,請在一月內進行。
通信視界
新華三:云智原生 AD-NET構筑智能聯接新底座
華為林永明:ADN 鋪就高階自智網絡之路
普通對話 中國移動丁海煜:三大方向十大技術,5G-A賦
普通對話 英特爾王銳:中國戰略是我們的全球戰略之重
普通對話 新華三:云智原生 AD-NET構筑智能聯接新底座
普通對話 華為林柏楓:聯接升級,激發商業增長
普通對話 華為林永明:ADN 鋪就高階自智網絡之路
普通對話 NVIDIA發力數字孿生:站在虛擬和現實之間
普通對話 韋樂平:網絡深度轉型最明確的方向首先就是
普通對話 中國工程院院士鄔賀銓:6G標準面臨小圈子風
普通對話 華為丁耘:綠色ICT,共創新價值
普通對話 愛立信中國區總裁方迎:將在中國市場重點做
普通對話 中國聯通買彥州:廣電5G商用對行業競爭格局
普通對話 中國聯通陳忠岳:從“提速降費”向“提速提
普通對話 華為胡厚崑:5G+工業互聯網 數據驅動是關鍵
普通對話 華為郭平:每個人磨好自己的豆腐,就會有一
普通對話 中國移動楊杰:加快推進新型平臺用工模式規
通信前瞻
北斗三號衛星低能離子能譜儀載荷研制成功
中國移動李慧鏑:強化數智基建驅動 推進產業轉
普通對話 物聯網設備在智能工作場所技術中的作用
普通對話 軟銀研發出以無人機探測災害被埋者手機信號
普通對話 AI材料可自我學習并形成“肌肉記憶”
普通對話 北斗三號衛星低能離子能譜儀載荷研制成功
普通對話 為什么Wi-Fi6將成為未來物聯網的關鍵?
普通對話 馬斯克出現在推特總部 收購應該沒有懸念了
普通對話 臺積電澄清:未強迫員工休假或有任何無薪假
普通對話 新一代載人運載火箭發動機研制獲重大突破
普通對話 多管齊下,VMware跨云服務助力企業云轉型
普通對話 中國移動李慧鏑:強化數智基建驅動 推進產業
普通對話 蘇少林:打造北京數字經濟“五強”,助力標
普通對話 中國科大在高安全量子密鑰分發網絡方面取得
普通對話 華為楊超斌:邁向5.5G持續創新,開啟5G產業
普通對話 中國聯通買彥州:加強創新力度,協同推進6G
普通對話 信通院總工敖立:5G工業模組是產業鏈特別短
主站蜘蛛池模板: 欧美在线中文字幕| 日本成人精品在线| 久久99精品国产99久久6尤物| 美女av一区二区三区| 国产日韩av高清| 日本三日本三级少妇三级66| 欧美日韩福利视频| 亚洲97在线观看V| 国产精品男人的天堂| 久久人人爽人人爽人人片av高请| 99久久国产综合精品五月天喷水| 久久久久久亚洲| 日韩一级在线免费观看| 国产精品视频地址| 精品欧美日韩在线| 欧美 日韩 国产 激情| 亚洲v国产v在线观看| 国产精品免费久久久久久| 久久国产乱子伦免费精品 | 青青青国产在线观看| 啊v视频在线一区二区三区| 国产美女被下药99| 国产一区二区色| 韩国视频理论视频久久| 久久久久久久少妇| 欧美亚洲激情视频| 日韩欧美99| 日韩视频中文字幕| 日韩有码免费视频| 日韩在线视频线视频免费网站| 岛国一区二区三区高清视频| 国产精品日韩在线| 国产精品久久精品国产| 懂色av一区二区三区四区五区| 国产精品欧美日韩一区二区| 国产日韩视频在线播放| 国产在线精品一区二区三区| 久久久久久久久久久久久久久久久久av| 亚洲a在线观看| 日韩欧美国产免费| 久久网站免费视频|