語音記錄,是記者、編輯、作家等文字工作者們常用的記錄方式。但是,對于記錄者來說,語音并不方便后期的整理、分享和追溯,這也導(dǎo)致聽語音記錄的過程耗時(shí)耗力,影響信息的溝通。近日,搜狗推出語音實(shí)時(shí)變文字的速記工具“搜狗聽寫”,解決會議、采訪、寫作等場景下長語音內(nèi)容轉(zhuǎn)寫難題。
搜狗語音交互技術(shù)中心總經(jīng)理 王硯峰
為了保證在各種復(fù)雜場景下都能精準(zhǔn)轉(zhuǎn)寫,搜狗聽寫采用了大量的前沿技術(shù)。在轉(zhuǎn)寫方面,搜狗聽寫使用了搜狗知音獨(dú)家研發(fā)的長時(shí)語音轉(zhuǎn)寫技術(shù),并與業(yè)內(nèi)領(lǐng)先的端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)深度整合,使得語音識別準(zhǔn)確率保持在較高水平。據(jù)了解,搜狗聽寫的功能相當(dāng)強(qiáng)大,可以支持寫文章、采訪錄音、會議記錄、筆記整理 、日常記事等場景,幫助用戶實(shí)現(xiàn)高效記錄和信息輸入。而且針對不同場景和需求,搜狗聽寫可以支持“聽寫”和“轉(zhuǎn)寫”兩種模式。在“聽寫”模式下,錄音的同時(shí)即可實(shí)時(shí)給出識別結(jié)果,話音落文字出,幾乎沒有時(shí)間差;而“轉(zhuǎn)寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。同時(shí),為了提高文字整理效率,搜狗聽寫還貼心的加入了邊聽邊改、無線標(biāo)重點(diǎn)、多端同步、信息分享等人性化功能,大幅度提升記錄效率,讓文字編輯更輕松。此外,在針對圖書館、咖啡廳等不便于大聲說話而又有使用語音的場景,搜狗聽寫提供耳語識別技術(shù),在人的說話音量低至30分貝時(shí),依然可以準(zhǔn)確識別。
搜狗公司語音交互技術(shù)中心總經(jīng)理王硯峰表示:“搜狗聽寫作為一款多場景的語音聽寫工具,其產(chǎn)品的關(guān)鍵在于語音識別準(zhǔn)確率,而通過大規(guī)模的優(yōu)質(zhì)語音訓(xùn)練數(shù)據(jù)和深度學(xué)習(xí)的技術(shù)能力積累,搜狗也將這種語音識別的技術(shù)優(yōu)勢轉(zhuǎn)化到了更多的適用場景中?!?/span>
目前,搜狗已經(jīng)建立了強(qiáng)大的語音自研團(tuán)隊(duì),擁有互聯(lián)網(wǎng)規(guī)模最大的語音數(shù)據(jù)。每天超過2.6億次的語音請求,為搜狗智能語音系統(tǒng)提供了海量的真實(shí)語料數(shù)據(jù),使得機(jī)器不斷學(xué)習(xí),識別準(zhǔn)確率越來越高,可應(yīng)用的場景也越來越廣泛。此次推出搜狗聽寫產(chǎn)品,是搜狗語音深入用戶垂直場景下的又一個(gè)全新探索,通過更加專注于特定的場景和人群,去理解用戶需求、解決實(shí)際問題,從而讓語音技術(shù)為更多人所用。綜合搜狗在人工智能上的產(chǎn)品布局,我們可以清晰的發(fā)現(xiàn),讓人工智能更“接地氣”,已經(jīng)成為搜狗在人工智能領(lǐng)域的獨(dú)特標(biāo)志。
- QQ:61149512