鳳凰網(wǎng)科技訊 (作者/楊雪)11月7日消息,第五屆世界互聯(lián)網(wǎng)大會在浙江烏鎮(zhèn)拉開帷幕,在開幕當(dāng)天,搜狗公司CEO王小川、新華社副社長劉思揚、搜狗公司智能語音事業(yè)部總經(jīng)理王硯峰和主持人邱浩聯(lián)合帶來了一場跨界產(chǎn)品發(fā)布會:搜狗與新華社合作開發(fā)、全球第一個“AI合成主播”正式亮相。
隨著“AI合成主播”的發(fā)布,搜狗人工智能的核心技術(shù)“搜狗分身”也浮出水面。
“搜狗分身”技術(shù)通過人臉關(guān)鍵點檢測、人臉特征提取、人臉重構(gòu)、唇語識別、情感遷移等,結(jié)合語音、圖像等多模態(tài)信息進行聯(lián)合建模訓(xùn)練后,生成與真人無異的AI分身模型,可以讓機器以更逼真自然的形象呈現(xiàn)在用戶面前。
這項技術(shù)讓機器首次做到逼真的模擬人類說話時的聲音、嘴唇動作和表情,并且將三者自然匹配,與真人幾乎一致。以“AI合成主播”為例,用戶只需要輸入新聞文本,AI合成主播就能用和真人一樣的聲音進行播報,而在播報的過程中唇形、面部表情等也能與真人主播完全吻合,效果惟妙惟肖。除此之外,“搜狗分身”技術(shù)還能僅靠少量用戶真實音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型,顯著降低了個性化定制成本,進而幫助人類提高信息表達和傳遞的效率。
據(jù)搜狗公司智能語音事業(yè)部總經(jīng)理王硯峰介紹,“搜狗分身”技術(shù)是搜狗人工智能的核心技術(shù)之一,誕生于搜狗“自然交互+知識計算”這一人工智能理念之下。依托“搜狗分身”技術(shù)創(chuàng)新的信息傳播形式,媒體能夠在融媒體轉(zhuǎn)型、新聞時效性和跨語種傳播能力等方面更進一步。
- QQ:61149512