日本理伦片午夜理伦片,日本欧美三级r级国产在线

首頁(yè)家居家電手機(jī)數(shù)碼 IT互聯(lián)網(wǎng)電商零售汽車(chē)出行游戲娛樂(lè)半導(dǎo)體新基建酷品評(píng)測(cè)

2015-02-01 16:04:41

編者按：日前，美聯(lián)社使用機(jī)器人撰寫(xiě)出了一篇關(guān)于蘋(píng)果公司一季度財(cái)報(bào)的新聞，而美聯(lián)社半年前就開(kāi)始采用機(jī)器人記者，它每個(gè)季度撰寫(xiě)3000篇這樣的新聞報(bào)道，而且這個(gè)數(shù)字有望增加。機(jī)器人使用場(chǎng)景越來(lái)越多，滲透到人們工作生活的各個(gè)方面，話說(shuō)找不到女朋友的男人們，是否可以找一個(gè)機(jī)器人女友呢（不是充氣娃娃哦）？讀完這篇文章，你會(huì)發(fā)現(xiàn)，一切皆有可能。

電影《Her》里，語(yǔ)音交互成為普遍的交互方式：孤獨(dú)的作家西奧多，有語(yǔ)音操控的隨身計(jì)算設(shè)備，用語(yǔ)音撰寫(xiě)感人的書(shū)信安撫受傷人，還找到了“機(jī)器人女友”莎曼薩。

作為一個(gè)懶人，每次看這部電影，都對(duì)語(yǔ)音交互充滿期待。這一天真的就那么遠(yuǎn)么？造出機(jī)器人女友真要到電影里的2025年么？

造出莎曼薩需要分幾步

打造莎曼薩這樣的機(jī)器人，本質(zhì)上是建立一套自然語(yǔ)言操作系統(tǒng)。這背后最重要的工作應(yīng)該是自然語(yǔ)言處理，主要包括：語(yǔ)音識(shí)別、語(yǔ)義分析、語(yǔ)音合成。

模擬出像莎曼薩那樣迷人的聲音，就是語(yǔ)音合成。這個(gè)過(guò)程其實(shí)可以理解成語(yǔ)音識(shí)別的反過(guò)程?，F(xiàn)在有不少開(kāi)源的項(xiàng)目，簡(jiǎn)單合成并不困難，但是如果要合成和具體某個(gè)人的聲音，就需要個(gè)性化定制了。

僅有語(yǔ)音識(shí)別、語(yǔ)義分析、語(yǔ)音合成這些初級(jí)技能，薩曼莎肯定就像一般韓劇里的女主，顏值超高，智商超低。要真正討人喜歡，還需要自然語(yǔ)言搜索、智能推薦這些高階技能。

這個(gè)看起來(lái)挺抽象，舉幾個(gè)例子就很容易懂了。

語(yǔ)音識(shí)別：語(yǔ)音輸入法、微信的聲音轉(zhuǎn)文字就是最典型的案例。

語(yǔ)義分析：Siri、微軟小冰、小娜就是比較典型的案例了。

自然語(yǔ)言搜索：比如Moto360視頻里展示的語(yǔ)音提問(wèn)、搜索。

智能推薦：還沒(méi)有看到明顯的案例，像《Her》里莎曼薩那樣主動(dòng)提供建議，這個(gè)還是有點(diǎn)難度的。Google現(xiàn)在也在做這個(gè)，當(dāng)你達(dá)到某個(gè)地點(diǎn)時(shí)，會(huì)主動(dòng)語(yǔ)音推薦一些可能你需要的東西。

造出莎曼薩還有哪些困難要解決

要造出莎曼薩，當(dāng)然不是一件容易事，還有很多問(wèn)題要解決。

一、語(yǔ)音識(shí)別

1、算法

最近幾年，算法方面基本有了定論，深度學(xué)習(xí)（DNN、RNN）已經(jīng)成為核心算法，但是還沒(méi)有大規(guī)模的實(shí)踐，而且有好多問(wèn)題要解決。

(1)噪音：人在噪音環(huán)境下，也很難聽(tīng)清楚別人在說(shuō)什么。而算法只能解決部分問(wèn)題。之前小魚(yú)在家的CEO宋程楓就表示他們花費(fèi)了大量的人力物力財(cái)力解決噪音問(wèn)題。

(2)方言：這個(gè)就果斷不解釋了。你確定你能聽(tīng)懂全國(guó)各地方言么？更何況是機(jī)器呢。

(3)遠(yuǎn)場(chǎng)：聲音的傳播會(huì)隨著距離指數(shù)衰減。當(dāng)人距離聲源遠(yuǎn)時(shí)，可能就很難聽(tīng)清，機(jī)器也一樣。

2、數(shù)據(jù)

機(jī)器學(xué)習(xí)是現(xiàn)階段最好的方法，但需要大量的數(shù)據(jù)訓(xùn)練模型和機(jī)器，一般往往需要上萬(wàn)小時(shí)的聲學(xué)、語(yǔ)音數(shù)據(jù)學(xué)習(xí)。聲學(xué)數(shù)據(jù)可以從網(wǎng)上挖掘，但都是通用的數(shù)據(jù)資料。而要做得深入、更好用，還需要某個(gè)領(lǐng)域的垂直的數(shù)據(jù)，這可能就需要企業(yè)自己去搜集數(shù)據(jù)。

3、工程

語(yǔ)音識(shí)別其實(shí)是一個(gè)浩大的工程，涉及到：大規(guī)模訓(xùn)練、CPU/GPU集群、云端實(shí)時(shí)識(shí)別等。要做到這些都不容易。如果是移動(dòng)端，還需要考慮在線/離線結(jié)合的問(wèn)題，同時(shí)適配眾多的手機(jī)機(jī)型，這一點(diǎn)也不容易。

二、語(yǔ)義分析

1、算法

我們說(shuō)的話往往是口語(yǔ)，同樣一句話有可能有十種說(shuō)法。比如，可能會(huì)說(shuō)“我想去從東直門(mén)去西直門(mén)”，也可能會(huì)是“去西直門(mén)，從東直門(mén)”。人很容易理解這些，但對(duì)機(jī)器來(lái)說(shuō)，就太難了。

另外，與語(yǔ)音識(shí)別類(lèi)似，NLP處理也要做很多領(lǐng)域的定制的結(jié)構(gòu)化的學(xué)習(xí)方法。很多時(shí)候，人類(lèi)都無(wú)法正確、準(zhǔn)確的描述問(wèn)題，很難從對(duì)話中或者直接搜索得到他想要的確切信息。這就會(huì)增加機(jī)器理解語(yǔ)義的難度。這種時(shí)候就只能一邊猜，一邊問(wèn)了，用戶體驗(yàn)就會(huì)下降。

2、數(shù)據(jù)

機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)學(xué)習(xí)，但目前還缺乏INDOMAIN的標(biāo)注數(shù)據(jù)。有些時(shí)候，一個(gè)詞就可以指代不同的東西；有些時(shí)候，一個(gè)固定的聲音，還會(huì)有不同的文字和解釋。比如，中文的shangwujiudian，既可以理解成上午9點(diǎn)，也可以理解成商務(wù)酒店；英文的buy和by同音，但意義并不同；用戶說(shuō)周杰倫時(shí)，既有可能是想知道周杰倫的歌，也可能是想看周杰倫的百科。同時(shí)，目前現(xiàn)有的自然語(yǔ)言的數(shù)據(jù)質(zhì)量比較差，還需要做篩選，什么樣的可以用，什么不能用。

另外，現(xiàn)有的數(shù)據(jù)還不足以建立起大規(guī)模的知識(shí)圖譜，還需要挖掘大量的知識(shí)，放在庫(kù)里，并不斷積累。比如，提到劉德華，一個(gè)優(yōu)質(zhì)的知識(shí)圖譜，應(yīng)該涵蓋劉德華的生平經(jīng)歷、歌曲、電影等各種資料。

3、工程

自然語(yǔ)言處理的過(guò)程比較復(fù)雜。聲音信號(hào)轉(zhuǎn)化成文字后，還需要后期處理，比如分詞、分類(lèi)、糾錯(cuò)，確定是哪一類(lèi)信息，明確用戶要做什么事，再找到關(guān)鍵參數(shù)。這些復(fù)雜的流程都對(duì)應(yīng)著龐大的工程。

何時(shí)能夠造出莎曼薩？

雖然有不少困難，但目前在語(yǔ)音識(shí)別、語(yǔ)義分析方面都還是有進(jìn)展的。

語(yǔ)音識(shí)別方面的進(jìn)展是突破性的。深度學(xué)習(xí)最成功的應(yīng)用就是在語(yǔ)音識(shí)別上。首先，顯著提高準(zhǔn)確率，并簡(jiǎn)化了系統(tǒng)，而且可以更有效的利用海量數(shù)據(jù)。據(jù)說(shuō)語(yǔ)音識(shí)別的準(zhǔn)確率已經(jīng)從80%多提升到了90%多。

語(yǔ)義識(shí)別方面也有進(jìn)展。2年前，Google發(fā)布“知識(shí)圖譜”，為用戶提供有完整知識(shí)體系的搜索結(jié)果，為機(jī)器搭建更豐富的知識(shí)圖譜。IBM Watson也做過(guò)深度問(wèn)答系統(tǒng)，2011年參加智力競(jìng)賽節(jié)目“Jeopardy!”，戰(zhàn)勝了兩位人類(lèi)冠軍選手。目前，手機(jī)廠商也推出了比較成熟的語(yǔ)義識(shí)別產(chǎn)品，我們最熟悉的就是Google Now、Siri、Cortana。

近幾年，隨著智能硬件興起，在智能車(chē)載、智能家居領(lǐng)域，傳統(tǒng)輸入方式受限，語(yǔ)音交互開(kāi)始被接受，交互技術(shù)逐漸成熟，近幾年語(yǔ)音交互使用量已經(jīng)開(kāi)始增長(zhǎng)，今后2-3年會(huì)更普及。但要做出莎曼薩，估計(jì)至少還要10年。

莎曼薩能說(shuō)中文（普通話）嗎？

這個(gè)肯定是可以的。不過(guò)，與英文相比，中文（普通話）識(shí)別與分析的難度更大。現(xiàn)階段，英文句法分析準(zhǔn)確率能達(dá)到90%以上，但中文只有80%多，這主要還是因?yàn)闈h語(yǔ)太博大精深了。

（1）變調(diào)：漢語(yǔ)里兩個(gè)以上音節(jié)在連續(xù)的時(shí)候，由于受前后音節(jié)的影響，有些音節(jié)的聲調(diào)會(huì)發(fā)生變化。普通話的連讀變調(diào)在上聲字里表現(xiàn)最為突出，識(shí)別難度更大。

（2）同音：漢語(yǔ)音節(jié)少，造成的一個(gè)后果就是同音字太多，聲音轉(zhuǎn)文本信號(hào)的難度增加。

（3）多意：漢語(yǔ)一個(gè)字、一個(gè)詞往往能表達(dá)多種含義，比如“聞”既可以指嗅，也可以指聽(tīng)。

（4）沒(méi)有形態(tài)變化：比如“建議”，既可以是名詞，也可以是動(dòng)詞，但英文里就直接用suggest和suggestion兩個(gè)詞表示。

（5）難分詞斷句：像“小王死了爸爸”這種句子，斷句不同意義就不同，漢語(yǔ)里有很多。

（6）語(yǔ)序靈活：比如，“海淀橋怎么去，從東直門(mén)”在中文里是能被理解的，但在英文里一般有固定的語(yǔ)序。

（7）多成語(yǔ)、俗語(yǔ)、俚語(yǔ)：這個(gè)就不解釋了吧，想想我們高考的時(shí)候就天天被虐，機(jī)器的日子估計(jì)也不好過(guò)呢。

不過(guò)，目前國(guó)內(nèi)也有幾家做自然語(yǔ)言處理相關(guān)的創(chuàng)業(yè)公司，比如訊飛、云知聲、出門(mén)問(wèn)問(wèn)等，一直在做相關(guān)的研究和探索。目前在安靜環(huán)境下特定領(lǐng)域定制過(guò)的語(yǔ)音識(shí)別系統(tǒng)識(shí)別準(zhǔn)確率已經(jīng)相當(dāng)高。但對(duì)于語(yǔ)音交互而言語(yǔ)音識(shí)別不是瓶頸，對(duì)語(yǔ)言的理解更為重要。

原創(chuàng)文章

2024全球智能手機(jī)：小米vivo快跑，拉近與三星蘋(píng)果距離

百吋液晶，創(chuàng)維第一：一次沒(méi)有懸念的奪冠從何而來(lái)？

智能手機(jī)2024：華為增超30%，vivo拿下“年度總冠軍”

85吋高增，115吋亮相：彩電“唯大不破”或帶來(lái)兩個(gè)連鎖反應(yīng)

2024線上彩電銷(xiāo)量市占率：Top5競(jìng)爭(zhēng)激烈，Vidda與TCL、小米差距不足1%

“換電”方案出現(xiàn)：手機(jī)夢(mèng)回2007，充電寶迎來(lái)勁敵？

趙明離職，榮耀兩大看點(diǎn)：IPO與份額止跌

折疊屏與AI，誰(shuí)會(huì)是2025智能手機(jī)市場(chǎng)最大亮點(diǎn)？