鳥(niǎo)類是如何交流的? 通過(guò)鳴叫?,F(xiàn)在,機(jī)器間的交流也可以用聲音了。一批新型公司現(xiàn)在正制造一種被叫做聲聯(lián)網(wǎng)的東西。
聲音簡(jiǎn)史
我們來(lái)回顧一下。聲音被當(dāng)作信號(hào)的歷史可謂久遠(yuǎn)。在最早的時(shí)候,號(hào)角、鼓和鐘聲?shū)Q起警報(bào)的時(shí)候,鼓動(dòng)了集會(huì)、指揮軍隊(duì)和城市工人們;響徹整個(gè)城市的鈴聲指引著我們的生活。這些聲音主要是為了交流,而音樂(lè)性則排到了其次。
在一些似乎不大可能的地方中可以找到模擬聲波代碼:從莫扎特到舒曼的作曲家們?cè)谒麄兊囊魳?lè)中隱藏有著獨(dú)特音頻邏輯的音樂(lè)玩笑; 水下數(shù)據(jù)解調(diào)器引導(dǎo)著海軍艦艇;電話網(wǎng)絡(luò)會(huì)使撥號(hào)等音變得嘈雜。
對(duì)于許多人來(lái)說(shuō)(包括我),第一次體驗(yàn)互聯(lián)網(wǎng)是調(diào)制解調(diào)器發(fā)出像白頭翁吱吱叫的聲音,盒式磁帶里的 PCM 編碼游戲 - 這些聲音不是數(shù)據(jù)本身而是數(shù)據(jù)傳輸?shù)母碑a(chǎn)品,它們既不是為了在空氣中傳播也不是為了被人耳聽(tīng)到,而是為線纜設(shè)計(jì)的。
隨著小型音頻片段能在移動(dòng)設(shè)備上實(shí)時(shí)解碼,我們來(lái)到了有著為進(jìn)行無(wú)線傳輸而將 URL 編譯成記錄序列的現(xiàn)代系統(tǒng)的數(shù)字時(shí)代。在這個(gè)無(wú)重量感知的數(shù)字世界里,很容易就忘記了信息也是一件物品,東西怎么會(huì)發(fā)不出聲音?在現(xiàn)在這個(gè)時(shí)代,機(jī)器也是能發(fā)出聲音的,而且他們可以交流從圖片到支付方式的任何東西。
聲聯(lián)網(wǎng)時(shí)代來(lái)臨
這就是聲聯(lián)網(wǎng)。首先,機(jī)器可以通過(guò)聲音將鏈接發(fā)送到遠(yuǎn)程網(wǎng)絡(luò),此外,機(jī)器內(nèi)的查找表也不需要其它的網(wǎng)絡(luò)了:因?yàn)槁曇舯旧砭褪蔷W(wǎng)絡(luò)。如今的科技已經(jīng)足夠在可聽(tīng)域范圍內(nèi)或超出這個(gè)范圍發(fā)送少量數(shù)據(jù),也能足夠好地將每一個(gè)創(chuàng)建的鏈接編碼成數(shù)秒或更短的音頻。
這是個(gè)大膽的想法
聲音有多種存在形式,首先也是最容易被忽視的就是網(wǎng)絡(luò)形式。
想想看:這個(gè)地球上有著比人還多的微型廉價(jià)揚(yáng)聲器。為什么不利用這種無(wú)所不在的日??萍寄兀课覀兛吹搅艘粋€(gè)簡(jiǎn)單而直接地連接大量設(shè)備的巨大機(jī)遇。
聲音可以到達(dá)其它網(wǎng)絡(luò)到不了的地方,而且聲音可以和現(xiàn)有的協(xié)議一道成為網(wǎng)絡(luò)生態(tài)系統(tǒng)有價(jià)值的一部分。我們可以很輕松地重新構(gòu)造自動(dòng)取款機(jī)、電視、玩具、收音機(jī)和平板 —— 只要能傳播聲音,就能發(fā)送數(shù)據(jù)。
它的原理是什么?
有許多技術(shù)可以搭建聲聯(lián)網(wǎng),大致包括三個(gè)方面:
描述 :通過(guò)選中的已有的信號(hào)特征將兩個(gè)信號(hào)區(qū)分開(kāi)來(lái),又稱“音頻指紋”。這樣的例子包括音樂(lè)識(shí)別服務(wù),像 Shazam 和 Soundhound。極客們,請(qǐng)?jiān)徫遗e這兩個(gè)例子:雖然從廣義上講這些技術(shù)也可以被稱為真正的聲聯(lián)網(wǎng)科技,但即便是音樂(lè)也是能為點(diǎn)對(duì)點(diǎn)交流而進(jìn)行重塑的。
添加 :可檢索但人類難以覺(jué)察的特征(也叫“音頻水印”)可以被添加到任意一個(gè)音頻信號(hào)中。這樣的例子包括在無(wú)線廣播中利用代碼進(jìn)行聽(tīng)眾追蹤。有一種方式是利用微小的,不易被人類察覺(jué)的快速回音,這些回音通常被人耳聽(tīng)力忽略掉。這種方式被像 InFrasonics, mufin 和 Civolution 等公司使用。它的碼率大致相當(dāng)于上面的指紋方式的碼率。
編碼 : 除了在大型線上已知聲音庫(kù)中節(jié)取一種聲音,或者快速添加水印,完整的音頻信號(hào)(音高,音色,音階或振幅)本身就是代碼。Chirp 和 LISNR 的多音高系統(tǒng)就是如今被編碼得足夠強(qiáng)大以避免噪聲干擾,失真和壓縮的例子。最近發(fā)布的 Google Tone 是基于另外一種多頻編碼方式的。純代碼信號(hào)的“清晰聽(tīng)覺(jué)”比起前兩項(xiàng)技術(shù)來(lái)有著更快的速度優(yōu)勢(shì)。
然而……
所有的方式都有相對(duì)的優(yōu)勢(shì)和劣勢(shì)。通常在實(shí)用性和工程設(shè)計(jì)方面有沖突。信號(hào)可以包含豐富的數(shù)據(jù),但是不堪入耳。信號(hào)也可以讓人毫無(wú)覺(jué)察地嵌入到弦樂(lè)四重奏中,但編譯的數(shù)據(jù)微乎其微。信號(hào)在現(xiàn)實(shí)世界中的噪聲、混響等聲音面前可能顯得無(wú)比的脆弱。信號(hào)可以既不好聽(tīng)也不可靠。
通過(guò)聲音傳送數(shù)據(jù)必然是緩慢的。通過(guò)悅耳的聲音傳送數(shù)據(jù)那就更慢了 —— 因此,關(guān)鍵是要發(fā)送指針而非文件。聲波數(shù)據(jù)涉及到安全問(wèn)題:一對(duì)多的數(shù)據(jù)分享相當(dāng)有用,但不安全(看如何設(shè)計(jì));那如果你只想分享給一個(gè)人呢? 這是個(gè)有趣的挑戰(zhàn) —— 就在我們現(xiàn)在談?wù)摃r(shí)人們正在研究新的解決方案。
最后也是最重要的一點(diǎn),我們真的需要聲聯(lián)網(wǎng)嗎?我相信是的。聲音有多種存在形式,首先也是最容易被忽視的就是網(wǎng)絡(luò)形式 —— 它是跨越最后那幾米距離的橋梁,是去往其它網(wǎng)絡(luò)無(wú)法抵達(dá)的地方的媒介。
務(wù)必小心
聲音本身影響重大。謹(jǐn)慎鄭重地使用聲音,同時(shí)注意保護(hù)聲波環(huán)境至關(guān)重要。從耳機(jī)漏音到街道噪聲,再到聲波用戶界面,我們已經(jīng)有了太多隨意而囂張的噪音污染,而這些卻在事后回想時(shí)被認(rèn)為僅僅是按鍵提示音。
作為音頻極客和音效設(shè)計(jì)師,我們?cè)谠O(shè)計(jì)發(fā)送的聲音時(shí)花費(fèi)很多心思,而且我們明顯地會(huì)在自然界,尤其是鳥(niǎo)類語(yǔ)言中塑造我們的音頻聲音。聲聯(lián)網(wǎng)要有一種人性化的交流方式:也就是一種通過(guò)將人耳放在第一位也是最重要的地位來(lái)尊重用戶的方式。
聲音無(wú)處不在
是時(shí)候興奮了。老實(shí)說(shuō)聲聯(lián)網(wǎng)的機(jī)遇大得令人難以置信,從現(xiàn)有的應(yīng)用程序到便捷的資源配置?,F(xiàn)在重新構(gòu)造語(yǔ)音,音樂(lè)和數(shù)據(jù)分享的聲音設(shè)計(jì)這些都有潛力,我們公司在這方面比較活躍。
新的硬件會(huì)加快對(duì)它的理解:愈來(lái)愈便宜的手機(jī)專用 DSP(數(shù)據(jù)信號(hào)處理) 芯片,以及因始終在線的接收功能以及無(wú)需用手操作的用戶界面而需聯(lián)網(wǎng)的設(shè)備,加大了聲聯(lián)網(wǎng)產(chǎn)品的覆蓋范圍和效率。我們已經(jīng)看到音頻被應(yīng)用在通過(guò)收音機(jī)發(fā)送比特幣的支付方式中,在教室通過(guò)圖片或網(wǎng)頁(yè)分享以便將地圖發(fā)送到手機(jī)上。我們才剛剛開(kāi)始??傊瑥姆侵悄苁謾C(jī)到門(mén)鈴,只要有聲音的地方就有數(shù)據(jù)。
聲聯(lián)網(wǎng)的時(shí)代來(lái)了,有一件事是肯定的 —— 你還不是什么都沒(méi)聽(tīng)到。(來(lái)源:techcrunch.com)
- QQ:61149512