吳恩達駝著背低著頭,略帶夸張地在他的智能手機上比劃著不停點擊屏幕、瞇著眼卻仍然錯字連篇的那種不自在的樣子?!拔覀?nèi)缃袷沁@樣做的,”他稱。
“而我們應(yīng)該這樣做,”這位百度的首席科學(xué)家稱。他靠在座位上,沒有特定對象地說著話,手機放在桌子上。他說,數(shù)百萬智能手機用戶用一個手指敲字的痛苦有一天應(yīng)該成為過去。而這只需要創(chuàng)造一種達到合理精確度、與口袋大小相當(dāng)?shù)碾娮影嫒祟惔竽X。百度是中國最大的搜索引擎。
吳恩達是深度學(xué)習(xí)領(lǐng)域的專家,該領(lǐng)域是人工智能的一個分支,專注于讓計算機學(xué)習(xí)如何像我們一樣聽、說、讀、思。由于該領(lǐng)域與移動互聯(lián)網(wǎng)時代緊密相連,它正迅速成為包括百度在內(nèi)的全球最大科技公司的優(yōu)先發(fā)展領(lǐng)域。
“整個世界都在轉(zhuǎn)向移動設(shè)備,但是還沒人創(chuàng)造出向移動設(shè)備輸入指令的有用接口,”他稱。隨著人工智能的發(fā)展,“很快你將可以在訂購食物時只需要大聲說一句‘能在我回家前送些食物到我家中嗎?’”
“感覺上甚至都不像是科技,而就在后臺里?!?/span>
除了更好的語音識別,從預(yù)測廣告點擊量到人臉識別技術(shù)的很多領(lǐng)域都在討論使用人工智能。
自從去年加入百度以來,吳恩達一直在為實現(xiàn)這個愿景而穩(wěn)扎穩(wěn)打。作為一名出生在英國的華人,他在2011年創(chuàng)建了Google Brain——谷歌的深度學(xué)習(xí)項目,并且在去年加入百度前一直領(lǐng)導(dǎo)著該項目。百度撬走吳恩達被認為是科技界的一次政變。
他把百度位于加州Sunnyvale實驗室中的先進計算機比作“火箭引擎”,計算機中的軟件可以學(xué)習(xí)模擬人類思想的功能。在吳恩達教電子大腦聽和說時,它們的“燃料”就是他從百度在線視頻和音頻輸出資料庫中得到的數(shù)據(jù)。
百度在語音識別深度學(xué)習(xí)算法方面具有優(yōu)勢,因為中國大多數(shù)視頻和音頻都伴有文本——幾乎所有新聞剪輯、電視節(jié)目及電影都有詳細的字幕,而百度及其視頻子公司愛奇藝可以獲得幾乎所有此類內(nèi)容。
吳恩達說,一個典型的學(xué)術(shù)項目會利用2000小時的音頻數(shù)據(jù)來訓(xùn)練語音識別,但百度——中國版谷歌——擁有的龐大數(shù)據(jù)庫意味著他可以利用10萬小時。
他拒絕詳細說明額外9.8萬小時在多大程度上提升了其項目的精確度,但堅稱這至關(guān)重要。
“許多人低估了95%精確度與99%精確度之間的區(qū)別。這不是4%的“增量”提升;這是偶爾使用與始終使用之間的區(qū)別,”他說。
由于在漢語語音識別方面取得了巨大進步(漢語中的大量同音異義詞和語境的重要性使之極具挑戰(zhàn)),百度即將推出Deepspeech——一款類似于蘋果的Siri的語音識別軟件。
包括阿里巴巴、騰訊在內(nèi)的其他中國企業(yè)在人工智能方面也取得了進步,但主要得益于吳恩達的聲望,行業(yè)專家如今認為百度要領(lǐng)先于國內(nèi)同行,可與美國競爭對手Facebook、谷歌和IBM比肩。
“人工智能是寡頭壟斷行業(yè),”中國人工智能行業(yè)協(xié)會新智元(AI Era)創(chuàng)始人楊靜說,“這是一個巨頭間的游戲。”
百度通過在數(shù)據(jù)中心利用深度學(xué)習(xí)算法預(yù)測硬盤故障已經(jīng)可以每天節(jié)省1700萬元人民幣,而且還利用人工智能優(yōu)化廣告和相片的使用來提升點擊率。該公司并未透露在人工智能開發(fā)上共計投入多少資金。
盡管雄心勃勃,但要將深度學(xué)習(xí)轉(zhuǎn)變成賺錢的項目仍有很長一段路要走。
吳恩達毫無畏懼?!昂翢o疑問,(人工智能)正在創(chuàng)造巨大的經(jīng)濟價值;毫無疑問,這將繼續(xù)創(chuàng)造巨大的進步,”他說,“機器的學(xué)習(xí)方式與人類的學(xué)習(xí)方式之間仍存在巨大差距。”
- QQ:61149512