劉德寰:標(biāo)簽推薦都是偽推薦,未來數(shù)據(jù)分析是分析人
目前很多的標(biāo)簽推薦都是偽推薦,未來數(shù)據(jù)分析應(yīng)該首先完善人的緯度,未來的數(shù)據(jù)分析就是分析人。
原創(chuàng)
2016-04-20 21:27:38

【釘科技訊】UBDC全域大數(shù)據(jù)峰會?2016在北京舉辦。北京大學(xué)社會學(xué)博士、北京大學(xué)新媒體研究院教授劉德寰在“無數(shù)據(jù)不智能”的主論壇上,圍繞“有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說及意義”進(jìn)行演講。他直言,目前很多的標(biāo)簽推薦都是偽推薦,未來數(shù)據(jù)分析應(yīng)該首先完善人的緯度,未來的數(shù)據(jù)分析就是分析人。

劉德寰提出了有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說:第一個(gè)路徑,未來數(shù)據(jù)分析就是分析人,完善人的緯度。第二個(gè)路徑,對物的緯度探測,基于人的認(rèn)知習(xí)慣。

他進(jìn)一步介紹這兩個(gè)假設(shè):每個(gè)非人的事物都由一個(gè)確定的N維空間,而且N可以從人的認(rèn)識能力角度定義。他特別以tesco作為案例,這家企業(yè)不僅針對每一個(gè)商品都會進(jìn)行20緯度的打分,同時(shí)也會根據(jù)進(jìn)店顧客進(jìn)行全面的分析。

以下為劉德寰速記實(shí)錄:

非常高興跟大家分享,因?yàn)檫@個(gè)話題我考慮非常多的時(shí)間了。我今天要講的實(shí)際上有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說極其意義。因?yàn)楝F(xiàn)在大數(shù)據(jù)已經(jīng)跟我們在一起,我們只有不讀書才會談那些,現(xiàn)在這個(gè)時(shí)候需要反思大數(shù)據(jù)的問題,這個(gè)題的起源于什么呢?

起源于幾個(gè)問題,第一問題是人類行為93%是可以預(yù)測的?我講的不好就低頭看手機(jī),我講的好就照相,這些預(yù)測的東西有多少我們可以做的呢?我在用另外一個(gè)科學(xué)數(shù)據(jù)來說,人和人之間的差異,DNA上差異,原來說是0.1%,現(xiàn)在是0.3%,大家記住99.9%和99.7%是一致的,這個(gè)問題實(shí)際上是特別本質(zhì)的問題,不要說我拿一個(gè)數(shù)就能夠算出來說對人的差異,個(gè)性化能夠算出來,因?yàn)檫@是一個(gè)數(shù)列問題??吹诙€(gè)現(xiàn)象,兩個(gè)數(shù)這兩個(gè)人90%的相似度,但是人的行為有多少呢?按幾十億次來算,幾十億次幾百萬億次的行為,當(dāng)中如果有90%的相似度,會如何?

日常生活當(dāng)中經(jīng)常有現(xiàn)象,兩個(gè)人的對話,這是前兩天的對話,審美疲勞不喜歡了,原來特別喜歡,現(xiàn)在有點(diǎn)煩,另外一個(gè)人說我也是,真的有點(diǎn)煩人,我們的數(shù)據(jù)去推斷人的時(shí)候我們考慮這些因素了嗎?

再看一個(gè),深度學(xué)習(xí),確實(shí)名詞都很炫,實(shí)際上集體學(xué)習(xí)分了層級,層次不同而已,深度學(xué)習(xí)面臨本質(zhì)問題,實(shí)際上主要做的原來集體學(xué)習(xí)當(dāng)中,太隨意,我不斷優(yōu)化這個(gè)模型,但是深度學(xué)習(xí)一直在用于圖像、視頻,這些包括文字學(xué)習(xí)當(dāng)中,有誰說過對人的學(xué)習(xí)了嗎?因?yàn)槟切┪锸遣蛔兊?。只要出來了就放在那兒不變的,人是變的。所以我今天要談四個(gè)問題。

第一個(gè)問題是推薦算法及問題,第二個(gè)有效運(yùn)算的原則,然后我提出兩個(gè)假說??匆幌卢F(xiàn)在推薦算法當(dāng)中大數(shù)據(jù)運(yùn)算什么東西比較容易,已經(jīng)解決的問題都是比較容易的,抓取簡單的運(yùn)算,簡單表格的運(yùn)算,數(shù)據(jù)可視化這些都比較容易,只要把經(jīng)典算法學(xué)過來,簡單改進(jìn),現(xiàn)在多的不得了,改進(jìn)一下應(yīng)用到現(xiàn)實(shí)當(dāng)中不難。但是難的問題是什么?效果,如何改進(jìn)效果,這是一個(gè)天大的難題。

人們?yōu)g覽行為那么快,我們一定要在這個(gè)基礎(chǔ)問題上用MODElbased.我們現(xiàn)在習(xí)慣于打標(biāo)簽,以相似鄰居推薦而且算法絕對不是基于人性和生活,而是基于商業(yè),大量的過度泥和。

不要把一個(gè)變量理解為一個(gè)維度,一個(gè)變量是N個(gè)維度。這個(gè)時(shí)候我們在數(shù)據(jù)運(yùn)算的時(shí)候,任何一個(gè)人的行為都是無規(guī)律的,但是人的生活方式是很有規(guī)律的,我們發(fā)現(xiàn)十年后看到人一點(diǎn)都沒有變,生活方式、價(jià)值觀、表現(xiàn)形式一點(diǎn)都沒變,這是在常人的建立。但是人的態(tài)度、情緒、場景都不一樣,怎么可能規(guī)律呢?人是能變的,群的行為的規(guī)律是穩(wěn)定的,這個(gè)分群不是一個(gè)行為的迭加,它是一種生活方式的展現(xiàn)。在這個(gè)當(dāng)中,群是可感知,可評判,一個(gè)人可以處于N個(gè)。我們在原來發(fā)現(xiàn)中有一個(gè)小群體,在移動互聯(lián)網(wǎng)里中,技術(shù)紅顏,35到45歲的女性,買手機(jī),消費(fèi)當(dāng)中都有技術(shù)最前面的手機(jī),追求技術(shù),我們這撥人引領(lǐng)了什么?技術(shù)紅顏的是從年輕果粉中出現(xiàn)的。大家可以看技術(shù)紅顏引發(fā)的技術(shù)旋風(fēng)。接下來他演化成了巨大的趨勢和族群,形成了新的潮流,這個(gè)潮流叫熟女經(jīng)濟(jì)之微博移動化。他也引領(lǐng)了網(wǎng)購,他同時(shí)引領(lǐng)了整個(gè)產(chǎn)業(yè)潮流的變遷,他把整個(gè)安卓新的崛起,背后都跟這個(gè)小族群有非常大的聯(lián)系關(guān)系。

群的穩(wěn)定,一看蘋果的客戶一直是M型,它是穩(wěn)定的,它在運(yùn)算當(dāng)中是可行的。所以第一個(gè)假說對象是人,第二個(gè)假說對象于物。有兩個(gè)假說:每個(gè)非人的事物都由一個(gè)確定的N維空間,而且N可以從人的認(rèn)識能力角度定義。每一個(gè)不同的物品,N維不一定一樣,但是相似,只是一個(gè)數(shù)量的變化。TESCO把每一個(gè)產(chǎn)品都用20個(gè)維度打標(biāo)簽,這件事情有多簡單,我在推送的時(shí)候,OK,新聞喜歡這個(gè)東西,這個(gè)東西在時(shí)尚上打分是39.2,同時(shí)他還喜歡這個(gè)東西,這個(gè)東西在技術(shù)產(chǎn)品當(dāng)中打分是90分,再找一個(gè)產(chǎn)品,大家說這個(gè)效率要高于多少其它的事情。真正在預(yù)算當(dāng)中,我自己認(rèn)為這種方式可以融入社科的所有思想,所有搞計(jì)算機(jī),便成的人,非常多的程序員整天說的話都不是人話,對其它的行業(yè)一點(diǎn)不了解,大家覺得這事靠譜嗎?這讓我想起了東方不敗。大家可以看看亞馬遜,亞馬遜在這方面也在進(jìn)行探索,這實(shí)際是運(yùn)算邏輯本身要反歸人性,我們要向社會學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)、政治學(xué)、傳播學(xué),所有學(xué)科,我們要學(xué)習(xí)他們已有的知識,把已有的知識穩(wěn)定到我們的計(jì)算當(dāng)中,我相信那種運(yùn)算規(guī)則不僅效率高,而且簡單。所以我基本感覺在未來的運(yùn)算當(dāng)中,有兩個(gè)東西,就是剛才說的這兩條路徑可能是未來。之所以是假說,是因?yàn)闆]有大規(guī)模實(shí)施,但是它在邏輯和實(shí)踐上是有前提的。

第一個(gè)路徑分析人,完善人的維度。第二個(gè)路徑對物探測,他必須是基于人的認(rèn)識和習(xí)慣,這兩條路徑不僅效率高,穩(wěn)定性高,同時(shí)能帶來未來的各自分析的可能性,同時(shí)可對可實(shí)現(xiàn)。

最新文章
1
趙明離職,榮耀兩大看點(diǎn):IPO與份額止跌
2
TCL智能鎖數(shù)字化工廠落地,研產(chǎn)銷服一體化,構(gòu)建起全鏈路品控體系
3
一加國補(bǔ)方案出爐,1月20號起立減15%、至高優(yōu)惠500元!
4
蘋果在中國又開了一家新店,但銷量大跌了25%
5
2024年冰洗市場總結(jié)及2025年展望
6
2025年量子芯片將行至何處?
7
以舊換新國補(bǔ)2025年將延續(xù),預(yù)計(jì)2025年中國電視市場增長1.4%
8
2024年熱水器市場報(bào)告:以舊換新政策帶動市場回暖與結(jié)構(gòu)改善
9
2024年國內(nèi)智能手機(jī)市場迎來復(fù)蘇,vivo以17%的市場份額領(lǐng)跑
10
iOS 18.3 Beta 3上線:蘋果屢屢翻車的功能被禁用
11
折疊屏與AI,誰會是2025智能手機(jī)市場最大亮點(diǎn)?
12
創(chuàng)維百吋電視銷量中國第一,強(qiáng)勢領(lǐng)跑
13
消滅藥丸屏!蘋果屏下Face ID專利曝光
14
追覓、石頭掃機(jī)器加裝機(jī)械臂,國產(chǎn)清潔電器越來越像“機(jī)器人”了
15
力推全棧聯(lián)動式大規(guī)模創(chuàng)新,亞馬遜云科技加速生成式AI價(jià)值釋放
16
達(dá)人探訪海信研發(fā)中心,親身體驗(yàn)“開機(jī)3分鐘,滿屋是新風(fēng)”
17
業(yè)界唯一!科大訊飛發(fā)布首個(gè)基于全國產(chǎn)算力的深度推理大模型X1
18
斥資134億收購LGD工廠,TCL科技押注LCD市場勝算幾何?
19
12月中國電視整機(jī)出貨量378.5萬臺,同比增長9.7%
20
京東方拿下美國專利榜全球第12!顯示領(lǐng)域唯一中企
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512