張一鳴不裝了,抖音首次公開推薦算法
張一鳴想明白了,與其讓大眾懷疑,惹火燒身,不如自己坦白。
你有沒有試過一刷抖音就一整天,咧著個(gè)嘴,根本停不下來?有趣的視頻一刷一個(gè)贊,不感興趣的內(nèi)容直接點(diǎn)了個(gè)不感興趣就往上滑……
不知道從什么時(shí)候起,抖音就填滿了我們整個(gè)空余時(shí)間,它的推送機(jī)制也被很多人好奇,網(wǎng)友們對(duì)它的推薦算法熱烈討論、褒貶不一,其中很大一點(diǎn)在于“信息繭房”。
所謂“信息繭房”,用人話來說,就是一個(gè)人看的內(nèi)容太單一了,都只看自己喜歡的內(nèi)容,導(dǎo)致對(duì)一個(gè)事物只知其一不知其二。
比如,你喜歡甜豆腐腦,并且十分排斥咸豆腐腦,那么你就只會(huì)看夸甜豆腐腦和罵咸豆腐腦的視頻,算法也不會(huì)再給你推送夸咸豆腐腦的視頻,你慢慢就會(huì)認(rèn)為甜豆腐腦被更多人喜歡。由此,形成了一個(gè)關(guān)于豆腐腦的“信息繭房”。
對(duì)此,抖音上線了安全與信任中心網(wǎng)站,并于4月15日舉辦了“安全與信任中心開放日”活動(dòng),公開抖音算法,實(shí)現(xiàn)算法透明。

(圖源:抖音安全與信任中心)
一、抖音的推薦算法究竟是啥
根據(jù)抖音在“安全與信任中心”網(wǎng)站發(fā)布的《從零開始了解推薦系統(tǒng)》開看,抖音的推薦算法有兩種,傳統(tǒng)算法和優(yōu)化后的算法。
傳統(tǒng)算法是基于大數(shù)據(jù)的相似樣本分析。比方說,用戶 A 觀看了內(nèi)容 X、Y、Z,用戶 B 觀看了內(nèi)容 X、Z、W,那么X 和 Z 之間就有較高的相似度。
通過計(jì)算內(nèi)容之間的相似度,找到和你興趣相似的用戶,把他們感興趣的內(nèi)容也推薦給你。這就是“協(xié)同過濾”。
而優(yōu)化后的算法吃了人工智能,也就是AI的發(fā)展紅利。它依靠人工智能的分支之一——機(jī)器學(xué)習(xí),通過數(shù)據(jù)和算法使人工智能能夠模仿人類的學(xué)習(xí)方式,并逐漸提高準(zhǔn)確性。
這樣一來,算法無需理解“內(nèi)容類型”或“開心憤怒情緒”等現(xiàn)實(shí)語義,而是通過運(yùn)算,就能實(shí)現(xiàn)對(duì)用戶“看完”“點(diǎn)贊”“收藏”某個(gè)內(nèi)容的行為預(yù)測(cè)。
換句話說,以前的抖音推送主要依賴視頻內(nèi)容和標(biāo)簽。但現(xiàn)在,抖音可以通過你平時(shí)的點(diǎn)贊和收藏模擬出一個(gè)“你”,通過預(yù)測(cè)“你”的行為來推送內(nèi)容給真實(shí)的你。
至于“信息繭房”問題,抖音在《算法和用戶都想打破“信息繭房”》一文里還表示,實(shí)踐發(fā)現(xiàn),只推薦單一內(nèi)容會(huì)使用戶很快厭倦,導(dǎo)致用戶體驗(yàn)與活躍度下降。
因此,抖音自己也想打破“信息繭房”,實(shí)質(zhì)上就是平衡推薦的精準(zhǔn)性和多樣性。
主要方法有兩個(gè):一是通過興趣多樣性覆蓋和幫助用戶探索更多新興趣,實(shí)現(xiàn)多樣化推薦;
二是推薦內(nèi)容建立多目標(biāo)反饋,核心在于同時(shí)設(shè)置和優(yōu)化多種不同的目標(biāo)的計(jì)算方式,以構(gòu)建更全面平衡的推薦策略嗎,以此滿足用戶、平臺(tái)或創(chuàng)作者的多樣化需求。
總結(jié)一下,就是讓你喜歡的視頻類型更多,同時(shí)讓創(chuàng)作者產(chǎn)出的更多種類、更優(yōu)質(zhì)的內(nèi)容吸引你。


(圖源:微博)
二、算法也有“不靠譜”的時(shí)候
不過,別高興太早,由于技術(shù)等原因的限制,目前抖音的推薦算法還未到達(dá)“讀心術(shù)”的境界,有時(shí)反倒像個(gè)反應(yīng)慢半拍又過度熱情的推銷員,讓你既愛又恨,只能默默吐槽。
你有沒有經(jīng)歷過,當(dāng)你咬牙決定減肥,算法卻像失憶了一樣,在夜深人靜的時(shí)候,推送炸雞點(diǎn)心轟炸你的味蕾、刺激你的食欲,讓你在想吃和不能吃之間來回拉扯。
當(dāng)你終于準(zhǔn)備刷會(huì)手機(jī)就睡覺了,算法又跑出來給你推送優(yōu)質(zhì)的長(zhǎng)視頻,可謂是不知不覺被吸引,眼睛一睜又兩點(diǎn)。
這體現(xiàn)出了推薦算法的滯后性。推薦算法跟不上需求的變化,導(dǎo)致我們只能一邊對(duì)遲到的推送內(nèi)容表示無奈,一邊又被優(yōu)質(zhì)推送內(nèi)容深深吸引。

(圖源:微博)
“我剛在淘寶下單枕頭,一打開抖音整個(gè)頁面全是枕頭,誰懂?。 ?/p>
你或許也經(jīng)歷過這樣的事情,不知道為什么,不感興趣的內(nèi)容會(huì)一直被推薦,而感興趣的內(nèi)容即使專門搜索也不會(huì)被推薦,讓人感覺十分霸道。
好似一旦推薦算法確定了你對(duì)某個(gè)事物的興趣,它的推送就會(huì)如洪水泛濫一般,無處不在。
這也是抖音算法仍然不完善的體現(xiàn)之一,對(duì)“你”的模擬還不夠充分,因此沒能準(zhǔn)確抓住我們的興趣,反而是讓不感興趣的內(nèi)容充斥用戶頁面,讓用戶體驗(yàn)大打折扣。

(圖源:微博)
除此以外,有時(shí)抖音的推送太精準(zhǔn)了反而會(huì)讓人吃驚,然后疑惑“它是怎么知道的”,然后自然而然地?fù)?dān)心“我是不是被竊聽了啊”。
比如剛和朋友語音說想養(yǎng)貓,轉(zhuǎn)頭抖音就推送貓糧廣告;辦公室吐槽咖啡難喝,下午刷到三條"自制拿鐵教程"……
這樣的巧合在網(wǎng)上經(jīng)常能看見,這也是人們對(duì)抖音爭(zhēng)論不休的原因之一。
這次算法公開,抖音也明確回應(yīng)了這個(gè)問題。在《App會(huì)“竊聽”用戶談話嗎》一文中,明確說app并不會(huì)竊聽,原因有三:
第一,經(jīng)濟(jì)成本高昂。
一個(gè)每日活躍用戶量達(dá)到1億的App,保持常年“竊聽”的成本將達(dá)到數(shù)千億元,而在用戶日常對(duì)話中,真正具有廣告價(jià)值的有效信息比例極低。這就使得竊聽的性價(jià)比極低。
第二,技術(shù)上也不存在竊聽的可能。
技術(shù)上看,一旦手機(jī)被“偷聽”,手機(jī)耗能會(huì)異常增加,出現(xiàn)掉電過快、發(fā)熱發(fā)燙、CPU和內(nèi)存占用高等現(xiàn)象,并且在沒有開啟權(quán)限的情況下,如果App進(jìn)行“偷聽”,超過1分鐘會(huì)被操作系統(tǒng)切斷,難以維持長(zhǎng)期偷聽狀態(tài)。
第三,法律法規(guī)有明確的規(guī)定。
按照相關(guān)法律要求,App需經(jīng)用戶明確授權(quán)同意后才有權(quán)限訪問手機(jī)麥克風(fēng)。因此,正規(guī)的手機(jī)系統(tǒng)在收集聲音數(shù)據(jù)方面有嚴(yán)格限制。
那么,這種“被竊聽”的感覺從何而來呢?抖音在文中列出了兩個(gè)原因。
一方面,是跨平臺(tái)營(yíng)銷,也被稱為 “程序化廣告”,具體是指廣告主根據(jù)用戶在其應(yīng)用中的偏好,在用戶當(dāng)前使用的 App 上進(jìn)行的廣告展示。
比如,如果A電商平臺(tái)是B社交平臺(tái)的廣告主,那么當(dāng)用戶在A電商平臺(tái)搜索了一款貓糧,再打開了B社交平臺(tái),就會(huì)發(fā)現(xiàn)B平臺(tái)也在推薦貓糧。
這并不是B平臺(tái)對(duì)用戶做了監(jiān)控,而是B平臺(tái)通過程序化廣告利用A平臺(tái)的數(shù)據(jù)定向給用戶展示了廣告,實(shí)現(xiàn)跨平臺(tái)的廣告營(yíng)銷。
另一方面原因就是“幸存者偏差”,人們會(huì)將反常的巧合放大從而誤認(rèn)為這是必然發(fā)生的事情。
三、算法公開的影響
抖音把算法透明的做法無疑會(huì)帶來一系列影響。
首先,算法透明有助于解決抖音一直以來被質(zhì)疑算法的問題;
其次,有助于增強(qiáng)公對(duì)平臺(tái)算法的理解,適應(yīng)大數(shù)據(jù)時(shí)代;
最后,有利于增強(qiáng)公眾對(duì)眾平臺(tái)的信任,既滿足用戶的安全感,又增進(jìn)了抖音用戶粘性。
然而,也要認(rèn)清,目前推薦算法仍不完善,還有巨大的改善空間。我們可以期待,隨著抖音推薦算法的進(jìn)步,我們的日常使用體驗(yàn)會(huì)發(fā)生怎樣的改變。
另外,對(duì)于優(yōu)化后的推薦算法是否真的能破除“信息繭房”,也有人對(duì)此保持懷疑態(tài)度。畢竟即便有多樣化推薦,我們?nèi)詴?huì)天然地被自己喜歡的東西吸引,而排斥不感興趣的事物。

(圖源:微博)
綜合來看,抖音算法透明互聯(lián)網(wǎng)發(fā)展有十分積極的意義,也能推動(dòng)信息社會(huì)對(duì)人的關(guān)注的發(fā)展,但想要真正破除“信息繭房”仍需各方付出巨大努力。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
