“当没有人看月亮时,月亮只以一定概率挂在天上;而当有人看了一眼后,月亮原来不确定的存在性就在人看的一瞬间突变为现实。”
——退相干理论
推荐算法的发展运用离不开UGC平台的兴盛。 UGC,全称为User-Generated
Content,即用户生成内容。从曾经以记者、作家等精英主导内容生产的局面中突破,崛起的草根式自我表达,开始占据社交平台,成为从web1.0过渡到web2.0时代的重要转折之一。
这时,社交平台媒体化,带来新闻编辑职业范围的外延,如版主、吧主等,都承担着为优质内容打上精选标签并分类的编辑职能。平台也会根据时间或者一些朴素的热度指标(点击量、点赞数、播放量等)来排序内容。用户数量和用户生产的内容随着时间同时飙升,单靠人工推荐或者单纯的时间或热度排序显得有些力不从心。
全球互联网用户生产的数据
1801401006020
160泽字节我们在此
2024*20252022202020182016201420122010
数据来源:IDC“数据时代2025”研究,希捷赞助
推荐算法就此被引入平台。
过往已有相当多的、对于揭示推荐算法之弊的研究,但我想在此呈现一个新角度,力图激发读者们对推荐算法权力给我们的思想带来的威胁的直观感受:推荐算法,让我们的想象力正在流失。
推荐算法市场俨然已经成为一个赛博美利坚大西部,越来越多的媒介和平台主体选择在此淘金。利益是人群的聚集力,也是人性的催化剂。推荐算法的引入后,传媒行业市场的膨胀,带来的是能角度介入其中的资本和主体的增长。
为了在日渐激烈的竞争中获利,许多隐性的问题渐显,而新的阴霾也同时浮现:个性化推荐让用户身陷信息茧房,造成了群众认知进一步地极化,更容易引发群体暴力;以兴趣为导向的推荐使人沉迷,放大人服从于舒适圈的心理弱点,损耗了其注意力和时间……
“当时,‘加利福尼亚山谷里到处都金子,河流里流尚的水都是金色的’,一时间,这样的流言传遍了美国,美国人争先恐后地涌入到加利福尼亚州山谷寻找金子。”
控制我们
想象的边界
点击以进入🎉
“想象力是无价的。孩子得有一个隐秘的世界,里头住着从来不存在的东西。她得相信,这很重要。她先得相信这些不属于人世的东西。”——《布鲁克林有棵树》
捍卫自我成为惯性,我们将如同巡逻的士兵一般出征评论区,沉溺于寻找更多的认同,或打赢论战的双机制“游戏”中,思想极化最终可能引发群体极化,而认知的故步自封,也限制住我们向想象的空间探索的脚步。
1.被限
制的认
知边界
在不知情的情况下,我们对一致的观点表达支持,或严词批驳反向观点,都会导向统一的结果:强化自我认同。当我们自由浏览评论内容的权利被无形之中剥夺时,我们扩展和更新认知的界限也在此被规定。
可类比的是,个人兴趣相关的内容是我们偏好上的喜欢,而无需加注思辨的娱乐化内容,是我们形式上的喜欢。当以上两者挤占着我们的平台主页之时,不仅让我们很难接通其他的信息渠道,还会消磨想象力和创造力。本可以用于想象和探索的时间,融化在长期刷短视频的注意力泡沫当中。
2.被限制的兴趣边界人很难离开自己感兴趣的东西,推荐算法和背后的算法工程师深谙此道。在个性至上的时代,能让我们之中的大部分人心甘情愿地交出自己的时间和精力的,唯有为我们的兴趣埋单。
我们在平台端留下的每一丝浏览和关注的痕迹,都会被转化成数据,以代码的形式织成一张“个性化推荐”的网,让“个人兴趣”填充我们的互联网生活。展现我们使用平台时的兴趣的方式,与“点击”“下滑”等微小的动作相伴随。仅在指掌之间的操作,却实际控制着你的头脑的摄入,这无疑是可怕的。
然而更可怕的是,关于推荐算法捕捉到我们的兴趣和强化偏好之间的先后顺序,试图分析的我们会陷入“先有鸡还是先有蛋”
的悖论。也就是说,我们无法确认是不是在推荐算法的强化下,我们的兴趣在一定程度上被塑造。
如果你有留心身边,一个事实含在其中:占据着大部分人主页的,是兴趣内容和娱乐化内容。
平台不断为我们提供我们喜欢的内容,如同每天将心爱的食物喂到人嘴边,“餍足”之后会让人产生沉迷和依赖。而娱乐化的内容则更像送货上门的快餐,让人觉得便利、轻松或者好消化,虽然不甚美味,但点餐已经成了习惯。此时我们已经分不清快餐算不算我们喜欢的餐饮了。
除此之外,我们失去的不仅仅是想象力,还有理性和公共意识。当个人被休闲娱乐内容包裹,充满着情绪和私欲的痴缠,会让人无法以理性的面貌关心公共领域;从个人偏好的“茧”中窥世界,假性安全感会造成对社会公共事件的淡漠和逃避。如此,舆论之力无法凝聚,理性对话无力开展,公共空间也最终只会解体成一滩散沙。
0
1
0
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
0
1
0
1
1
0
1
0
0
1
0
1
隐私权也是不可忽视的问题。恰合尺寸确实会带来舒适,但如果继续向内包裹,那便不再是量体裁衣。人越在平台留下使用痕迹,算法推测出的个人偏好就会越精准。没有人能保证这种精准的观测不会步步迈向如设牢笼一般的监控,挤压个人的私密空间与隐私权利。
使用引人讨论的标题、选择近日比较火热的舞蹈、修改bgm和衣饰,但小酱依然没有办法稳定地收获她想要的浏览量。未知和无法掌控的感觉,让小酱感觉焦虑。小酱和芭比,代表着她们背后数以万计的各社交平台的博主们。“明明作为用户时并不觉得那些内容有什么特殊的,但自己在做的时候就是没有人看。”他们绞尽脑汁地策划和生产内容,期待获得越多越好的流量和收益;他们对平台推流、限流的算法逻辑并不了解,只能从自己的生产内容下手,琢磨推送机制的同时,正在无意识地向平台希望他们产出的方向靠近,向流量最大化的“商业公式”靠近。#治好精神内耗##不婚主义#平台抛出了一个又一个能刺激用户的话题,培养了一批批以此为选题、讲着一样模版故事的博主,一边施以“引导性”的推流,一边靠贩卖用户注意力赚得盆满钵满。
这就是平台对用户“测敏”后,为我们构建的向往的生活——被构建的、为流量所支撑的成功学故事模版。博主口中的内容平台世界的运行规则,似乎成了一个与用户体验完全相反的故事。哪怕在自我嘲解时,我们也会说,平台是在为我们量身定制“茧房”。但似乎也有看不见的“暗流”,在载着我们走上“同质化”的前路。3.被限制的创作边界
关于内容创作,平台博主有他们自己的见解。
小酱是一名个人舞蹈博主,在抖音、小红书和视频号上都有账号,其中小红书账号粉丝量最多,已有2w+的关注。当被问到入行多久,小酱的回答是正式成为一名博主已经一年多,她是从自己对账号做了定位,策划发布频率和内容的时候开始计算的,并不包括前期更新日常的阶段。
平台不推流了,比如我视频号9w的粉丝量播放量却几千,很不正常。
然而,当被问到更新视频的动力,小酱坦然是因为想要维持流量和赚钱,当然,她也清楚两者是密切相关的。对于平台推流和限流的存在,小酱如有所感。但关于其背后的机制,小酱也不甚清楚,她也猜测可能是因为她的更新频率或者内容没有符合粉丝的要求,才导致数据的下降。在小红书的另一个领域,芭比也有同样的烦恼。她是一个运营了半年的旅游类plog博主,出于想打破那些华而不实的旅游美照分享、给网友们提供一些干货的初衷,自己开始经营旅游推荐软文。
如果因为个人原因无法更新,会有一种失业的感觉
搜索推荐笔记流量主要来源于搜索默认提示词
搜索发现
联想关键词65%
小红书的推荐算法主要围绕用户兴趣标签与用户的搜索推荐虽然在芭比心中,最有成就感的时刻是有游客在评论区留言说:笔记非常有用。但寥寥无几的点赞量和浏览量也同样困扰着她。
在因个人原因无法更新时,她感到
“会有一种失业的感觉”,担忧粉丝会自此弃她而去,她更换更好的拍摄设备,还会将自己的博文链接发到流量较大的评论区,为了提高浏览量,芭比做过以上的许多尝试,但都收效甚微。
#上岸##人生是旷野##裸辞#
“高手在民间?”
没有算法工程师的上帝视角,却要借此谋生的运营者,将平台机制消化成了一套切实可行的运营方案,有着一种近乎伟大地朴素智慧。但也有人在论坛宣称“一切声称摸清了抖音算法逻辑的人都是骗子,因为字节公司所有相关人员对外从来闭口不言”。行文至此,其实我们都还不算了解推荐算法。文章由外向内,先批驳了推荐算法流失的表达力、想象力和创造力,同时表达了作为内容生产者的迷惘,进而引入民间高手运营者们的落地认知,我们越来越接近推荐算法的运行机制。
无需再做感受和推理,我们来介绍推荐算法所涵盖的几类运行逻辑:
比起博主的迷茫与摸索,基本掌握利用推荐算法的平台机制,是运营者。他们有吸引用户目光的招数:
他们说:小红书这个平台上,是封面大于标题,标题大于文案,文案大于话题。
蹭热点
他们说:比如说做过一个小孩儿给当博物馆的讲解员,就说他是小孩儿哥,因为这个名词它在热榜。
仿爆款
他们说:自己慢慢的去摸索和创新的效果,远远不如你直接去模仿一篇爆款笔记的效果来的好。
夺三秒
他们说:从观众刷到视频到下滑刷走只有三秒,这是唯一吸引他们的机会。
做垂直
他们说:想要成为大流量up,在专不在杂,专注一个领域很重要。
贴Tag
他们说:手是女人的第二张脸,tag是帖子的第二度创作。
勤互动
他们说:在初始的起号阶段,增加和他人的互动是一种捷径,多个朋友多条路。
定时间
他们说:经营账号必须有自己的更新频率,找到最佳的发表时间,然后每次都照此发布。
缩时长
他们说:观众的耐心是珍贵的,通过缩短时长可以降低他们的戒备心,提高点击率和视频完播率。
走形式
通过分析用户行为与兴趣,算法找到与目标用户兴趣相似的“邻居”用户,并根据这些用户的评价推荐内容。通过分析用户的行为数据,挖掘行为与兴趣之间的关联,并利用算法推荐可能感兴趣的内容。该算法通过分析内容描述与用户的兴趣画像,计算匹配度并推荐高匹配度的内容。
以用户为核心以内容为核心基于协同过滤
到这里,我们可以回溯在上一部分的结尾留下的疑问:我们到底是被个性分割,还是被同质化控制了呢?答案是,两者正在同时发生。而背后的原因,则是因为种种运行机制不同的算法在交替影响着我们:一面,我们的个性和兴趣已经被算法捕捉,将我们分隔在不同的网域“气泡”中;另一面,我们所接收的内容中,包含着对兼取最大“兴趣”共性的流量规则。
“外面的世界,跟我给你的世界一样的虚假,有一样的谎言,一样的欺骗。”——《楚门的世界》
如果一夜之间失去算法,可以想象,我们又被重新推入信息海洋之中,终日费力搜寻有效的信息的同时,还要对已有的浏览成习做“戒断”。当然,依赖和成瘾只是一部分的心理因素,更重要的是,平台对推荐算法的开发和利用发展到如今,完全剥离算法的网络世界要建立在断绝已有利益的基础上,成为新条件下向往乌托邦的空想主义。而在用户心理依赖与算法发展现状的背后,还有一个本质性的原因——算法的诞生,本身并不是为了作恶。
如果没有推荐算法,人很难在一个内容平台有过分时长的停留:精选贴总是很快就能刷完,按时间排序的信息其价值密度并不高,容易厌倦。
算法的进击,则是新时代媒体的升级,利用新闻专业主义外的力量,以达成最大程度赚取用户注意力的目标。无论是对个性的捕捉逻辑,还是其背后的流量和商业运行规则,都是媒体行业从进入市场以来一直在争取和追求的。这不是操纵用户的魔咒,而是新闻业市场化的规则。而被凸显出的,也并非在互联网时代异化的群众,而是本身就流淌于血液中的人性之弊。
5000万
20162016年,抖音、火山小视频、头条视频(后西瓜视频)相继落地,基于移动端的直播市场正式爆发。同年,还在成长中的小红书推出了电商功能,其电商用户数从2400万上涨到了5000万。现有研究普遍认为正是在2016年,中国信息市场出现了算法推荐超越人工推送的现象。2400万
算法从来不需要取缔,而是管理,作为一种权力被管理。推荐算法被赋予了选择权,但这种权力与专家、编辑选择内容的传统方式有结构上的差别。用迈克尔·曼的比喻来说,推荐算法的权力是“弥散性”的,它的权力运行方式是潜移默化的,悄然缩小了信息的范围。人们从“我知道自己不知道”,转变为“我不知道自己不知道”。
算法模型、数据、算法设计开发活动是算法审计的首要对象和核心内容。一般而言,可以对算法输出的结果有四种审计方法:
非侵入式用户审计
即通过沟通了解用户对算法的使用体验,或在获得用户同意后检查其账户和使用痕迹,类似于审计的询证程序。
虚拟用户审计
通过编程模拟用户行为进行审计,涉及欺骗性问题,平台可能以此指控用户数据问题导致算法偏见。
又称协作审计,招募大量“测试人员”对算法进行测试,适用于用户基数大的平台,但成本较高。
众包审计
又称爬虫审计,审计师通过API直接抓取算法的输出结果,但此举可能触犯侵权问题,且许多平台已部署反抓取措施
抓取审计
而算法权力的相对膨胀,也是其影响力不断攀升的原因之一。媒体生产被分发环节影响,内容产出向商业逻辑靠拢,难以坚持引导理性和守望主流价值。作为“草根之声”的社交平台生产者,因推流机制被迫与算法逻辑共谋,在掌握发声权的一刻却也立即失其权利。当各项新闻与民主的权利让位于流量法则,最终会让算法“一手遮天”于社会主流声音的引领。
通过分析用户行为与兴趣,算法找到与目标用户兴趣相似的“邻居”用户,并根据这些用户的评价推荐内容。通过分析用户的行为数据,挖掘行为与兴趣之间的关联,并利用算法推荐可能感兴趣的内容。
当然,与一夜之间让推荐算法消失一样极端的,是让它实现对用户的完全透明。对于难以察觉、难以依靠群众力量做舆论监管的推荐算法领域,有关部门必须加强介入、细化管理,这个过程,就是完善算法审计的过程。
以用户为核心以内容为核心基于协同过滤
尾声“达摩克利斯抬头看到在自己的坐位上方天花板下,倒悬着一把锋利的长剑,剑柄只有一根马鬃系着,眼看就要掉在头上,吓得他离席而逃。"
达摩克利斯之剑
但推荐算法和其背后的平台绝非难以管束的邪恶势力。让我们重新回顾一开头给出的题记——达摩克利斯之剑背后的故事:让达摩克利斯吓得逃窜的确是头顶的宝剑,但让他坐上王座的,是他无法收敛的贪欲。当你与算法不谋而合,一次次地把对个人偏好和固有认知的选择推脱于顺从算法,在个人利益被无底线地满足之时,失控的欲念只会被心安理得地归罪于外因。
例如,你是否点击了右上角的铃铛呢?你是否点击了抖动的文字呢?你的视线是否总是被变化的文字所吸引?是否一切都在设计之中?
制作刘彦彤 欧阳星雨 蔡雨薇 李梦伊指导老师戴玉 刘萍
算法,是从效率上淘汰掉以往分发方式的全新机制,是媒介市场化大潮中诞生于商业逻辑的精确模型。推荐算法与平台运营的精密配合,已经让“注意力经济”的逻辑渗透入用户体验的各个环节。
无孔不入的推荐算法,如同悬挂于我们与这个时代头顶的达摩克里斯之剑。其起始逻辑是抓住个人偏好和情绪需求,而造成的种种结果,是从资本洗牌局中暴露的人性之弊:表面所见是爱好的满足、观点被认同和兴趣能聚拢,但实则始终无法逃开关于想象力蒸发、隐私被渗透、社会散漫失形和权利与权力沦丧的阴霾。而算法如今跃进的速度,远超于政策对其的管制,商业逻辑的灵活手腕扼着充斥着框架和程序的制度进速。
在此过程中,佯装无罪者的身份,也许最终会把你变成囚徒。
我们早已忘记最开始使用抖音时它是什么样的。当你第一次安装抖音,你看到的或许是自己不太熟悉的乡间风光、主播PK,或者是猫咪视频。但当你继续使用下去,抖音很快地就捕捉到了你的兴趣:你在这个视频停留更长,给某个博主经常点赞……抖音迅速地变成了只属于你的样子。
你是否注意过抖音的“内容偏好设置”功能?它藏在设置里的一个小角落,需要好一番力气才能被找到。
为了调整我们的兴趣偏好,我们需要经过五步,才能在抖音设置的一个小角落中找到它。
这个功能对抖音的推荐内容有多大影响呢?一项使用多个账号的测试曾将默认内容标签中的某个标签的推荐强度拉满,另外8个拉到最低值,重启抖音后观察调整后的内容推荐。
结果发现,对于已经使用很久的抖音账户而言,内容推荐在短时间内没有发生任何明显变化,在长时间上,主页的内容推荐才出现过了一些很早关注但很久没有被刷到过的内容。而对于几乎没有使用过抖音的新账户而言,主页推荐很快就变成了推荐强度拉满的内容。特别地,调整“内容偏好设置”只在短视频推荐发生了改变,但对于在抖音上有购物记录的账号而言,被推荐电商直播的频次并没有发生太大的变化。
我们使用抖音的时间越久,抖音就更加掌握我们的兴趣爱好。但本质上我们是先有了兴趣,而不是先有了抖音所提供的兴趣。抖音的“推荐”功能无法使我们真正地看到兴趣以外的世界,即使它提供了信息——一个繁荣的假象。
为什么我们如此担忧推荐算法对人们的影响?一方面,在推荐算法的影响下,没有一个人的抖音是相同的,我们几乎无法得知其他人的手机屏幕上,抖音展现了怎样的姿态。另一方面,我们只有极少数的方法能够对抗推荐算法给我们带来的影响,且需要付出一定时长的努力,如互动、反复搜索等来对抗它内部的稳定性。
最重要的是,这两点让我们几乎对推荐算法的内部机制一无所知,我们不知道它的内部如何运转,不知道它是否对于特定的地域、特定的人群一视同仁,我们甚至几乎感觉不到它从何时改变了我们。
基于这一点,我们尝试提供了一个更加宏观的视角来一窥在推荐算法下,我们所受到的影响。
在第三方抖音数据分析平台中,我们按地域、人群抽取一段时间的数据,统计抖音对于不同所在地域、不同人群的不同推送喜好。
相较于其他城市,超一线城市相比于其他城市被推送了更多更加严肃的内容、更加富含信息的短视频内容。随着城市的层次逐渐降低,短视频的内容和信息更多聚集在了低严肃、低信息的区域。
不同层次城市的抖音用户所看到的短视频信息密度和严肃程度分布
数据来源:抖查查视频库2024年6-7月数据,数据已经过标准化处理
评分标准:根据视频标题内容以及视频发布者的类型按0-1打分
备注:城市分类来源于2024第一财经·新一线城市研究所排行
在视频的娱乐化程度和信息密度上,用户的选择与平台的推送互为因果:更多的推荐让这一类的视频更加容易被点击和互动,而更多的互动会带来喜好的判定与更多的推荐,信息茧房由此而来。在用户的互动选择上,我们可以看到城市的层级越低,用户更多地选择在热度更低的视频上互动。热度更低的视频往往往意味着更加小的传播影响力与更加圈层化的内容。在这一层面上,可以看到在抖音中,随着城市级别的降低,人们的视野是逐渐收窄的。
不同层次城市的抖音用户所看到的视频热度与互动的关系
数据来源:抖查查视频库2024年6-7月数据,数据已经过标准化处理
备注:城市分类来源于2024第一财经·新一线城市研究所排行