Vitalik 评 X 的 Community Note 社媒实验:抵抗两极分化和去中心化的加密精神
2023-08-16 19:51
Vitalik Buterin
2023-08-16 19:51
订阅此专栏
收藏此文章
「X 的 Community Notes 功能是主流世界中最接近『加密价值』实例的东西。」


原文标题:《What do I think about Community Notes?

撰文:Vitalik

编译:Yvonne,MarsBit


过去两年,X (Twitter )可以说是风云变幻。去年,埃隆·马斯克(Elon Musk)以 440 亿美元的价格收购该平台,之后对公司的人员配置、内容管理和商业模式进行全面调整,对该网站的文化进行的改变更不用说,这些改变可能更多地源于埃隆的软实力,而非具体的政策决策。但在这些备受争议的行动中,Twitter 上的一个新功能变得非常重要,并且似乎受到了各个政治派别的人们的喜爱:社区笔记(Community Notes)。



社区笔记是一种事实核查工具,有时会在推文上附加上下文注释,就像上面 Elon 的推文一样,作为事实核查和反错误信息的工具。它最初被称为 Birdwatch,并于 2021 年 1 月首次作为试点项目推出。从那以后,它分阶段扩张,扩张最快的阶段恰逢去年 Twitter 被 Elon 收购。今天,社区笔记经常出现在 Twitter 上,这些 Twitter 上有很多用户,包括那些有争议的政治话题。在我看来,以及在我交谈过的政治领域的许多人看来,这些笔记,当它们出现时,是有信息的和有价值的。


但是社区笔记最让我感兴趣的是,尽管它不是一个「加密项目」,但它可能是我们在主流世界中看到的最接近「加密价值」实例的事物。社区笔记不是由一些集中选出的专家编写或策划的;相反,它们可以由任何人编写和投票,哪些注释显示或不显示完全由开源算法决定。Twitter 站点提供了详细而广泛的指南,描述了该算法的工作原理,你可以下载包含已发布的注释和投票的数据,在本地运行该算法,并验证输出是否与 Twitter 站点上可见的内容匹配。它并不完美,但却出人意料地近于满足可信中立的理想,同时,即使在有争议的情况下,它的实用性也令人印象深刻。


社区笔记算法是如何工作的?


任何拥有符合某些条件的 Twitter 账户的个人(基本上:活跃 6 个月以上,最近没有违规行为,经过验证的电话号码)都可以注册参与社区笔记。目前,参与者正在缓慢而随机地被接受,但最终计划是让任何符合标准的人进入。一旦你被接受,你可以首先参与对现有笔记进行评分,一旦你做出了足够好的评分 ( 通过查看哪些评分与该笔记的最终结果相匹配来衡量 ),你也可以自己写笔记。


当你写笔记时,该笔记将根据从其他社区笔记成员那里收到的评论获得分数。这些评论可以被认为是按照 HELPFUL、SOMEWHAT_HELPFUL 和 NOT_HELPFUL 的 3 分制进行的投票,但评论还可以包含一些在算法中发挥作用的其他标签。根据这些评论,一个笔记会得到一个分数。如果该笔记的分数在 0.40 以上,则显示该笔记;否则,不显示注释。


该算法的独特之处在于计算分数的方式。与更简单的算法不同,后者的目标是简单地计算用户评分的总和或平均值,并将其作为最终结果,社区笔记评分算法则明确地尝试优先考虑从不同角度获得正面评分的笔记。也就是说,如果那些通常对笔记评分方式持不同意见的人最终同意某个特定的笔记,那么该笔记的得分就会特别高。



让我们深入了解其工作原理。我们有一组用户和一组笔记;我们可以创建一个矩阵 M,其中 Mij 表示第 i 个用户如何评价第 j 个笔记。

对于任何给定的笔记,大多数用户没有对该笔记进行评分,因此矩阵中的大多数条目将为零,但这没关系。算法的目标是创建一个四列的用户和笔记模型,为每个用户分配两个我们可以称之为「友好度」和「极性」的统计数据,为每个笔记分配两个我们可以称之为「有帮助度」和「极性」的统计数据。该模型试图预测矩阵作为这些值的函数,使用以下公式:


请注意,我在这里引入了 Birdwatch 论文中使用的术语,以及我自己的术语,以便为变量的含义提供数学直觉(mathematical intuition):


  • μ是一个「一般公众情绪」参数,说明用户总体评分的高低。
  • iu 是用户的「友好度」:该用户给出高评分的可能性有多大。
  • in 是一条笔记的「有用性」:该笔记获得高评价的可能性有多大。
  • fu 或者 fn 是用户或笔记的「极性」:其在政治极化主导轴中的位置。在实践中,负极性大致表示「左倾」,正极性表示「右倾」,但请注意,极化轴是在分析用户和笔记时突然发现的;左派和右派的概念并不是硬编码的。


该算法使用一个非常基本的机器学习模型 ( 标准梯度下降 ) 来找到这些变量的值,这些值可以最好地预测矩阵值。一个特定笔记被赋予的「有用性」是该笔记的最终分数。如果一个笔记的有用性至少为 +0.4,则显示该笔记。


这里的核心巧妙之处在于,「极性」术语吸收了导致某些用户喜欢而其他用户不喜欢的笔记属性,而「有用性」术语仅衡量笔记具有的导致所有用户喜欢的属性。因此,选择有帮助的笔记可以识别得到跨群体认可的笔记,而选择以另一个群体厌恶为代价而得到一个群体欢呼的笔记。


我做了一个基本算法的简化实现;你可以在这里找到它,欢迎使用它。


现在,以上只是对算法核心的描述。在现实中,有很多额外的机制固定在上面。幸运的是,它们在公共文档中有描述。这些机制包括:


该算法运行多次,每次都会向选票中添加一些随机生成的极端「伪选票」。这意味着算法对每个笔记的真实输出是一个值范围,最终结果取决于从该范围中获取的「较低置信范围」,该范围是根据 0.32 的阈值进行检查的。


如果许多用户(尤其是与笔记极性相似的用户)认为笔记「没有帮助」,而且他们还指定了相同的「标签」( 例如:「争论或有偏见的语言」,「来源不支持笔记」) 作为他们评级的原因,说明发布所需的有用性阈值从 0.4 增加到 0.5(这看起来很小,但在实践中非常重要)。


如果笔记被接受,则其有用性必须下降到低于最初接受笔记所需的有用性阈值 0.01 点,才能取消接受。


该算法在多个模型上运行更多次,这有时可以提升原始有用性得分在 0.3 到 0.4 之间的注释。


总而言之,你将得到一些相当复杂的 python 代码,总计 6282 行,横跨 22 个文件。但它是完全开放的,你可以下载笔记和评级数据并自己运行它,看看输出是否与任何给定时刻 Twitter 上的实际内容相对应。


那么,这在实践中看起来如何呢?



也许该算法中最重要的一个想法就是我所说的「极性」值,它与天真地从人们的投票中获取平均分不同。算法文档称其为 fu 和 fn,使用 f 表示因子,因为这是相互相乘的两项;更通用的语言部分是因为希望最终使 fu 和 fn 是多维的。


极性同时分配给用户和笔记。用户 ID 和底层 Twitter 帐户之间的链接被有意地隐藏起来,但笔记是公开的。在实践中,算法产生的两极分化,至少对于英语数据集来说,非常接近于左翼和右翼的政治光谱。


以下是一些极性在 -0.8 左右的笔记:



图表翻译如下:


1.反跨性别言论被一些保守的科罗拉多州议员放大,其中包括美国众议员劳伦·伯特,她在科罗拉多州倾向共和党的第三国会选区以微弱优势赢得连任,该选区不包括科罗拉多斯普林斯。(-0.800)


2.在 2020 年大选前的几个月里,特朗普总统确实破坏了美国人对选举结果的信心执行 Twitter 的服务条款并不是干涉选举。(-0.825)


3.2020 年的选举是在自由、公正的情况下进行的。(-0.818)


请注意,我并不是在刻意挑选;这些实际上是 scored_notes 中的前三行。当我在本地运行它时,算法生成的 tsv 电子表格具有小于 -0.8 的极性分数 ( 在电子表格中称为 coreNoteFactor1)。


这是一些极性在 +0.8 左右的笔记。事实证明,其中许多人要么是用葡萄牙语谈论巴西政治的人,要么是特斯拉的粉丝愤怒地反驳对特斯拉的批评,所以让我挑选另一些内容:



图表翻译如下:


1.根据 2021 年数据,64% 的「黑人或非裔美国人」儿童生活在单亲家庭。(+0.809)


2.与滚石乐队声称贩卖儿童是「与 Qanon 阴谋论」相反,这部电影准确地描述了拐卖儿童是一个真实而巨大的问题。「地下铁路行动」与多国机构合作打击这一问题。(+0.840) 


3.这些 LGBTQ+ 儿童书籍被禁的例子如下: 这些书是淫秽的,不受美国宪法作为言论自由的保护。 联邦法律严格禁止向未成年人传播淫秽物品。(+0.806)


再次值得提醒的是,「左与右的划分」并没有以任何方式硬编码到算法中;这是通过计算发现的。这表明,如果你将该算法应用到其他文化背景中,它可以自动检测出他们的主要政治分歧是什么,并在这些分歧之间架起桥梁。


同时,获得最高帮助的笔记如下所示。这一次,因为这些笔记实际上是在 Twitter 上显示的,所以我可以直接截图:


还有另一个:


第二篇文章更直接地触及了高度党派化的政治主题,但它是一个清晰、高质量和信息丰富的笔记,因此得到了较高的评价。总而言之,算法似乎是有效的,并且通过运行代码来验证算法输出的能力似乎是有效的。


我如何看待该算法?


在分析该算法时,最让我震惊的是它有多么复杂。首先是「学术论文版」,用梯度下降法找到最适合五项向量和矩阵方程的方法,继而是真正的版本,这是一系列复杂的算法的不同执行,其中有很多任意系数。


即使是学术论文版本也隐藏了复杂性。它优化的方程是一个 -4 次方程(因为有一个 -2 次方程 fu*fn 项在预测公式中,并复合成本函数测量误差的平方 )。在任意数量的变量上优化 2 次方程几乎总是有一个唯一的解决方案,你可以用相当基本的线性代数来计算,而在许多变量上优化 4 次方程通常有许多解决方案,因此多轮梯度下降算法可能会得到不同的答案。输入的微小变化很可能导致下降从一个局部最小值翻转到另一个,显著改变输出。


这和我参与研究的算法 ( 比如二次融资 ) 之间的区别,在我看来就像是经济学家算法和工程师算法之间的区别。经济学家的算法,在最好的情况下,价值是简单,相当容易分析,并具有明确的数学性质,表明为什么它是最优 ( 或最不坏 ) 的任务,并理想地证明了一个人试图利用它可以造成多大损害的界限。另一方面,工程师的算法是反复试验和错误的结果,看看在工程师的操作环境中哪些有效,哪些无效。工程师的算法是实用的,可以完成工作;经济学家的算法在面对意外情况时不会完全失控。


或者,正如受人尊敬的网络哲学家 roon( 又名 tszzl) 在一个相关话题上所说的那样:



当然,我想说的是,加密货币的「理论美学」方面是必要的,它可以精确地区分实际上不可信的协议和看起来很好,似乎工作得很好,但实际上需要信任几个中心化参与者——或者更糟的是,实际上最终是彻底的骗局。


深度学习在正常情况下是有效的,但它对各种对抗性机器学习攻击具有不可避免的脆弱性。如果做得好,技术陷阱和高度抽象的逻辑结构可能会对这些攻击具有相当强大的防御能力。因此,我有一个问题:我们能否将社区笔记本身转变成更像经济学算法的东西?


为说明这在实践中意味着什么,让我们来探讨一下我几年前提出的一个类似目的的算法:有界二次融资。


成对有界二次元融资的目标是填补「常规」二次融资中的漏洞,即即使两个参与者相互勾结,他们也可以各自向一个假项目贡献大量资金,该项目将资金返还给他们,并获得大量补贴,从而耗尽整个资金池。在成对二次资助中,我们为每对参与者分配有限的预算 M,该算法遍历所有可能的参与者对,如果算法决定给某个项目增加补贴 P 双方参与者 A 和参与者 B 支持它,补贴来自分配给两人的预算(A,B)。因此,即使 K 如果参与者串通一气,他们最多可以从该机制中窃取金额:


这种形式的算法不太适用于社区笔记环境,因为每个用户投的票很少:平均而言,任意两个用户的共同投票数正好为零,因此,通过单独查看每对用户,算法无法了解用户的极性。机器学习模型的目标正是试图从非常稀疏的源数据中「填充」矩阵,这些源数据无法以这种方式直接分析。但这种方法的挑战在于,它需要付出额外的努力,才能在面对几张差票的情况下,使结果不会高度波动。


社区笔记真的能对抗两极分化吗?


我们可以做的一件事是分析社区笔记算法是否实际上能够对抗两极分化,也就是说,它是否实际上比朴素的投票算法做得更好。朴素的投票算法已经在一定程度上对抗两极分化:一篇获得 200 票赞成和 100 票反对的帖子比一篇只获得 200 票赞成的帖子效果更差。但社区笔记是否比这更好呢?


抽象地看算法,很难分辨。为什么一个平均高评分但极化的帖子不会有很强的极性和很大的帮助?这个想法是,极性应该「吸收」一个笔记的属性,使它在这些投票相互冲突的情况下获得很多投票,但它真的这样做了吗?


为验证这一点,我运行了自己的简化实现(100 轮)。平均结果如下:



在本次测试中,「好」笔记从同一政治派别的用户那里得到 +2 的评分,从相反政治派别的用户那里得到 +0 的评分,而「好但极端」的笔记从相同派别的用户那里得到 +4 的评分,从相反派别的用户那里得到 -2 的评分。相同的平均值,但极性不同。事实上,「好」的笔记比「好但特别极化」的笔记得到了更高的平均帮助度。


拥有更接近「经济学家算法」的另一个好处是,可以更清楚地了解算法是如何惩罚两极分化的。


高风险的情况下有多大用处?


我们可以通过观察一个特定的情况来了解这是如何实现的。大约一个月前,伊恩·布雷默 (Ian Bremmer) 抱怨称,中国政府官员在推文中添加的一条高度批评的社区注释。


(该笔记目前已经看不见了。截图来自 Ian Bremmer)


情况很复杂。在一个很好的以太坊社区环境中进行机制设计是一回事,在这个环境中,最大的投诉是向一个两极分化的 Twitter 影响者支付 2 万美元。在影响数百万人的政治和地缘政治问题上这样做是另一回事,在这些问题上,每个人 ( 通常是完全可以理解的 ) 都抱着最大的恶意。但如果机制设计师想要对游戏世界产生重大影响,那么参与这些高风险的环境便是必要的。


就 Twitter 而言,人们怀疑笔记被删除的背后有一个明显的原因:埃隆在中国拥有大量商业利益,因此他有可能强迫社区笔记团队干扰算法的输出,并删除这条笔记。


幸运的是,该算法是开源且可验证的,因此我们可以实际了解其内部情况。我们开始吧。原始推文的 URL 是 https://twitter.com/MFA_China/status/1676157337109946369。末尾的数字 1676157337109946369 是推文 ID。我们可以在可下载数据中搜索,并在电子表格中识别具有上述注释的特定行:



这里我们得到了笔记本身的 ID,1676391378815709184。然后,我们在运行算法生成的和文件中搜索该内容。我们得到:scored_notes.tsvnote_status_history.tsv



第一个输出中的第二列是票据的当前评级。第二个输出显示了笔记的历史记录:它的当前状态位于第七列 (NEEDS_MORE_RATINGS),而它之前收到的第一个不是 NEEDS_MORE_RATINGS 的状态位于第五列 (CURRENTLY_RATED_HELPFUL)。因此,我们看到算法本身首先显示了该笔记,然后在其评级有所下降时将其删除—似乎没有涉及中心干预。


我们可以从另一个角度看投票本身。我们可以扫描评级 -00000。tsv 文件来隔离这个笔记的所有评级,并查看有多少评级为 HELPFUL 与 NOT_HELPFUL:



但是,如果你按时间戳对它们进行排序,并查看前 50 个投票,你会看到 40 个 HELPFUL 投票和 9 个 NOT_HELPFUL 投票。所以我们得出了同样的结论:这条笔记最初的受众比后来的受众更喜欢这条笔记,所以其评分一开始较高,随着时间的推移下降。


不幸的是,这条笔记状态改变背后的真实情况很难解释:这不是简单的「之前评级在 0.40 以上,现在低于 0.40,所以它被降级了」。相反,大量的 NOT_HELPFUL 回复触发了一个异常值条件,增加了笔记保持在阈值以上所需的有用性分数。


这是一个很好的学习另一个教训的机会:要让一个可靠的中立算法真正可信,就需要保持它的简单性。如果一个笔记从被接受到不被接受,应该有一个简单而清晰的故事来解释为什么。


当然,还有一种完全不同的方式可以操纵这次投票:拉票。看到自己不赞成的留言的人可以要求高度参与的社区 ( 或者更糟糕的是,大量虚假账户 ) 将其评为 NOT_HELPFUL,并且可能不需要太多的投票就可以将该留言从「有帮助的」变为「两极分化的」。适当地减少算法对这种协同攻击的脆弱性将需要更多的分析和工作。一个可能的改进是不允许任何用户对任何笔记进行投票,而是使用「For you」算法馈送随机分配笔记给评分者,并且只允许评分者对分配给他们的笔记进行评分。


社区笔记不够「勇敢」吗?


我所看到的对社区笔记的主要批评基本上是它做得不够。我最近看到的两篇文章阐述了这一点。引用:


该计划受到以下事实的严重阻碍:要公开社区说明,它必须得到各个政治派别的人们的共识的普遍接受。


「它必须有意识形态共识,」他说。「这意味着左翼人士和右翼人士必须同意该笔记必须附加到该推文中。」


他说,从本质上讲,它需要「就真相达成跨意识形态的共识,而在党派之争日益加剧的环境中,达成这种共识几乎是不可能的。」


这是一个棘手的问题,但最终我的立场是,与其让一条推文受到不公平的评判,还不如让十条虚假推文自由传播。我们已经看到了多年的事实核查,这是勇敢的,而且确实是从「嗯,实际上我们知道真相,我们知道一方比另一方更经常撒谎」的角度出发的。结果发生了什么?


老实说,人们普遍不信任事实核查这一概念。这里的一个策略是:忽略那些讨厌的人,记住事实核查专家确实比任何投票系统都更了解事实,坚持到底。但在这种方法上全力以赴似乎是有风险的。建立至少在某种程度上受到每个人尊重的跨群体机构是有价值的。就像威廉·布莱克斯通 (William Blackstone) 的格言和法院一样,我认为要保持这种尊重,需要一个系统,它在犯错误的过程中更多地是出于疏忽而不是故意。因此,对我来说,至少有一个主要组织正在走这条替代道路,并将其罕见的跨群体尊重视为一种值得珍惜和建立的资源,这一点似乎很有价值。


我认为社区笔记可以保守的另一个原因是,我不认为每一条错误的推文,甚至是大多数错误的推文,都应该收到更正说明。即使只有不到百分之一的错误消息得到了更正的笔记,社区笔记仍然作为一种教育工具提供了非常有价值的服务。我们的目标不是纠正一切;相反,我们的目标是提醒人们存在多种观点,某些看起来令人信服和孤立的帖子实际上是非常不正确的,而你经常可以去做一个基本的互联网搜索来验证它是不正确的。


社区笔记不可能,且也无意成为解决公共认识论中所有问题的灵丹妙药。


虽然它不能解决某些问题,但还有很多其他机制可以尝试填补这些空白,无论是像预测市场这样的新奇小工具,还是雇佣具有领域专业知识的全职员工的传统组织。


结论


社区笔记除了是一项令人着迷的社交媒体实验之外,也是一种引人入胜的新兴机制设计类型的实例:有意尝试识别两极分化的机制,并倾向于弥合分歧而不是使其永久存在的事物。

这一类别中我知道的另外两件事是 (I) 成对二次融资,用于 Gitcoin Grants 和 (ii) Polis,一个使用聚类算法帮助社区识别通常具有不同观点的人普遍接受的陈述的讨论工具。这一领域的机制设计是有价值的,我希望我们能在这一领域看到更多的学术工作。


社区笔记所提供的算法透明度并不是完全去中心化的社交媒体——如果你不同意社区笔记的工作方式,那么就没有办法用不同的算法去查看相同内容的视图。但在未来几年内,它是最接近大规模应用程序的,我们可以看到它已经提供了大量价值,既可以防止中心操纵,又可以确保不参与操纵的平台可以获得适当的信誉。


我期待看到社区笔记以及其他具有类似精神的算法在未来十年中发展壮大。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Vitalik Buterin
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开