美国记者赚外快的新路子:帮人工智能标注数据
2025-02-24 14:58
2024 年,美国新闻行业裁掉了近 5000 个工作岗位,比上一年增加了 59%。

去年 12 月,卡拉·麦卡娜(Carla McCanna)收到了人工智能训练数据公司 Outlier 的招聘人员发来的一条消息。麦卡娜是西北大学梅迪尔新闻学院的应届毕业生,她从未听说过这家公司,但这条消息是通过大学托管的招聘平台 Handshake 发送的。“招聘人员说我的技能与写作专家的职位相匹配,我将负责训练人工智能模型以提高其准确性和效率。”麦卡娜告诉我。当时,麦卡娜在数据工作、机器学习或科技行业没有任何经验。招聘人员提到的“技能”其实是她的新闻工作经验——她的专业写作、研究和事实核查能力。她曾在《达拉斯晨报》和月刊《D 杂志》实习,并在去年 8 月获得了新闻学硕士学位。然而,全职新闻工作岗位稀缺,竞争也令人望而生畏。(根据 Challenger, Gray & Christmas 的年度报告,2024 年,本已陷入困境的美国新闻行业裁掉了近 5000 个工作岗位,比上一年增加了 59%。)“我对杂志写作、特稿写作或文化音乐写作最感兴趣,但这些 LinkedIn 上的工作往往有数千人申请。”麦卡娜告诉我,“虽然我在寻找全职写作岗位,但这个 Outlier 的工作看起来很棒,因为它完全远程办公,而且只要你稳定工作,报酬也很可观。”过去几个月,麦卡娜几乎全职为 Outlier 工作,通过其零工平台接项目,时薪约 35 美元。数据工作迅速成为她的主要收入来源,她还向其他梅迪尔的同学推荐了这份工作。“我们很多人都还在找工作。我三次告诉别人我在做什么,他们都说,请把这份工作推荐给我。”她说,“现在找工作很难,我的许多同事也都在说同样的话。”麦卡娜只是众多被 Outlier 吸引去从事兼职远程数据工作的记者之一。在过去一年中,我采访了美国各地的地方新闻撰稿人、摄影记者和广播记者,他们要么收到了该公司的类似招聘信息,要么是通过自由记者之间的口口相传了解到这个平台的。
其中许多人告诉我,他们之所以接手 Outlier 的项目,是为了补充收入,或者是因为新闻行业全职岗位减少、自由职业工作机会枯竭,而完全取代了他们的新闻工作。有些是像麦卡娜这样的早期职业记者,但也有一些是拥有超过十年经验的记者。他们唯一共同的特点是什么?在去年之前,他们从未听说过 Outlier,甚至不知道这种工作存在。Outlier 于 2023 年推出,是旧金山数据标注公司 Scale AI 旗下的一个平台,该公司估值达 138 亿美元。它的客户包括全球最大的人工智能公司,如 OpenAI、Meta 和微软。Outlier 以及类似平台 CrowdGen 和 Remotasks 利用远程人类工作者网络来改进其客户的 AI 模型。工人们按小时获得报酬,从事标记训练数据、起草测试提示以及评估输出内容的事实准确性和语法的任务。通常,他们的工作会通过一种称为“人类反馈的强化学习”(RLHF)的过程反馈到 AI 模型中,以提高其性能。这种人类反馈循环一直是构建 OpenAI 的 GPT 和 Meta 的 Llama 等模型的核心。除了直接的招聘消息外,我还发现了数十条近期的公开招聘信息,这些信息突显了招聘记者从事数据工作的这一日益增长的趋势。这些招聘信息来自人工智能行业领先的数据训练公司,包括 Appen、Data Annotation 以及 Scale AI 本身。所有这些职位空缺都将记者列为优先候选人,通常与编辑、文字编辑和技术作家并列。“尽管我们招聘记者的工作并不新鲜,但我们发现,由于他们的写作和文本理解能力,他们通常是优秀的通用贡献者。”Scale AI 的发言人乔·奥斯本(Joe Osborne)说,“这种工作的远程和灵活性质也往往适合他们的需求和时间表。”奥斯本还表示,该公司目前正在将其“事实核查员”职位更新为“人工智能训练师”,以明确 Outlier 上的事实核查并不是一种直接的内容审核。我找到的许多招聘信息都在寻找语言专家,包括那些在大型人工智能公司的训练数据中较少代表的语言和方言的记者。我发现了国际事实核查员的招聘信息,要求应聘者会说泰语、荷兰语、印地语和瑞典语,以及像“西班牙语(墨西哥)”和“法语(加拿大)”这样的方言。说英语的记者通常符合更一般的职位要求,这些职位通常被列为“人工智能写作评估员”“自由撰稿人”和“事实核查员”。
加州格伦代尔的自由记者埃莉扎·帕蒂卡(Eliza Partika)在 2024 年春季的领英上看到了类似的职位信息。帕蒂卡一直在为当地的新闻媒体(如 AfroLA 和 Crescenta Valley Weekly)定期供稿。在加入 Outlier 平台后,这份零工成为了她“极其有帮助”的收入来源,大多数项目的时薪在 17 到 20 美元之间。“这是一个我可以随时回来的自由职业工作,所以我会在任何时候有空时就去接项目。”她说。帕蒂卡在 Outlier 的大部分工作是以 30 分钟为单位进行的,需要审查来自 Meta AI 或 ChatGPT 等产品的匿名真实聊天记录。然后她会根据评分标准对模型的回答进行评分。“如果用户要求 Meta AI 根据工作描述写一封求职信,我的工作就是验证回复的求职信是否包含了工作描述中提到的经历,语法是否通顺,以及是否使用了求职信的适当语气。”她告诉我。这些聊天内容经常涉及更事实性的主题,包括文学、数学和健康。“如果他们问哈姆雷特的独白是什么意思,我必须验证 AI 的回答是否与哈姆雷特的独白有关,同时分析是否符合当前对该主题的看法。”她补充道,“如果是科学事实或数学问题,我会去查证。”我采访的所有 Outlier 贡献者都提到,他们的工作很大程度上依赖于事实核查,包括识别模型的幻觉,或者标记聊天机器人从互联网错误来源提取信息的情况。许多人将其比作对新闻报道的“抽查”,重点关注数字、专有名词和陈述的事实等关键细节。“我不需要采访任何人,但我的研究技能、对历史的了解、对政治的了解、我的推理能力、我的事实核查能力,当然还有对英语的掌握,所有这些技能都能用得上。”科里·克拉克(Cory Clark)说。克拉克在费城从事地方新闻报道和自由摄影记者工作已有十余年,他经常为《费城询问报》以及美联社、法新社、盖蒂图片社和西帕通讯社等图片通讯社供稿。克拉克告诉我,他越来越难以仅靠自由记者的工作来养家糊口,去年他停止接受新的自由职业任务,转而为 Outlier 工作。他在《地方报》(The Local,费城西北部的一家媒体)的一位同事向他推荐了这个平台。“这份工作非常适合记者。”他说。像任何零工平台工作一样,为 Outlier 工作也并非没有挑战。克拉克表示,去年夏天,他在该平台上很难找到新项目,最终不得不找另一份兼职工作。类似的需求波动使得 Outlier 的收入不稳定。该公司还因薪酬问题受到批评,包括去年被指控大量未支付在该网站上记录的工时。其他工作人员告诉我,他们的人工智能审查工作经常涉及处理沉重或令人不安的话题。“很多时候我看到的内容是露骨的或敏感的。我们被要求不要对这些聊天进行评分,而是标记为敏感内容。”帕蒂卡说。上个月,Outlier 的工作人员对 Scale AI 提起了一系列诉讼,声称他们的工作对心理造成了伤害,但公司没有提供适当的支持或保障措施。然而,对于许多记者来说,拒绝为人工智能训练数据公司工作的原因更具存在性。2024 年 2 月,堪萨斯州威奇托的 KMUW 广播电台记者塞莉亚·哈克(Celia Hack)在领英上收到了 Outlier 招聘人员的信息。她对这种招聘并不感兴趣,反而在推特上发布了招聘人员信息的截图。她的推文写道:“当他们提出付钱让你帮助使你的记者工作变得过时的时候。”
“我之前不知道还有人真的被雇来从事这种工作。”她在最近的一次通话中告诉我,解释说尽管她并不担心人工智能技术会取代她作为地方新闻记者的工作,但招聘人员的信息仍然让她措手不及。“老实说,我对这种工作到底是什么样子仍然有点困惑。”哈克并不是第一个提出这个问题的人。我采访的记者们表示,他们为 Outlier 所做的工作通常需要向行业内的朋友和同行解释一番。“人们的第一反应通常是:‘天哪,你在帮助人工智能接管一切吗?’”西北大学毕业生麦卡娜说。与其说是在训练一个替代品,麦卡娜认为她的数据工作是一种资产,随着人工智能工具不断嵌入工作场所,她能够借此扩展自己的知识。“真正从事这项工作后,你会意识到人工智能模型仍然需要我们……我认为它们真正像人类一样写作还需要很长时间。”与此同时,克拉克表示他一直在向其他记者推荐 Outlier。即使是最初持怀疑态度的人也逐渐接受了这个想法。“他们不信任人工智能的方面,但我向他们解释说,不管怎样,这是未来,无论是作为我们的工具,还是最终取代我们。”其中一位朋友是纽约市的一名摄影记者。“我对他说,伙计,你每月要支付数千美元的房租。我知道你作为自由职业者并不总是能挣到那么多。”克拉克说,“Outlier 是一种补充收入的方式。”(NiemanLab)
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。