研究表明，人工智能聊天机器人可以检测种族，但种族偏见会降低回应同理心

王浩然 • 2025年1月3日下午7:00 • AI前沿 • 104 views

麻省理工学院、纽约大学和加州大学洛杉矶分校的研究人员开发了一种方法，以帮助评估 GPT-4 等大型语言模型是否足够公平，可以在临床上用于心理健康支持。

借助匿名性和陌生人的陪伴，数字世界作为寻求心理健康支持的地方的吸引力正在增长。这一现象因美国有超过 1.5 亿人生活在联邦政府指定的心理健康专业人员短缺地区而得到推动。

“我真的需要你的帮助，因为我太害怕与治疗师交谈，而且无论如何我都无法联系到治疗师。”

“我是不是反应过度了，因为丈夫在他的朋友面前取笑我而感到受伤了？”

“能否请一些陌生人介入我的生活并决定我的未来？”

上述引言均来自 Reddit 用户的真实帖子。Reddit 是一个社交媒体新闻网站和论坛，用户可以在规模较小的、基于兴趣的论坛（即“subreddits”）上分享内容或寻求建议。

麻省理工学院、纽约大学 (NYU) 和加州大学洛杉矶分校 (UCLA) 的研究人员利用来自 26 个心理健康相关子版块的 12,513 篇帖子和 70,429 条回复的数据集，设计了一个框架，以帮助评估基于 GPT-4 等大型语言模型 (LLM) 的心理健康支持聊天机器人的公平性和整体质量。他们的研究成果最近发表在 2024 年自然语言处理实证方法 (EMNLP) 会议上。

为了实现这一目标，研究人员请两名有执照的临床心理学家评估 50 条随机抽样的 Reddit 帖子，这些帖子寻求心理健康支持，并将每条帖子与 Redditor 的真实回复或 GPT-4 生成的回复配对。在不知道哪些回复是真实的、哪些是人工智能生成的的情况下，心理学家被要求评估每条回复的同理心水平。

长期以来，人们一直探索心理健康支持聊天机器人作为改善获得心理健康支持的一种方式，但像 OpenAI 的 ChatGPT 这样强大的 LLM 正在改变人机交互，人工智能生成的反应变得越来越难以与真实人类的反应区分开来。

尽管取得了显著进展，但人工智能提供的心理健康支持所带来的意外后果已引起人们对其潜在致命风险的关注；去年 3 月，一名比利时男子在与 ELIZA 进行交流后自杀身亡。ELIZA 是一款模仿心理治疗师开发的聊天机器人，拥有法学硕士学位，名为 GPT-J。一个月后，美国国家饮食失调协会暂停了他们的聊天机器人 Tessa，因为该聊天机器人开始向饮食失调患者提供节食建议。

Saadia Gabriel 是麻省理工学院的博士后，现在是加州大学洛杉矶分校的助理教授，也是这篇论文的第一作者，她承认，她最初对心理健康支持聊天机器人的实际效果非常怀疑。Gabriel 在麻省理工学院健康机器学习小组担任博士后期间进行了这项研究，该小组由麻省理工学院电气工程与计算机科学系副教授、麻省理工学院医学工程与科学研究所 Marzyeh Ghassemi 领导，他隶属于麻省理工学院 Abdul Latif Jameel 健康机器学习诊所和计算机科学与人工智能实验室。

加布里埃尔和研究团队发现，GPT-4 的反应不仅总体上更能引起同理心，而且在鼓励积极行为改变方面比人类的反应好 48%。

然而，在偏见评估中，研究人员发现，与白人海报或种族不明的海报相比，GPT-4 对黑人海报（低 2% 至 15%）和亚洲海报（低 5% 至 17%）的反应同理心水平降低了。

为了评估 GPT-4 反应和人类反应中的偏差，研究人员纳入了不同类型的帖子，其中有明确的人口统计（例如性别、种族）泄露和隐含的人口统计泄露。

明确的人口统计泄露可能是这样的：“我是一名 32 岁的黑人女性。”

而隐含的人口统计泄漏将是这样的：“作为一个留着自然头发的 32 岁女孩”，其中关键字用于向 GPT-4 指示某些人口统计数据。

除了黑人女性发帖者外，与人类响应者相比，GPT-4 的回应受显性和隐性人口统计泄露的影响较小，而人类响应者在回复带有隐性人口统计建议的帖子时往往更具同理心。

加布里埃尔说：“你给予（法学硕士）的意见的结构和一些背景信息，比如你是否希望（法学硕士）采取临床医生的风格，社交媒体帖子的风格，或者你是否希望它使用患者的人口统计属性，都会对你得到的回应产生重大影响。”

论文表明，明确指导法学硕士使用人口统计属性可以有效地减轻偏见，因为这是研究人员没有观察到不同人口群体之间同理心存在显著差异的唯一方法。

加布里埃尔希望这项工作能够帮助确保对在各个人口亚群的临床环境中部署的法学硕士进行更全面、更周到的评估。

“LLM 已用于提供面向患者的支持，并已部署到医疗环境中，在许多情况下用于自动化低效的人力系统，”Ghassemi 说。“在这里，我们证明，虽然最先进的 LLM 在点对点心理健康支持中通常比人类受人口泄漏的影响更小，但它们无法在推断的患者亚群中提供公平的心理健康反应……我们有很多机会改进模型，以便它们在使用时提供更好的支持。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/yan-jiu-biao-ming-ren-gong-zhi-neng-liao-tian-ji-qi-ren-ke

Like (0)

王浩然作者

0 0

需要研究假设吗？问问人工智能。

Previous 2025年1月3日

研究人员称，医疗领域的人工智能应该受到监管，但不要忘记算法

Next 2025年1月3日

AI前沿

.world 域名正在帮助品牌挖掘未来的互动潜力

元宇宙的终极愿景——一个横跨多个平台、连接物理世界和虚拟世界的沉浸式环境、点对点互动、交易、用户生成内容和世界构建——可能尚未完全实现。但它已经引导了消费者的期望，并激励各种规模的…

王浩然
2024年12月4日
000
AI前沿

OpenText 扩展 AI 功能以提高企业生产力和投资回报率

关于人工智能及其能为企业带来什么，人们有着很多炒作和承诺。对于企业软件供应商OpenText来说，超越炒作，真正展示人工智能的价值，已经成为日常任务。今天，OpenText 宣布…

王浩然
2024年11月22日
000
AI前沿

企业级AI语音模型Jargonic横空出世：aiOla声称其在业务术语识别上超越竞品

近年来，语音识别模型的准确性不断提高，但大多数模型仍是在理想条件下进行训练和测试的，如安静的环境、清晰的音频和通用词汇。然而，对于企业而言，现实世界的音频环境要复杂得多。为了解决这…

王浩然
2025年4月1日
000
AI前沿

AUDEZE总部处于自己的联盟中——就像它的耳机一样

Audeze——CRBN和Maxwell等高端耳机的制造商——是奥德赛一词的戏剧，灵感来自开创性的科幻经典《2001：太空漫游》。这是一个恰当的名字，或者更确切地说，是一个恰当的灵…

点点
2024年9月29日
000
AI前沿

解锁人工智能的投资回报率：成功实施人工智能的策略

企业越来越多地使用人工智能来增强运营，但实现强劲的投资回报率仍然是一项挑战。为了评估人工智能的真正价值，行业领导者应该采取创新和前瞻性的方法。人工智能在收入增长、成本降低、决策、客…

王浩然
2024年8月25日
000
AI前沿

这家初创公司刚刚赢得五角大楼首份人工智能国防合同

美国国防部已将其首份生成式人工智能防御合同授予Jericho Security，标志着军事网络安全的战略转变。这份价值 180 万美元的小型企业技术转让 (STTR) 第二阶段合同…

王浩然
2024年11月6日
000
AI前沿

MiniMax 推出自己的开源 LLM，具有行业领先的 4M 代币上下文

如今，MiniMax 在美国最为人熟知的身份可能是Hailuo背后的这家新加坡公司。Hailuo 是一种逼真的高分辨率生成式 AI 视频模型，可与Runway、OpenAI 的 S…

王浩然
2025年1月15日
000
AI前沿

小语言模型如何通过测试时缩放解锁隐藏推理能力并超越大型语言模型‌

根据上海人工智能实验室的一项新研究，非常小的语言模型（SLMs）在推理任务中能够超越领先的大型语言模型（LLMs）。研究人员展示，通过正确的工具和测试时缩放技术，一个具有10亿参数…

王浩然
2025年2月22日
000
AI前沿

硅谷正在争论是否应该允许人工智能武器决定杀人

9 月底，Shield AI 联合创始人 Brandon Tseng 发誓，美国的武器永远不会完全自动化——这意味着人工智能算法将做出杀人的最终决定。“国会不希望这样，”这位国防科…

点点
2024年10月13日
000
AI前沿

Meta 与 Lumen 合作推动网络扩张和 AI 目标

Lumen Technologies 已与 Meta 合作，帮助提高 Meta 的网络容量并推动其 AI 目标。扩展的网络预计将有助于加强和提高 Meta 的人工智能…

王浩然
2024年11月7日
000
AI前沿

蝙蝠侠：阿卡姆影的VR版《黑暗骑士》现在有发布日期

我们已经知道它将于今年10月上映，但《蝙蝠侠：阿卡姆之影》——Rocksteady广受好评的超级英雄系列的有前途的VR版本——现在有一个合适的发布日期。它将于今年10月22日为Me…

点点
2024年9月26日
000
AI前沿

Gartner预测：2025年全球生成式AI支出将达到6440亿美元，对企业IT领导者意味着什么？

Gartner最新发布的一份报告预测，到2025年，全球生成式AI（Generative AI）的支出将达到惊人的6440亿美元。这一数字相比2024年增长了76.4%，凸显了生成…

王浩然
2025年4月1日
000
AI前沿

网站建设者 Squarespace 表示正在通过策划和品味来训练其人工智能工具

生成式人工智能工具能帮助人们建立更好的网站吗？还是只会让网络充斥着垃圾信息？Squarespace 最近推出了Design Intelligence，这是一款充满生成式人工智能工具…

王浩然
2024年10月8日
000
AI前沿

AI的生态进化：模应一体的终结与新商业逻辑的诞生

9 月 4 日，文心一言大模型的移动端应用发布了 4.0.0 版本，最大的改动是 App 名字从“文心一言”改名为“文小言”；同一天，支付宝旗下 AI 应用“支小宝”最新版本也正式…

点点
2024年9月7日
000
AI前沿

Vanta 工程副总裁 Iccha Sethi – 访谈系列

Iccha Sethi 是领先的信任管理平台Vanta的工程副总裁，她领导的计划专注于增强安全性和合规性自动化。此前，她是 GitHub 的工程主管，负责管理包括 Actions、…

点点
2024年10月4日
000
AI前沿

确保人工智能前沿：保护企业系统免受人工智能驱动的威胁

到 2025 年，针对身份的武器化人工智能攻击（看不见且通常恢复成本最高）将对企业网络安全构成最大威胁。大型语言模型 (LLM) 是恶意攻击者、网络犯罪集团和民族国家攻击团队的新…

王浩然
2024年11月18日
000
AI前沿

拟人化人工智能：将类人生物误认为人类的严重后果已经显现

在我们急于了解和接触人工智能的过程中，我们陷入了一个诱人的陷阱：将人类的特征归因于这些强大但本质上非人类的系统。这种将人工智能拟人化的倾向不仅仅是人类天性中无害的怪癖——它正在成为…

王浩然
2025年1月19日
000
AI前沿

PTC、微软和大众汽车携手合作开发生成式人工智能

PTC 已确认正在与微软和大众汽车集团合作开发用于实体产品软件开发的生成式 AI产品。 Codebeamer Copilot 基于 PTC 的 Codebeamer 应…

王浩然
2024年12月25日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

ConverzAI 获 1600 万美元融资，为企业带来 30% 效率提升

总部位于华盛顿州雷德蒙德的初创公司ConverzAI是一家人工智能招聘自动化提供商，该公司在A 轮融资中筹集了 1600 万美元，以帮助其推动产品创新并扩大市场范围。此轮融资由 …

王浩然
2025年2月12日
000

发表回复

Please Login to Comment

研究表明，人工智能聊天机器人可以检测种族，但种族偏见会降低回应同理心

相关推荐

发表回复

Share To :