MIT团队用AI检验AI：AI给出的“最优解”真的公平吗？ (opens in new tab)

（来源：麻省理工科技评论）AI 正越来越多地被用于辅助高风险场景下的决策。比如一个自主系统可以找出一种电力分配策略，在保持电压稳定的前提下把成本降到最低。这些由 AI 给出的方案虽然在技术上可能是最优的，它们真的公平吗？如果一个低成本的电力分配策略让条件不佳的社区比高收入地区更容易遭遇停电，这算不算问题？为了帮助相关方在 AI 系统部署之前就能快速发现潜在的伦理困境，MIT 的研究人员开发了一套自动化评估方法。这套方法的目标是在可量化指标（比如成本或稳定性）与那些定性或主观的价值（比如公平性）之间找到平衡。该系统把客观评估与用户定义的人类价值观分开处理，使用一个大语言模型作为“人类代理”来捕捉和整合相关方的偏好。这套自适应框架会挑选出最值得进一步评估的场景，从而简化原本需要耗费大量人力和时间的手工流程。这些测试用例既能展示自动系统与人类价值观高度吻合的情况，也能揭示那些意外偏离伦理标准的情境。“我们可以给 AI 系统加上很多规则和护栏，但这些防护只能拦住我们事先能想到的那些风险。不能因为 AI 是在这些数据上训练过的，就觉得让它直接上岗就行。我们想做的是找到一种更系统的方法，把那...

Read the original article