OpenAI加强安全措施，授权董事会否决危险AI的决策

　　发布于2024-10-23　阅读（0）

扫一扫，手机访问

生产中的模型由“安全系统”团队管理。开发中的前沿模型有“准备”团队，该团队会在模型发布之前识别和量化风险。然后是“超级对齐”团队，他们正在研究“超级智能”模型的理论指南

将安全顾问小组重新组建，使其位于技术团队之上，以便向领导层提出建议，并给予董事会否决的权力

OpenAI宣布，为了抵御有害人工智能的威胁，他们正在加强内部的安全流程。他们将设立一个名为“安全顾问小组”的新部门，该部门将位于技术团队之上，向领导层提供建议，并被授予董事会否决权。这一决定于当地时间12月18日宣布

更新引起关注的原因主要是因为OpenAI首席执行官山姆·奥特曼被董事会解雇，而这似乎与大型模型的安全问题有关。在高层人事变动后，OpenAI董事会的两位“减速主义”成员伊尔亚·苏茨克维和海伦·托纳失去了董事会席位

在这篇文章中，OpenAI讨论了他们最新的“准备框架”，即OpenAI如何跟踪、评估、预测和防范日益强大的模型所带来的灾难性风险。灾难性风险的定义是什么？OpenAI解释道，“我们所说的灾难性风险是指可能导致数千亿美元经济损失，或者导致许多人严重伤害或死亡的风险，这也包括但不限于生存风险。”

OpenAI增强安全团队，授予其董事会否决危险AI的权力

有三组安全团队分别覆盖不同的时间框架和风险

根据OpenAI官网的资料，生产中的模型由“安全系统”团队负责管理。而在开发阶段，有一个名为“准备”的团队，他们会在模型发布之前识别和评估风险。此外，还有一个名为“超级对齐”（superalignment）的团队，他们正在研究“超级智能”（superintelligent）模型的理论指南

OpenAI团队将对每个模型根据四个风险类别进行评级，这四个类别分别是网络安全、说服能力（如虚假信息）、模型自主性（即自主行为能力）以及CBRN（化学、生物、放射性和核威胁，例如创造新病原体的能力）

OpenAI在假设中考虑了各种缓解措施：例如，该模型对于描述制作凝固汽油或管式炸弹的过程保持着合理的保留态度。在考虑已知的缓解措施后，如果一个模型仍然被评估为具有“高”风险，它将无法被部署，如果一个模型存在任何“关键”风险，将不会进一步开发

并非所有制作模型的人都是评估模型和提出建议的最佳人选。出于这个原因，OpenAI正在建立一个名为“跨职能安全咨询小组”的团队，该团队将从技术层面审查研究人员的报告，并从更高的角度提出建议，希望能够发现一些“未知的未知”

这个过程要求将这些建议同时发送给董事会和领导层，领导层将决定是否继续或停止运行，但董事会有权撤销这些决定。这样可以避免高风险产品或流程在董事会不知情的情况下获得批准

然而，外界仍然担心的是，如果专家小组提出建议，首席执行官根据这些信息做出决策，OpenAI的董事会是否真的有权利进行反驳并采取行动？如果他们这样做了，公众会听到相关声音吗？目前，除了OpenAI承诺征求独立第三方审计之外，他们的透明度问题实际上并没有得到真正的解决

OpenAI的“准备框架”包含以下五个关键要素：

1. 评估和打分

我们将对我们的模型进行评估，并持续更新我们的“记分卡”。我们将评估所有最新的模型，包括在训练期间将有效计算量增加两倍。我们将推动模型的极限。这些发现将有助于我们评估最新模型的风险，并衡量任何拟议的缓解措施的有效性。我们的目标是探测特定边缘的不安全因素，以有效地减轻风险。为了跟踪我们模型的安全水平，我们将制作风险“记分卡”和详细报告

OpenAI增强安全团队，授予其董事会否决危险AI的权力

要评估所有前沿模型，需要使用“记分卡”

设定风险阈值的目的是为了在进行决策和管理风险时能够有一个明确的界限。风险阈值是指在特定情况下，组织或个人愿意承受的最大风险水平。通过设定风险阈值，可以帮助组织或个人识别出何时需要采取行动来减轻风险或避免风险。风险阈值的设定应基于风险评估的结果、相关法规和政策以及组织或个人的风险承受能力。在设定风险阈值时，需要考虑到不同风险类型的特点和影响程度，以确保风险管理措施的有效性和适用性。最后，设定的风险阈值应定期进行评估和调整，以保持与组织或个人的风险管理目标相一致

我们将设定触发安全措施的风险阈值。我们根据以下初步追踪类别设定了风险级别的阈值：网络安全、CBRN（化学、生物、放射性、核威胁）、说服和模型自主。我们指定了四个安全风险级别，只有缓解后得分为“中”或以下的模型才能被部署；只有缓解后得分为“高”或以下的模型才能进一步开发。对于具有高风险或严重风险（缓解前）的模型，我们还将实施额外的安全措施

OpenAI增强安全团队，授予其董事会否决危险AI的权力

危险水平

重新设定监督技术工作和安全决策运营结构

我们将设立一个专门的团队来监督技术工作和安全决策的运营结构。准备团队将推动技术工作，以检查前沿模型的能力极限，并进行评估和综合报告。这项技术工作对于OpenAI安全模型的开发和部署决策至关重要。我们正在创建一个跨职能的安全咨询小组，以审查所有报告，并同时发送给领导层和董事会。尽管领导层是决策者，但董事会拥有推翻决定的权力

OpenAI增强安全团队，授予其董事会否决危险AI的权力

监督技术工作和安全决策运营结构的新变化

增强安全性和加强对外部问责制

我们将制定协议以提高安全性和外部责任。我们将定期进行安全演习，以压力测试我们的业务和自身文化。一些安全问题可能会迅速出现，因此我们有能力标记紧急问题以进行快速响应。我们认为，从OpenAI外部人员那里获得反馈并由合格的独立第三方进行审核是很有帮助的。我们将继续让其他人组成红队并评估我们的模型，并计划与外部共享更新

减少其他已知和未知的安全风险：

我们将协助减少其他已知和未知的安全风险。我们将与外部各方以及内部的安全系统等团队密切合作，以跟踪现实世界中的滥用情况。我们还将与“超级对齐”合作，跟踪紧急的错位风险。我们还开创了新的研究，以衡量风险随着模型规模扩展而演变的情况，并帮助提前预测风险，这类似于我们早期在规模法则方面取得的成功。最后，我们将进行连续的流程，以尝试解决任何新出现的“未知的未知”

本文转载于：https://www.sohu.com/a/745320004_260616?scm=1102.xchannel:676:110036.0.1.0~9010.8000.0.5.1829 如有侵犯，请联系admin@zhengruan.com删除

上一篇：小米国际版澎湃OS升级计划正式推出

下一篇：科大讯飞推出搭载星火大模型的AI智能机械键盘D1，售价599元上架

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

进一步规范微信公众号中关于"自媒体"内容来源标注

今天，微信公众平台运营中心发布消息，宣布进一步规范“自媒体”内容的来源标注根据《关于加强“自媒体”管理的通知》（以下简称《通知》）要求，“自媒体”账号在发布涉及国内外时事、公共政策、社会事件等相关信息时，应准确标注信息来源，发布时在显著位置展示。来源不明的信息特别时政新闻、财经信息等内容在传播过程容易出现误读，对阅读用户产生误导和混淆。为营造文明和谐的网络环境、提升C端阅读体验，微信公众平台将进一步规范内容信息来源标注。广大“自媒体”创作者严格按照《通知》要求规范内容标注，应在文章发表前在“文章设置”模块

9分钟前微信自媒体公众号 0
正版软件

拼多多向积石山捐资 2000 万元，支持救灾与重建

本站12月19日消息，拼多多宣布紧急捐助2000万元，用于采购棉衣、帐篷等御寒、救灾物资及灾后重建工作。截至本站发文，已有多家互联网企业宣布捐款或捐赠物资。据新华社消息，截至19日8时，共记录到余震32次，最大余震震级4.0级，地震造成房屋受损4782间。截至19日11时，地震已导致甘肃遇难人数升至105人，186人受伤。地震造成部分乡村道路塌方受阻、部分区域停电、部分村电话线路故障，经相关部门连夜抢修，目前道路、电力、通信等救援生命通道已基本修复。

19分钟前拼多多救灾地震 0
正版软件

慷慨解囊！1000万元捐助甘肃地震救援的理想汽车公司

本站12月19日消息，理想汽车今日发布公告，捐赠1000万元驰援甘肃地震救灾。2021年12月18日23时59分，中国甘肃省临夏州积石山县发生了一场6.2级的地震。这场地震发生在寒冬季节，给灾区带来了巨大的灾难，引起了社会各界的关注和关心理想汽车向甘肃省慈善联合总会捐赠了1000万元，用于购买灾区物资和帮助受灾群众等相关工作。当一个地方遇到困难，来自八方的支援会源源不断地涌现。理想汽车将持续关注灾情的发展，全力支持救灾和灾后重建工作共同合作抵御灾害，祝愿甘肃平安无事！截至本文发布时，已有多家互联网企业宣布

34分钟前理想汽车捐赠捐款地震 0
正版软件

宝马中国向甘肃地震灾区紧急捐款 300 万元

本站12月19日消息，宝马中国与华晨宝马宣布，紧急向甘肃省临夏州积石山县地震灾区捐款人民币300万元，用于受灾地区的紧急救援、受灾群众的生活救援队伍的御寒保障等相关工作。截至本站发文，已有多家互联网企业宣布捐款或捐赠物资。据新华社消息，截至19日8时，共记录到余震32次，最大余震震级4.0级，地震造成房屋受损4782间。截至19日11时，地震已导致甘肃遇难人数升至105人，186人受伤。地震造成部分乡村道路塌方受阻、部分区域停电、部分村电话线路故障，经相关部门连夜抢修，目前道路、电力、通信等救援生命通道已

49分钟前捐款地震宝马中国 0
正版软件

TikTok 电商计划在明年在东南亚与美国同步，预计 GMV 达到 500 亿美元

根据36氪的报道，TikTok的电商业务（TikTokShop）已经确定了2024年的GMV目标为500亿美元（约合3570亿元人民币），比今年的200亿翻了一倍还多自2021年以来，TikTok电商已经拓展到印度尼西亚、英国、泰国、越南、马来西亚、菲律宾、新加坡、美国、沙特、西班牙、巴西、日本等国家和地区据消息人士称，TikTok电商在东南亚地区取得了惊人的成绩，总交易额已达到130亿美元。其中，仅在印尼市场就达到了超过40亿美元，泰国市场也接近35亿美元TikTok在今年9月正式推出了在美国的电商服务

1小时前 14:25 TikTok 电子商务互联网电商 0

OpenAI加强安全措施，授权董事会否决危险AI的决策

产品推荐

最新发布

相关推荐

热门关注