OpenAI发布灾备架构应对大模型风险，AI安全问题正在成为关注焦点

APP下载

扫一扫

下载观察者APP

OpenAI发布灾备架构应对大模型风险，AI安全问题正在成为关注焦点
- 唐晓甫
分享到：

2023-12-19 11:56:41 字号：A- A A+ 来源：观察者网

最后更新: 2023-12-19 14:47:08

（观察者网讯）当地时间12月18日，OpenAI在官网发布灾备架构测试版介绍文档，描述该架构应对流程以跟踪、评估、预测和防范日益强大的模型带来的灾难性风险。OpenAI规定了四个安全风险等级，并表示只有得分在“中”或以下的模型才能部署。

OpenAI灾备架构测试版文档图片来源：OpenAI

据路透社报道，由微软支持的OpenAI只会在确认没有网络和核等方面安全威胁的情况下才会部署其最新的技术。此外，该公司还正在创建一个咨询小组来审查AI安全报告，并将其审查结果发送给公司的高管和董事会。这样可以确保虽然AI运行的决策权在高管手中，但董事会可以推翻这些决策。

OpenAI灾备架构图片来源：OpenAI

该文档的提出被认为是OpenAI进一步加强AI应用安全监管的一个尝试。近期由于AI的快速发展，AI应用的安全性问题被广泛关注。

对于AI应用安全这一问题，长期以来有两派观点，即有效加速主义和AI对齐思想。

有效加速主义（Effective accelerationism，简称为“e/acc”）是一种21世纪基于科技发展而兴起的哲学思想。其支持者一般认为，由人工智能驱动的进步是一种伟大的社会平等器，应该被推动前进。因此，不惜一切代价，采用包括加速商业化在内的一切手段，推动技术进步才是唯一在道德上合理的行动方针。值得注意的是，一般认为OpenAI的现任CEO山姆·奥特曼（Sam Altman）是有效加速主义的支持者。

与有效加速主义对应的是AI对齐（AI alignment）思想，该派理论则更注重AI安全问题，强调人工智能系统的对齐问题，即如何确保未来超出人类智能的超级人工智能系统的行动目标与人类的目标一致。因为如果人工智能系统的目标与人类的目标不一致，可能会导致不可预见和潜在的危险后果。OpenAI中负责AI安全并参与罢黜CEO山姆·奥特曼的首席科学家伊利亚·苏茨克韦尔（Ilya Sutskever）等人，以及此前从OpenAI脱离并创立大语言模型Claude的达里奥·阿莫代（Dario Amodei）等人都是AI对齐思想的支持者。

据路透社、The Information等媒体报道，之前震惊世界的OpenAI“宫斗”事件就源自于有效加速主义和AI对齐思想的路线之争。

11月22日，路透社报道称OpenAI拥有一个尚未公布的新模型Q*。该模型能够解决某些数学问题，虽然现阶段其数学成绩仅达到小学生的水平，但在相关测试中取得的成绩让研究人员对Q*未来的成功非常乐观，并认为Q*在推理模型方面相较于之前的大模型有了巨大的进步。这可能意味着人类将快速实现完全超越人类本身智能的超级AI。

据悉，Q*的出现加剧了包括首席科学家伊利亚·苏茨克韦尔在内对于AI安全性的担忧，并最终促使董事会决定解雇支持有效加速主义的山姆·奥特曼。

值得注意的是，早在今年3月，包括前OpenAI投资者，著名人士马斯克等上千人曾签署联名信，公开信呼吁人类暂停开发比目前GPT-4模型更强大的人工智能，为时至少6个月。

近期除了OpenAI在官网发布灾备架构测试版外，由OpenAI首席科学家伊利亚牵头的，于今年7月建立地“超级对齐”团队，在本月15日发布了其成立以来的第一篇论文。在其最新的研究中，该团队提出了一个技术路线：使用GPT-2级别的AI对GPT-4进行监督并伴以一定的置信度损失，实现了对于GPT-4的微调。这样的GPT-4可以在NLP任务上恢复到接近GPT-3.5级别AI的性能。

该论文指出，通过上述方法可以实现“弱到强泛化”（Weak-to-Strong Generalization）训练，证实了我们可以通过使用更弱、更可控的模型来微调更强大的人工智能模型，使其达到与传统训练方法所训练出的AI更相近的性能。这为“AI对齐”的设想提供了一条实际可行的技术路径。

论文截图图片来源：OpenAI

该论文和灾备架构文档的发表同样也意味着，OpenAI正在试图研究如何监管潜在的全面超越人类智能的超级AI。

本文系观察者网独家稿件，未经授权，不得转载。
|

举报
- 违反法律法规
- 垃圾信息、广告
- 色情、淫秽信息
- 人身攻击
- 谣言、不实信息
- 冒充，冒用信息
- 破坏社区秩序
- 其他
- 涉未成年人有害信息
观察者网举报制度规范
确定取消
标签
- 责任编辑: 唐晓甫
- 我国科学家开创新理论，研发出超薄高能效光学晶体
  
  2023-12-19 14:44
- 全球最先进大洋钻探船来了！
  
  2023-12-18 11:46 科技前沿
- 英特尔推出第五代至强和酷睿Ultra，多个中国厂商到场支持
  
  2023-12-18 08:54 观网财经-科创
- 我国成功发射双曲线一号商业运载火箭
  
  2023-12-17 15:24 航空航天
- 含氦煤层气提取99.999%以上高纯氦，我国突破了
  
  2023-12-16 09:10
- “七项可以改变世界的化工分离之一”，浙大团队实现突破
  
  2023-12-16 08:11
- “南极天目”时域天文望远镜阵原型机研制成功
  
  2023-12-16 08:00
- 我国成功发射遥感四十一号卫星
  
  2023-12-15 22:28 航空航天
- 国际首次！中国团队绘制肝癌转移多组学全景图谱
  
  2023-12-15 14:28 科技前沿
- 新一代人造太阳“中国环流三号”面向全球开放
  
  2023-12-15 09:11 科技前沿
- 我科研人员开发疫苗研制新技术：“纳微复合”干粉吸入
  
  2023-12-15 09:10 科技前沿
- “新舟”60灭火机首次超低空满载6吨投水试飞圆满成功
  
  2023-12-14 09:30 中国精造
- 极飞多款智慧农业产品发布，实现多项突破性创新
  
  2023-12-13 14:48
- 我国科研人员发布古籍大语言模型：智能作诗、精确翻译、自动标点…
  
  2023-12-13 09:03
- “雪龙2”号完成卸货任务离开罗斯海新站
  
  2023-12-13 09:03 南极探险
- 国家科学技术奖提名办法发布，严重失信将进“黑名单”
  
  2023-12-12 15:15
- 比太阳亮1万亿倍！这一大国重器取得关键进展
  
  2023-12-11 21:46 科技前沿
- 国内首次应用！效率提高三倍以上
  
  2023-12-11 09:19
- 文昌发射场正建设规划新一代载人登月火箭发射工位
  
  2023-12-10 14:16 航空航天
- 长征系列运载火箭第500次飞行！遥感三十九号卫星成功发射
  
  2023-12-10 10:39 航空航天
搜索

   观察者头条查看全部

驻哥伦比亚大使：中国来这是为了合作，无意取代谁评论 12

立即生效！特朗普政府暂停留学生签证面试评论 335

“转向中东和加拿大后，中国买家不回头了” 评论 83

“再见，华盛顿！你好，北京！” 评论 87

格陵兰岛催美欧：要我们找中国？评论 172

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

OpenAI发布灾备架构应对大模型风险，AI安全问题正在成为关注焦点

我国科学家开创新理论，研发出超薄高能效光学晶体

全球最先进大洋钻探船来了！

英特尔推出第五代至强和酷睿Ultra，多个中国厂商到场支持

我国成功发射双曲线一号商业运载火箭

含氦煤层气提取99.999%以上高纯氦，我国突破了

“七项可以改变世界的化工分离之一”，浙大团队实现突破

“南极天目”时域天文望远镜阵原型机研制成功

我国成功发射遥感四十一号卫星

国际首次！中国团队绘制肝癌转移多组学全景图谱

新一代人造太阳“中国环流三号”面向全球开放

我科研人员开发疫苗研制新技术：“纳微复合”干粉吸入

“新舟”60灭火机首次超低空满载6吨投水试飞圆满成功

极飞多款智慧农业产品发布，实现多项突破性创新

我国科研人员发布古籍大语言模型：智能作诗、精确翻译、自动标点…

“雪龙2”号完成卸货任务离开罗斯海新站

国家科学技术奖提名办法发布，严重失信将进“黑名单”

比太阳亮1万亿倍！这一大国重器取得关键进展

国内首次应用！效率提高三倍以上

文昌发射场正建设规划新一代载人登月火箭发射工位

长征系列运载火箭第500次飞行！遥感三十九号卫星成功发射

驻哥伦比亚大使：中国来这是为了合作，无意取代谁

美诺奖得主：美国这“病”，中国真治不了…

又来！“放弃主权，金穹免费用”

饿了三个月的巴勒斯坦人涌向食品分发站，以军开枪……

星舰第九次试飞失败，马斯克发声

100万美元，特朗普豁免了她儿子

“在和中国谈判，停了太丢脸”，特朗普政府遭痛批

特朗普邀功：欧盟加速，我赢了！

内讧升级！1200名以军军官呼吁：结束不道德的战争

立即生效！特朗普政府暂停留学生签证面试

特朗普称普京“玩火”，梅德韦杰夫警告

“转向中东和加拿大后，中国买家不回头了”

特朗普放出“好消息”？“这回，我们连标点符号都不信”

印度腿都要跑断了，“胜利大宣讲”整了个寂寞…

“他俩就伊朗问题激烈通话”

“特朗普就是在说，‘我不管了’”