首页> 热点 >

热头条丨GPT-5要停？OpenAI凌晨发文回应：保障AI安全，我们没有「偷工减料」

2023-04-07 12:25:17 来源：商业新知网

人工智能系统正在成为（人类）日常生活的一部分。关键问题是要确保这些机器与人类的意图和价值观保持一致。——Mira Murati，OpenAI CTO

近些天，对 OpenAI 来说，可谓是一个「多事之秋」。

(资料图)

由于 ChatGPT 及 GPT-4 可能引发的安全问题，OpenAI 受到了来自外界的一些指责和阻挠：

马斯克等上千人联名呼吁「所有人工智能实验室应立即暂停训练比 GPT-4 更强大的大模型，这一时间至少为 6 个月」；

意大利禁用 ChatGPT，OpenAl「必须在 20 天内通过其在欧洲的代表向他们通报公司执行这一要求而采取的措施」；

ChatGPT 大面积封号；

ChatGPT Plus 停售；

......

这些事件表明，尽管 AI 已经证明有能力为人类社会带来诸多好处，但技术总是一把双刃剑，也会为人类社会带来带来真正的风险，AI 也不例外。

4 月 6 日，OpenAI 官方发布了一篇名为「Our approach to AI safety」的博客文章，探讨了如何「安全地构建、部署和使用人工智能系统」的方法。

OpenAI 致力于保持强大的人工智能安全和（人类社会的）广泛受益。我们的人工智能工具为今天的人们提供了许多好处。

来自世界各地的用户告诉我们， ChatGPT 有助于提高他们的生产力，增强他们的创造力，并提供量身定制的学习体验。

我们也认识到，像任何技术一样，这些工具也有真正的风险——所以，我们努力确保在各个层面上将安全纳入我们的系统。

1. 建立越来越安全的人工智能系统

在发布任何新系统之前，我们都会进行严格的测试，让外部专家参与反馈，努力利用人类反馈的强化学习等技术改善模型的行为，并建立广泛的安全和监测系统。

例如，在我们最新的模型 GPT-4 完成训练后，我们所有员工花了 6 个多月的时间使其在公开发布前更加安全和一致。

我们认为，强大的人工智能系统应该接受严格的安全评估。需要有监管来确保这种做法被采纳，我们积极与政府接触，探讨这种监管可能采取的最佳形式。

2. 从真实世界的使用中学习，以改进保障措施

我们努力在部署前预防可预见的风险，然而，我们在实验室中能学到的东西是有限的。尽管进行了广泛的研究和测试，我们无法预测人们使用我们技术的所有有益方式，也无法预测人们滥用技术的所有方式。 这就是为什么我们相信，随着时间的推移，从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的一个关键组成部分。

在有大量的保障措施下，我们谨慎地逐步发布新的人工智能系统，将其推送给一个稳步扩大的人群，并根据我们学到的经验不断改进。

我们通过我们自己的服务和 API 提供我们最有能力的模型，这样开发者就可以直接在他们的应用程序中使用这种技术。这使我们能够监测滥用情况并采取行动，并不断建立缓解措施，以应对人们滥用我们的系统的真实方式，而不仅仅是关于滥用可能是什么样子的理论。

现实世界的使用也使我们制定了越来越细微的政策，以防止那些对人们构成真正风险的行为，同时还允许我们的技术有许多有益的用途。

至关重要的是，我们相信社会必须有时间来更新和调整，以适应能力越来越强的人工智能，而且每个受这种技术影响的人都应该在人工智能的进一步发展中拥有重要的发言权。迭代部署帮助我们将各种利益相关者带入关于采用人工智能技术的对话中，比他们没有亲身经历过这些工具的情况下更有效。

3. 保护儿童

关于安全的一个关键工作是保护儿童。我们要求使用我们的人工智能工具的人必须是 18 岁或以上，或 13 岁或以上并得到父母的批准，我们正在研究验证选项。

我们不允许我们的技术被用来产生仇恨、骚扰、暴力或成人内容，以及其他（有害）类别。我们的最新模型 GPT-4 与 GPT-3.5 相比，对不允许的内容请求的回应率降低了 82%，我们已经建立了一个强大的系统来监控滥用。 GPT-4 现在可供 ChatGPT Plus 用户使用，我们希望随着时间的推移，能让更多人使用。

我们作出了很多努力，尽量减少我们的模型产生伤害儿童的内容的可能性。例如，当用户试图向我们的图像工具上传儿童安全虐待材料时，我们会阻止这一动作，并向国家失踪和受剥削儿童中心报告。

除了我们的默认安全护栏外，我们还与非营利性的可汗学院等开发商合作--该学院建立了一个由人工智能驱动的助手，既是学生的虚拟导师，也是教师的课堂助手--为他们的使用情况定制安全缓解措施。我们还在开发一些功能，使开发者能够为模型输出设定更严格的标准，以更好地支持那些希望获得这种功能的开发者和用户。

4. 尊重隐私

我们的大型语言模型是在一个广泛的文本语料库上训练出来的，其中包括公开的、授权的内容，以及由人类审查者产生的内容。我们不使用数据来销售我们的服务、广告或建立人们的档案，我们使用数据来使我们的模型对人们更有帮助。例如，ChatGPT 通过对人们与它的对话进行进一步的训练来提高能力。

虽然我们的一些训练数据包括公共互联网上的个人信息，但我们希望我们的模型能够了解这个世界，而不是私人。因此，我们努力在可行的情况下从训练数据集中删除个人信息，对模型进行微调，以拒绝对私人信息的请求，并对个人提出的从我们的系统中删除其个人信息的请求作出回应。这些步骤最大限度地减少了我们的模型可能产生包括私人信息的内容的可能性。

5. 提高事实的准确性

大型语言模型根据它们之前看到的模式，包括用户提供的文本输入，预测、产生接下来的一系列的词。在某些情况下，下一个最有可能的词可能在事实上并不准确。

提高事实准确性是 OpenAI 和许多其他人工智能开发者的一个重要工作，我们正在取得进展。通过利用用户对被标记为不正确的 ChatGPT 输出的反馈作为主要数据来源，我们已经提高了 GPT-4 的事实准确性。与 GPT-3.5 相比，GPT-4 产生事实性内容的可能性增加了 40%。

当用户注册使用该工具时，我们努力做到尽可能透明，即 ChatGPT 可能不总是准确的。然而，我们认识到，要进一步减少出现幻觉的可能性，以及引导公众了解这些人工智能工具目前的局限性，还有很多其他工作要做。

6. 持续的研究和参与

我们认为，解决人工智能安全问题的实用方法是投入更多的时间和资源来研究有效的缓解措施和调整技术，并针对现实世界的滥用进行测试。

重要的是，我们认为，提高人工智能的安全性和能力应该齐头并进。迄今为止，我们最好的安全工作来自与我们能力最强的模型之间的合作，因为它们更善于遵循用户的指示，更容易引导或「指导」。

随着能力更强的模型的创建和部署，我们将越来越谨慎，随着我们人工智能系统的进一步发展，我们将继续加强安全防范措施。

虽然我们为了更好地了解 GPT-4 的能力、好处和风险，等了 6 个多月才将其部署，但有时可能需要比这更长的时间来提高人工智能系统的安全性。因此，政策制定者和人工智能供应商将需要确保人工智能的发展和部署在全球范围内得到有效的管理，没有人会为了尽快取得成功而「偷工减料」。这是一个艰巨的挑战，需要技术和制度上的创新，但这也是我们渴望做出的贡献。

解决安全问题也需要广泛的辩论、实验和参与，包括在人工智能系统行为的界限上。我们已经并将继续促进利益相关者之间的合作和公开对话，以创建一个安全的人工智能生态系统。

关键词：

上一篇：
下一篇：

精彩阅读

热头条丨GPT-5要停？OpenAI凌晨发文回应：保障AI安全，我们没有「偷工减料」
热点
人工智能系统正在成为（人类）日常生活的一部分。

【全球热闻】AI龙头三六零大跌逾5%，AI炒作行情结束了吗？
热点
截至4月6日，微软年内涨幅为21 94%，谷歌年内涨幅为22 73%，百度的年内涨幅为26 76%。

天天热点评！头部UP主停更，戳中了B站的隐痛
热点
B站头部UP主停更，引发了巨大的关注。

环球关注：【商界头条】上海对重大招商项目奖励最高1亿；中国电科辟谣网传怼领导当事人任免信息；万达地产集团被强制执行超10亿
热点
上海对重大招商项目奖励最高1亿。

商业新知发布2023年2月IT科技行业ToB内容营销指数
热点
2023年2月份关注IT科技产业资讯内容的产业经理人达到85 92万人。

当前资讯!国内 “区块链第一股”造假细节披露，涉及假回单、假贸易、假保理、假票据、假公章...
热点
易见股份造假堪称供应链造假的百科全书，涉及假回单、假贸易、假保理、假票据、假公章等。

当我还在和ChatGPT聊天，有人已经开始用它来控制机器人干活了
热点
这会改变人机交互的未来形式吗？

《元宇宙产业链生态发展白皮书（2023年）》发布
热点
未来，面向消费端、行业应用、政府等“元宇宙”应用需求将驱动人工智能、区块链、云计算等新技术领域研发和应用创新活跃。

当前滚动:首批因AI失业的人出现某游戏公司裁掉半数原画师
热点
首批因AI失业的人出现某游戏公司裁掉半数原画师。

互联网湘军风云三十年
热点
湖南，公认的互联网大佬盛产地。

财富

今日关注：科技精英魂断旧金山：这里还是创业天堂吗？
资讯
科技精英魂断旧金山：这里还是创业天堂吗？,鲍勃李这样的焦点凶杀案件会是一个转折点吗？

全球今亮点！我，创业14年做机器人，产品被搬上了《流浪地球2》
资讯
我，创业14年做机器人，产品被搬上了《流浪地球2》,徐振华在最低谷的时候曾经和投资人说“感觉干不下去了”，但天使投资人没有施压，反而鼓励

融资丨「明心数智」完成近亿元A+轮融资
资讯
融资丨「明心数智」完成近亿元A+轮融资,本轮由鼎晖投资完成投资。

全球新动态：大时尚的增长叙事，藏在消费复苏里
资讯
大时尚的增长叙事，藏在消费复苏里,提振消费，从何入手？

小红书进退两难，留给毛文超的时间不多了
资讯
小红书进退两难，留给毛文超的时间不多了,一向低调、佛系的小红书创始人毛文超，这些年在做大小红书的用户与流量规模上表现出色，已经证明了自

每日快讯!AIGC风潮下修图App出路在哪？PhotoRoom示范如何月流水大涨破千万
资讯
AIGC风潮下修图App出路在哪？PhotoRoom示范如何月流水大涨破千万,AIGC，有的时候是个坑。

热点聚焦：“孤家寡人”周鸿祎：ChatGPT风口下，一场90亿离婚
资讯
“孤家寡人”周鸿祎：ChatGPT风口下，一场90亿离婚,360的故事或许还能借着ChatGPT、人工智能重写，不过周鸿祎的身边早已不是旧相识。

天天热讯:成立即“准独角兽”，腾讯投资的这家AI企业有何本事？
资讯
成立即“准独角兽”，腾讯投资的这家AI企业有何本事？,出生即“准独角兽”，手握腾讯投资、业务合作阿里云，这家备受关注的云原生数据库公司终

马斯克“忌惮”的ChatGPT，让人类更聪明还是更愚蠢？
资讯
马斯克“忌惮”的ChatGPT，让人类更聪明还是更愚蠢？,诞生于茧房，逃不出高墙。

世界观热点：离开印尼和印度后，我到中东创业
资讯
离开印尼和印度后，我到中东创业,中国企业出海迈向深度化、本地化。

MORE+ 资讯

今日关注：科技精英魂断旧金山：这里还是创业天堂吗？

全球今亮点！我，创业14年做机器人，产品被搬上了《流浪地球2》

融资丨「明心数智」完成近亿元A+轮融资

全球新动态：大时尚的增长叙事，藏在消费复苏里

小红书进退两难，留给毛文超的时间不多了

每日快讯!AIGC风潮下修图App出路在哪？PhotoRoom示范如何月流水大涨破千万

热点聚焦：“孤家寡人”周鸿祎：ChatGPT风口下，一场90亿离婚

天天热讯:成立即“准独角兽”，腾讯投资的这家AI企业有何本事？

马斯克“忌惮”的ChatGPT，让人类更聪明还是更愚蠢？

世界观热点：离开印尼和印度后，我到中东创业

MORE+ 热点

热头条丨GPT-5要停？OpenAI凌晨发文回应：保障AI安全，我们没有「偷工减料」

【全球热闻】AI龙头三六零大跌逾5%，AI炒作行情结束了吗？

截至4月6日，微软年内涨幅为21 94%，谷歌年内涨幅为22 73%，百度的年内涨幅为26 76%。

天天热点评！头部UP主停更，戳中了B站的隐痛

B站头部UP主停更，引发了巨大的关注。

环球关注：【商界头条】上海对重大招商项目奖励最高1亿；中国电科辟谣网传怼领导当事人任免信息；万达地产集团被强制执行超10亿

上海对重大招商项目奖励最高1亿。

商业新知发布2023年2月IT科技行业ToB内容营销指数

2023年2月份关注IT科技产业资讯内容的产业经理人达到85 92万人。

当前资讯!国内 “区块链第一股”造假细节披露，涉及假回单、假贸易、假保理、假票据、假公章...

易见股份造假堪称供应链造假的百科全书，涉及假回单、假贸易、假保理、假票据、假公章等。

MORE+ 焦点

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨，苹果举行主题为超前瞻的秋季新品发布会，在此次发布会上，备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架提升新老显卡性能

Windows 12系统可能会在2024年到来，按照正常的节奏，其开发工作应该早已秘密进行。日前，有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息，一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap，旨在为盲人和视

2022年情况又要变了！华硕高管：今年PC恐怕要供过于求

这两年来，由于疫情导致的居家办公及远程教育需求爆发，一直在下跌的PC市场枯木逢春，2021年更是创下了2012年以来的最快增长，然而2022年情

垃圾佬的心头好！西数新款固态盘SN740曝光

对于DIY垃圾佬来说，散片、拆机件、工包……这些名词怕是并不陌生。本周，西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足，如果可以背靠巨头享受大树底下好乘凉的红利，那自然是皆大欢喜，没有这个福气，也大可凭借自己一步一个

MORE+ 智能

国内最火新能源中大型轿车数月订单就破10万

苹果iPhone备忘录还有隐藏功能可一键秒变扫描机

新能源汽车在我国异军突起预示着新能源汽车市场巨大增长潜力

苹果召开2022秋季新品发布会全新产品序列登场

中国大力发展新能源汽车产业绝对不会有错

智能家居进入我们生活使万物互联智能家居生活逐渐成为现实

亚马逊云科技助力念力科技打造云游戏解决方案实现全球化部署

特斯拉Semi卡车明年全新内饰谍照曝光：取消换挡拨杆

人的大脑相当于什么级别的CPU？超低功耗的神奇作品

如何“监视”作业本上的笔迹？这支笔告诉你答案

精彩推送

热头条丨GPT-5要停？OpenAI凌晨发文回应：保障AI安全，我们没有「偷工减料」

【全球热闻】AI龙头三六零大跌逾5%，AI炒作行情结束了吗？

今日关注：科技精英魂断旧金山：这里还是创业天堂吗？

当前快报:蔚来手机有望第三季度到来，极简设计方案预计为旗舰机型

全球今亮点！我，创业14年做机器人，产品被搬上了《流浪地球2》

环球关注：【商界头条】上海对重大招商项目奖励最高1亿；中国电科辟谣网传怼领导当事人任免信息；万达地产集团被强制执行超10亿

天天热点评！头部UP主停更，戳中了B站的隐痛

中国电科相关单位：不存在临时工情况，已报案

全球新动态：大时尚的增长叙事，藏在消费复苏里

每日快讯!AIGC风潮下修图App出路在哪？PhotoRoom示范如何月流水大涨破千万

小红书进退两难，留给毛文超的时间不多了

融资丨「明心数智」完成近亿元A+轮融资

商业新知发布2023年2月IT科技行业ToB内容营销指数

当我还在和ChatGPT聊天，有人已经开始用它来控制机器人干活了

《元宇宙产业链生态发展白皮书（2023年）》发布

当前资讯!国内 “区块链第一股”造假细节披露，涉及假回单、假贸易、假保理、假票据、假公章...

环球速递！上海全球投资促进大会举行 26个重大产业项目现场签约

【环球新视野】关于GPT-4，14个容易被忽略的惊人细节！

热点聚焦：“孤家寡人”周鸿祎：ChatGPT风口下，一场90亿离婚

当前滚动:首批因AI失业的人出现某游戏公司裁掉半数原画师

环球即时：鸿蚁光电推出多组元联动调焦BB AR光学模组

约翰·卡马克：VR是很好的赌注，而Meta输了；索尼成立全资子公司专注传感、人工智能与数字虚拟空间

互联网湘军风云三十年

让青春继续是谁写的_让青春继续程璐照片

天天热讯:成立即“准独角兽”，腾讯投资的这家AI企业有何本事？

神印王座完结倒计时开始，大结局讲到哪里确定，官方想法很明显

世界观热点：离开印尼和印度后，我到中东创业

天天播报:锅圈食汇凭什么赴港IPO？

天天微资讯！GPT-4超强进化，近万人联名封杀！白宫紧急开会，ChatGPT概念股暴跌

马斯克“忌惮”的ChatGPT，让人类更聪明还是更愚蠢？

【天天新视野】强化连锁慢病人才储备荣昌制药专业服务之星选拔赛盛势开启

虎头局倒下，天价估值破灭的开始

诺诚健华-B（09969.HK）：4月6日南向资金增持235.5万股

每日精选：日本北海道能取湖1.8亿扇贝集体死亡！原因尚不明

瑞普生物(300119)年报点评报告：业绩表现稳健多维度弹性可期

全球动态:培育智能制造主力军，抢占数字经济新赛道！松江今年拟完成超650家规上工业企业数字化诊断

【环球新要闻】童年回忆登上银幕！动画电影《超级马力欧兄弟大电影》高分开局

速讯：5年开出近万家门店，营收超70亿！锅圈要IPO了

世界快资讯：半个朋友圈都在蹭的樱花，狂吸80亿

阿里搞了个AI嘴替.mp4

世界热议:财面儿丨旭辉控股：前3月实现合同销售额211.3亿元同比下滑26.5%

互联网湘军风云三十年

世界快消息！李想，再添一个IPO

世界观速讯丨“AI显性化”系列二：AI+影视

全球微动态丨产品快讯丨神策数据 A/B 测试试验指标管理重磅升级

世界焦点！大东南：浙江大东南锂电池隔膜研究院一直在为公司产品的质量提升、开发新产品而正常运行

微头条丨意大利封禁加拿大调查，ChatGPT会面临新“禁令”吗？

焦点速看：B站“停更潮”，真假？

快看：张家界天门山景区多人跳崖自杀？官方：已成立专案组进行调查

世界最资讯丨飞书如何保持自身的先进性？

全球热议:谈谈GPT技术对SaaS领域的影响

【全球新要闻】ChatGPT挺进电商，打工人慌了？

观热点：融资丨「弼领生物」完成近两亿元A轮融资，龙磐投资领投

融资丨「氦星光联」完成数千万元新一轮融资，永徽资本领投

知行科技客户及供应商集中度双高，毛利率下滑12.3个百分点

焦点播报:唐人神携手蓝凌，5大在线提效100+子公司协同办公

要闻速递：绝不能错过的8个热门AI应用

融资丨「衡石科技」完成数千万A+轮融资，常春藤资本投资

天天讯息：融资丨数字化医护解决方案提供商「小橙」完成近亿元A轮融资

背靠“大树”的国货航IPO，值得被期待吗？

字节苦等PICO起舞，一张90亿元的船票正在贬值

世界视点！360集团CEO周鸿祎离婚！前妻将分走90亿

【快播报】周鸿祎的“AI”情买卖

【新要闻】蓝色宇宙厉天强：AI加速内卷，蓝色宇宙希望找到共赢方式

全球头条：腾讯半年减持3.38%，金山办公收入锐减，广告还赚钱吗？

当前热门：苹果AR/VR头显有望在WWDC发布：库克承认过去小看了虚拟现实

世界要闻：特朗普刑事案标志美国党争和社会撕裂进一步加剧

全球百事通！独家丨王慧文仍在招兵买马，意向收购两家清华 NLP 校友公司

头条：数博图述｜数读2023数博会数据场景应用创新大赛

大佬更注重隐私？马云回国路透照引热议：手机倒扣在桌面

世界热头条丨ChatGPT引发AI飓风，但品牌们更看好“智能决策”

耳念珠菌受关注，北京疾控提醒：不能轻视也不必恐慌

全球热门:揭秘网易伏羲AIGC：内测绘画工具，落地多款产品推了好些新玩法

天天视点！京津冀航空航天与新材料产业融合创新发展论坛在津举办

腾讯会议服务调整今日正式生效，免费会议规模升至100人

ChatGPT来袭，让你的聊天变得更有价值！

热资讯！2023 SaaS突围战怎么打？

中国产业元宇宙趋势研究报告

世界观焦点：襄姐是个老年水军

热消息：年轻人抛弃海伦司了？

环球视讯！融资丨「利氪科技」完成4亿元人民币B轮融资

惠州成立全省首个市级数字政府建设产业联盟

B站走到今天，一点也不让人意外

世界观天下！数据安全推进计划2022年度优秀贡献单位，奇点云上榜！

环球简讯:美图2022年财报：AIGC引领创新，多重驱动共振向上

速看：武汉十四五交通运输规划公布，你期待的时代来了吗？

对话文心一言：关于李彦宏、马东敏、陆奇、集度汽车与ChatGPT，它回答一切

当前时讯：ChatGPT大面积封号；淘宝上线99特卖频道…

河南省沁阳市发布大风黄色预警

环球最新：汽车价格战打出一个更残酷的现实

世界信息:左手UFC右手WWE，Endeavor打造214亿美元体娱帝国

世界速看：高佣金、低需求，货拉拉难突围

每分钟成交三千万，从杨浦滨江看缦系背后的热销密码

世界百事通！ChatGPT开启 AI 纪元，如何通过 AIGC 带动生产力变革？

关注：飞鹤卖不动，不能只怪年轻人不生娃

不带货的马保国，直播卖货收入5万元

全球今日讯！现金筑厚底，董宇辉拿捏不了新东方

世界热议:运动会宣传口号4班20字（运动会宣传口号）

当前关注：刘禹锡最有名的20首诗_刘禹锡的名诗

TCL中环: 关于股份回购进展情况的公告