微资讯!山石发声|风暴眼中的ChatGPT,看NLPer怎么说?

2023-03-14 10:08:50   来源:商业新知网

本文从NLP从业人员的角度

畅谈对ChatGPT的看法和思考


(资料图片)

ChatGPT模型可以走多远呢?

我们可以把它交给时间来见证。

当前科技领域最有热度的话题,无疑是 OpenAI 新提出的大规模对话语言模型ChatGPT ,一经发布上线,短短五天就吸引了百万用户,仅一个多月的时间月活已然破亿,并且热度一直在持续发酵,各行各业的从业人员、企业机构都开始体验关注甚至自研“类ChatGPT”模型。这里,笔者从一位NLP从业人员的角度谈一谈对ChatGPT的一些看法和思考。

1、ChatGPT诞生之路

1.1 BERT

2018年,谷歌提出BERT(Bidirectional Encoder Representation from Transformer)模型,一时之间疯狂屠榜,在各种自然语言处理领域建模任务中取得了最佳的成绩, NLP自此进入了大规模预训练语言模型(Large Language Model,LLM) 时代 。

BERT做了一件什么样的事情呢,我们通过以下例子做个说明:_____和阿里、腾讯并中国互联网 BAT 三巨头。上述空格应该填什么呢?有的人说“百度”,有的人回答“字节”……不论填什么,都表明,空格处应该填写的信息是受到上下文决定和影响的。BERT所做的事就是从大规模的文本语料中,随机地MASK掉一部分字词,形成如同示例的完形填空,然后不断地学习空格处到底该填写什么。通过这种形式不断的迭代训练,并结合其它语言学任务优化微调模型,从而让BERT模型可以关注到文本语料的上下文信息。 所谓语言模型,就是从大量的数据中学习复杂的上下文联系。

1.2 GPT

2018年6月,OpenAI 早于 BERT发布了一个GPT 模型,大致思想是一样的,都是 基于 Transformer 编码器,获取文本内部的上下文联系 。在语言模型中,编码器和解码器都是由一个个的 Transformer 组件拼接堆叠在一起形成的。BERT使用了Transformer的Encoder编码器部分进行模型训练,更适合语义理解相关任务,GPT使用了 Decoder 部分进行模型训练,更适合文本生成相关任务。

图注:Transformer编码器 Encoder-Decoder结构

1.3 GPT-2

自从 BERT炸街后,各种变体改进模型越来越多,比如 ALBERT、ROBERTA、ERNIE,BART、XLNET、T5 等等。最初,预训练任务仅仅是一个完形填空任务就可以让模型有了极大进步,那么,如果给 LLM 模型更多语言题型,应该可能会对模型训练有更大的帮助。于是。句子乱序、多项选择、判断、改错等任务题型纷纷被构建并塞到BERT模型预训练阶段,各种任务数据集如机器翻译、文本摘要、问答理解等全部添加进去提升训练阶段的复杂度和预期效果。 GPT-2 就是在 GPT模型的基础上,添加了多任务学习,同时扩增了数据量和模型结构参数,进行更深的训练迭代。 其整体测试效果如下:

图注:GPT-2论文实验效果图

1.4 GPT-3

GPT-3 模型所采用的数据量达到45TB,模型参数量达到1750亿, 模型训练学习和计算复杂度远超以往所有模型 ,上一代GPT2模型参数量仅有15亿,用了40G训练数据。GPT-3的大模型计算量是 BERT的上千倍,如此巨大的模型造就了 GPT-3 在许多困难的 NLP 任务,如撰写复杂逻辑的文章,编写SQL查询语句、Python或JS代码上都有更优异的表现。

一般预训练模型的使用都是两段式的,先用大规模数据集对模型进行预训练,再利用下游任务标注数据集进行 Finetune,这也是绝大多数 NLP 模型任务的基本工作流程。 GPT-3 开始颠覆了这种认知,提出了一种 in-context 学习方式 ,举个例子:

用户输入到 GPT-3:你觉得 Jieba是个好用的工具吗?

GPT-3输出1:我觉得很好啊。

GPT-3输出2:Jieba是什么东西?

GPT-3输出3:你饿不饿,我给你做碗面吃……

GPT-3输出4:Do you think jieba is a good tool?

对于不同的任务场景,GPT-3模型输出不同的答案更符合预期。in-context 学习方式正是对此添加了情境引导:如用户输入到GPT3:“请把以下中文翻译成英文:你觉得 Jieba是个好用的工具吗?”显而易见,GPT3模型可以针对性的回答输出4是最优答案。整个学习机制类似于前不久比较火爆的Prompt-Learning,使得GPT-3模型异常强大。

1.5 ChatGPT

GPT系列模型都是采用Transformer模型结构的 Decoder部分进行训练的,更加适合文本生成任务。即输入一句话,输出也是一句话的形式,可以称之为对话模式。这引出了本文的主角ChatGPT,一种优化的大规模对话语言模型,新一代GPT-3.5。ChatGPT 模型结构上和之前的 GPT-3模型没有太大变化,最主要变化的是训练策略变了,引入了强化学习(Reinforcement Learning, RL)进行模型训练,添加合理的奖励机制让模型能更好的理解和适应各种场景。

2017年,AlphaGo围棋博弈击败了柯洁,引起了一波新的人工智能浪潮和思考,强化学习如果在适合的条件下,完全有可能打败人类,不断的成长,逼近极限完美的状态。强化学习是一种新的学习机制,就像生物进化一样,模型在给定的环境场景中,不断地根据环境的惩罚和奖励(reward),拟合到一个最适应环境的状态。AlphaGo就是一个典型的成功示例。同时这也引发了新的思考,NLP + RL,可以做吗?怎么做?很多人可能都会觉得不太合适,自然语言处理所依赖、所研究的环境,是整个现实世界,是一个通用场景,这 使得无法设计反馈惩罚和奖励函数能够很好的与之相匹配 。除非人们一点点地人工反馈,或者把研究目标场景限定在某一个垂直限定领域。OpenAI 提出的 ChatGPT 把这件事实现了,他们雇用40个外包,进行人工标注反馈和奖励,参与模型的迭代训练,这种带人工操作的 reward机制,被称之为 RLHF(Reinforcement Learning from Human Feedback)。整体操作过程如下:

(1)搜集说明数据(prompt训练方式,引入人工),训练监督策略;

(2)搜集比较数据(引入人工排序),训练奖励模型机制;

(3)搜集说明数据(新的prompt抽样),使用PPO强化学习优化迭代模型;

经过不断的训练、学习、迭代反馈,ChatGPT模型不断优化提升并最终呱呱落地,开启对外公众测试,成功赢得了全球相关科研及从业人员的掌声,诸多企业及研究机构开始投入自己的“ChatGPT模型”研究。

2、ChatGPT 引发思考

ChatGPT使用了Transformer神经网络架构,即GPT-3.5架构,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等NLP领域建模任务。

理解乱序文本(语言模型)

信息抽取

问答理解

做高数题(文本理解)

写文章(文本生成)

ChatGPT 预训练语言模型集自然语言理解(NLU)、自然语言生成(NLG)于一身,它的影响在 NLP 领域可以划分为三个层级:

(1)语言理解 :ChatGPT 模型的 NLU 能力是通过对大规模数据集的训练来构建的,拥有非常强大的解释力和语义理解能力;

(2)技术整合 :ChatGPT 不仅可以应用在 NLU 领域,还能够跟其他领域的技术整合,如机器视觉、机器翻译等等,以实现多种场景模态沟通融合;

(3)对话管理 :ChatGPT 能够有效的模拟真实对话场景,可以实现自然的语句转换和上下文恢复,能够更准确的回答用户的查询和了解用户的意图。

传统 NLP 技术依赖于大量数据集和算法,这意味着技术的设计实现,需要开发者们耗费大量的时间和精力来整理和准备数据,以便计算出有效的输出结果。ChatGPT模型为用户提供了一种全新的方式,该方式 可以在更短时间内生成出更具有代表性的结果 ,这对于 NLP 迅速应用落地和迭代具有重要作用。ChatGPT 还可以很好地处理大量未标记的数据,从而极大地提升了 NLP 技术的灵活性和可扩展性。同时, ChatGPT 模型可以弥补 NLP 技术在语义理解准确率上的不足 ,以更精准的方式处理复杂问题,从而使机器学习更加准确和全面。

此外,ChatGPT 的出现会给安全问题带来巨大挑战, ChatGPT 技术的准确性和先进性可能会威胁到一些有关网络和数据安全领域的要求 ,鉴于其高准确率,ChatGPT 可能会更容易被滥用。例如,ChatGPT 技术可能受到不法分子的滥用,从而加强他们利用自然语言处理进行入侵和盗取信息的行为,并带来许多安全风险,以及使用 ChatGPT 引发的文本识别隐私可能性等等。特斯拉CEO马斯克也感叹:“我们可能离强大到危险的人工智能不远了”。

虽然ChatGPT模型 可能会带来一定程度的安全问题隐患,它对安全领域发展的推动和促进作用有着更重要的意义 。以ChatGPT模型在数据安全领域的应用为例,我们来考虑一个敏感关键信息识别的任务,当模型可以在任意场景下准确的识别出敏感信息数据,我们就可以更有效的保护重要数据避免意外泄露,造成用户潜在损失。ChatGPT模型在这里会有怎么样的效果呢?考虑到它的RLHF训练学习奖惩机制,我们可以通过不断的投喂数据进行迭代反馈,告知模型哪些属于敏感信息,哪些文本数据非敏感,ChatGPT会逐渐的学会对敏感文本信息的识别和判定,甚至对于新的场景和类型文本也会拥有挖掘定义及识别敏感信息的能力。接下来,敏感信息识别的问题就转化为了数据问题,这似乎是一个可行的解决思路?

无可厚非,ChatGPT模型目前针对明确的任务及问题,很多时候会给出甚至比人类更专业、更合理的答案,远超预期,可能给我们的工作和生活会带来诸多便利;但是它有时候也会写出看起来似是而非的答案,可能会出现一些重复的词句,无法分清楚事实等等,其创新性和创造性也有待更精细的考验。同时, ChatGPT模型带来的风险和诸多问题也是我们不容忽视的着力点 ,甚至已经在我们的日常社会生活中产生了一些不好的影响,如果你有关注相关新闻消息的话。当然,未来的ChatGPT肯定会更加强大。数据+算力+算法,当所有的条件都水到渠成,ChatGPT模型可以走多远呢,我们可以把它交给时间来见证。

关键词:

上一篇:
下一篇:
精彩阅读

微资讯!山石发声|风暴眼中的ChatGPT,看NLPer怎么说?

热点

当前科技领域最有热度的话题,无疑是OpenAI新提出的大规模对话语言模型ChatGPT。

环球快资讯丨GAN的反击:朱俊彦CVPR新作GigaGAN,出图速度秒杀Stable Diffusion

热点

在文生图领域,扩散模型似乎已经一统天下,让曾经也风头无两的GAN显得有些过时。

技术专家控诉ChatGPT:到处宣扬我死了,还伪造了一份讣告

热点

在跟ChatGPT交流的过程中,Hanff震惊地发现,在ChatGPT的世界里,自己已经去世了。

天天快看点丨金融时报:库克力排众议于今年推出新头显设备;Envisics获超过5000万美元C轮融资

热点

这一举措如果放在前几年,其实是不可想象的,因为当时苹果的设计团队有着极大的话语权。

当前要闻:定档3月21日,AR领域新技术、新产品即将亮相,2023易现春季发布会前瞻

热点

从算法、AR云平台,到软硬一体的解决方案打造,相信易现将通过本次发布会给我们构建一个AR生态健康发展的闭环。

【新要闻】候选人公示!涉中广电移动2023年度广电5G号卡配送项目

热点

3月9日,中广电移动网络有限公司公示了中广电移动2023年度广电5G号卡配送服务项目招标中标候选人。

奇点云联合创始人刘莹入选“福布斯2023中国商界20位潜力女性”

热点

福布斯中国发布“福布斯中国商界20位潜力女性”,奇点云联合创始人、StartDTCOO刘莹入选榜单。

天天观察:ChatPDF利用AI技术,任何PDF文件都可以进行智能交流

热点

若用户提出了问题,则使用NLP技术将问题转化为向量,并计算该问题向量与所有自然段落向量的相似度。

易点云更新招股书:提供一站式办公IT服务,源码、经纬、顺为持股超10%

热点

与美国设备数量60 0%的市场渗透率相比,中国的用量付费办公IT行业仍处于发展初期,渗透率为3 2%。

世界即时看!阿里达摩院自动驾驶负责人陈俊波离职,进军户外清洁机器人!

热点

原阿里达摩院自动驾驶负责人陈俊波(歌德)已离职创业。

财富

i5和i7的区别有多大?i5处理器和i7处理器区别是什么?

资讯

英特尔CPUi5系列和i7系列有什么区别?英特尔CPU i5系列和i7系列的主要区别在于核心数量、线程数量和缓存大小。i7系列通常具有更多的核心和

手机没声音如何恢复?手机外放没有声音怎么回事?

资讯

手机没声音如何恢复?手机音量未打开,将手机音量打开即可,手机开启了静音模式或是免打扰,可能也会没有声音,在快捷菜单栏中关闭静音模式

家庭显示器推荐是什么?适合游戏办公显示器推荐?

资讯

家庭显示器推荐是什么?家用电脑显示器推荐你用HKC这个品牌的,我个人觉得这个牌子的最好,这个品牌显示器所用的配件都是自家生产的,并且是

环球快讯:加码直播电商,小红书奋力一搏能恰到饭吗?

资讯

加码直播电商,小红书奋力一搏能恰到饭吗?,没有李佳琦,小红书女孩会买账吗?

车市降价虽凶狠,但千万别昏了头

资讯

车市降价虽凶狠,但千万别昏了头,汽车行业最近的集体降价

叮咚买菜背叛生鲜电商

资讯

叮咚买菜背叛生鲜电商,从长远看,我们都死了

天天新资讯:身为 ChatGPT 概念股,知乎却想做下一个晋江?

资讯

身为ChatGPT概念股,知乎却想做下一个晋江?,当社区变得功利

微博与B站,变现“难兄难弟”

资讯

微博与B站,变现“难兄难弟”,内容社区平台个个都苦于流量变现

女歌手卖烧烤年入百万,餐饮的钱真这么好赚?

资讯

女歌手卖烧烤年入百万,餐饮的钱真这么好赚?,餐饮创业并非易事。

腾讯游戏,“迷失”自己

资讯

腾讯游戏,“迷失”自己,游戏公司取得商业成功不再是唯一追求

环球快资讯丨GAN的反击:朱俊彦CVPR新作GigaGAN,出图速度秒杀Stable Diffusion

在文生图领域,扩散模型似乎已经一统天下,让曾经也风头无两的GAN显得有些过时。

技术专家控诉ChatGPT:到处宣扬我死了,还伪造了一份讣告

在跟ChatGPT交流的过程中,Hanff震惊地发现,在ChatGPT的世界里,自己已经去世了。

天天快看点丨金融时报:库克力排众议于今年推出新头显设备;Envisics获超过5000万美元C轮融资

这一举措如果放在前几年,其实是不可想象的,因为当时苹果的设计团队有着极大的话语权。

当前要闻:定档3月21日,AR领域新技术、新产品即将亮相,2023易现春季发布会前瞻

从算法、AR云平台,到软硬一体的解决方案打造,相信易现将通过本次发布会给我们构建一个AR生态健康发展的闭环。

【新要闻】候选人公示!涉中广电移动2023年度广电5G号卡配送项目

3月9日,中广电移动网络有限公司公示了中广电移动2023年度广电5G号卡配送服务项目招标中标候选人。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个