ChatGPT“狂飙”,一个大模型的时代正在来临

2023-04-12 17:22:24   来源:商业新知网

2023年无疑是人工智能的“爆发年”,各种基于AI的新技术如雨后春笋般拔地而出,其中AI大模型成为了全球科技公司的“角逐场”。

3月16日,百度推出文心一言,标志着中国企业正式踏入这一AI新赛道,而这无疑只是一个开始。4月7日,阿里巴巴旗下的大语言模型——“通义千问”开启企业邀测。

随着ChatGPT“狂飙”,一个大模型的时代正在来临,加速千亿甚至万亿参数的大模型陆续出现。


(相关资料图)

NO.1

NLP五级进阶,大模型应运而生

从基于规则到基于人的意识,大型语言模型是技术进步的必然产物。NLP(Natural LanguageProcessing,自然语言处理)发展到大型语言模型的历程可分为五个阶段: 规则、统计机器学习、深度学习、预训练、大型语言模型。

考虑到机器翻译是NLP中难度最高、综合性最强的任务,可借助该功能来论述不同技术阶段的典型特点。

从1956年到1992年,基于规则的机器翻译系统在内部把各种功能的模块串到一起,由人先从数据中获取知识,归纳出规则后教给机器,然后由机器执行这套规则,该阶段为 规则阶段;

从1993年到2012年是 统计机器学习阶段, 在此期间,机器翻译系统可拆成语言模型和翻译模型,该阶段相比上一阶段突变性较高,由人转述知识变成机器自动从数据中学习知识,当时人工标注数据量在百万级左右;

从2013到2018年,进入 深度学习阶段, 其相比于上一阶段突变性较低,从离散匹配发展到 embedding 连续匹配,模型变得更大,标注数据量提升到千万级;

预训练阶段 存在于2018年到2022年,跟之前比较,最大变化是加入了NLP领域杰出的自监督学习,将可利用数据从标注数据拓展到了非标注数据。该阶段系统可分为 预训练 和 微调 两个阶段,将预训练数据量扩大3到5倍,典型技术栈包括 Encoder-Decoder、Transformer、Attention 等。

大模型阶段 在数据标注、算法、人机关系三方面的性能均有跨越式提升。从2023年起开始进入大模型阶段,该阶段的突变性很高,已经从专用任务转向通用任务或是以自然语言人机接口的方式呈现,旨在让机器遵循人的主观意志。

在数据标注方面, 大模型已经从原来需要大量标注数据进化到运用海量非标注数据,越来越多数据被利用起来,人的介入越来越少, 未来会有更多文本数据、更多其它形态的数据被模型运用。在算法方面,大模型的表达能力越来越强、规模越来越大,自主学习能力越来越强,从专用向通用趋势显著。

NO.2

大模型有多“大”

ChatGPT是在GPT基础上进一步开发的自然语言处理模型。GPT模型是一种自然语言处理模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到语言模式来生成自然语言文本。 从GPT-1到GPT-4智能化程度不断提升。

第一代GPT-1诞生于2018年6月,训练参数量达1.17亿个,数据库规模为5GB;

第二代GPT-2诞生于2019年2月,训练参数量为15亿个,数据库规模为40GB;

第三代GPT-3诞生于2020年5月,训练参数量飞跃至1750亿个,数据库规模达到45TB;

第四代GPT-4诞生于2023年3月,GPT-4比以往任何时候都更具创造性和协作性,可以更准确地解决难题,可为ChatGPT和新Bing等应用程序提供支持。

从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。此外,继语言模态之后,如视觉大模型等其他模态的大模型研究,也开始逐步受到重视。进一步地, 单模态的大模型被统一整合起来,模拟人脑多模态感知的大模型出现,推动了AI从感知到认知的发展。

NO.3

大模型通用化之路

Gartner最新报告指出, 通用和可信是AI的未来两大趋势。

AI大模型兼具“大规模”和“预训练”两种属性,面向实际任务建模前需要在 海量通用数据上进行预先训练,这样才能大幅提升AI的通用性和泛化性。

从产业价值的角度来看,预训练大模型带来了一系列可能性,让产学研各界看到了由弱人工智能走向强人工智能,走向工业化、集成化智能化的路径。在这样的驱动背景下,大模型有一些可预见的趋势与发展。

此外,随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。 大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成本。

展望未来,随着AI大模型在千行百业的深入应用,人工智能将在垂直领域有更多的落地机会。我国也将在“数字中国”战略框架下,通过政策扶持助力AI技术创新和应用探索,推动整个AI产业加速驶入“快车道”。

来源:人民中科,仅供学习交流使用,如有侵权,请联系删除。

关键词:

上一篇:
下一篇:
精彩阅读

ChatGPT“狂飙”,一个大模型的时代正在来临

热点

随着ChatGPT“狂飙”,一个大模型的时代正在来临,加速千亿甚至万亿参数的大模型陆续出现。

世界滚动:从ChatGPT数据泄露事件,看组织安全稳定自动化的重要性

热点

相对ChatGPT,百度文心一言帮助企业构建自己的模型和应用的模式,将会更受广大组织的欢迎。

速读:GPT-4 Copilot X超震撼!AI写代码效率10倍提升,码农遭降维打击

热点

3月22日,GitHub官宣:基于GPT-4的新一代代码生成工具CopilotX来了!

“配角”们想抓住这个春天

热点

远离中国互联网中心舞台多时的前搜狗CEO王小川回来了,一回来就语出惊人。

AI焦虑潮下,打工人的抵抗、转向、破局

热点

一股“AI让人下岗”的焦虑,正在蔓延。

每日速看!大模型「涌现」的四个关键

热点

是诸神之战还是又一场大跃进?

天天百事通!风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴

热点

风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴。

世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

热点

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

世界快报:国家知识产权局办公室印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》

热点

近日,国家知识产权局办公室发布了关于印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》的通知。

财富

环球热文:融资丨「德适生物」完成超亿元融资,远翼投资领投

资讯

融资丨「德适生物」完成超亿元融资,远翼投资领投,继续加大染色体AI诊断技术

环球视讯!Keep卖货,生意难做

资讯

Keep卖货,生意难做,Keep何时能实现盈利自由

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投

资讯

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投,继续深耕矿山无人驾驶赛道,加速实现商业化落地

环球微资讯!融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投

资讯

融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投,募集资金将用于蓝激光微创、光动力诊疗一体化设备

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资

资讯

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资,本轮融资资金将用于内容团队组建及市场开发

电视突然闪退怎么办?电视机屏闪是什么故障?

资讯

电视突然闪退怎么办?1 软件不兼容:由于软件经常需要更新,这就造成最新版本的软件与电视或盒子的系统发生不兼容问题,当出现这种问题时,可以

空调泵坏了如何维修?空调提升泵工作原理?

资讯

空调泵坏了如何维修?1、系统内混入有空气,压缩机运行时候空气中有支持燃烧的氧气,加上压缩机的机油以及制冷剂,压缩机运行时一段时间产生

如何拆冰箱冷藏柜门板盖?冰箱冷藏框架怎么拆?

资讯

如何拆冰箱冷藏柜门板盖?首先,确保冰箱中的所有食物和饮料都被移出。然后根据您的帝度冰箱型号查找说明书,了解拆卸过程的具体步骤。一般

电磁炉万能控制板怎么接线?电磁炉万能板的安装?

资讯

电磁炉万能控制板怎么接线?1、18V接LM339第3脚。2、12V 18V接风扇接入端,(有的风扇是用12V电压的)。3、5V接CPU(一般接20或者1脚,具体因不

空调室内滴水是什么原因?空调滴水自己怎么修理?

资讯

空调室内滴水是什么原因?1、如果空调过滤网灰尘过多,只要对空调过滤网进行一个彻底的清洁,恢复亲水铝箔的亲水性,使得冷凝水能够顺利进入

世界滚动:从ChatGPT数据泄露事件,看组织安全稳定自动化的重要性

相对ChatGPT,百度文心一言帮助企业构建自己的模型和应用的模式,将会更受广大组织的欢迎。

速读:GPT-4 Copilot X超震撼!AI写代码效率10倍提升,码农遭降维打击

3月22日,GitHub官宣:基于GPT-4的新一代代码生成工具CopilotX来了!

“配角”们想抓住这个春天

远离中国互联网中心舞台多时的前搜狗CEO王小川回来了,一回来就语出惊人。

AI焦虑潮下,打工人的抵抗、转向、破局

一股“AI让人下岗”的焦虑,正在蔓延。

每日速看!大模型「涌现」的四个关键

是诸神之战还是又一场大跃进?

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个