全球信息:计算机孟灿|计算机行业深度研究:LLaMA等开源模型凸显先进算法及行业数据的重要性

2023-04-17 11:17:47   来源:商业新知网


(相关资料图)

自2017年Transformer发布以来,大语言模型经历了由开源到逐步闭源的转变,头部公司先进模型的壁垒逐步形成。 目前OpenAI、Google等领先的头部AI大厂对于先进模型大多采用部分开源或仅开放使用的模式,以此构建技术护城河。然而,将AI大模型直接应用于垂直行业,存在通用能力过剩、行业专业知识储备不足、推理过程消耗算力过高等问题。基于开源模型进行垂类模型开发可兼顾开发成本和数据安全,尤其是对于党政军、金融、电网、先进制造等数据敏感性较高的行业而言。 Meta旗下LLaMA大模型的开源或能为垂类模型落地提供预训练模型底座。 LLaMA基于通用领域的开源数据集进行训练,训练数据涵盖40种语言,包含约1.4万亿Tokens。尽管LLaMA模型参数量较小,但性能丝毫不逊色于PaLM、GPT-3等大语言模型。并且较小的参数规模显著降低了LLaMA模型的落地部署和二次开发难度。 LLaMA作为完全开源的领先模型,具备高度的灵活性、可配置性和泛化能力,可以作为垂类AI模型的通用基座。 基于LLaMA,垂类AI开发者可以根据其行业特点、应用行业数据定制开发相应的“行业发行版AI模型”。LLaMA模型一经发布就对外完全开源,吸引了广大AI开发者和研究者。目前,用户可在全球知名AI模型开源社区Hugging face中获取LLaMA的模型权重与训练代码。能够自由下载并使用LLaMA模型,既可以将其部署至设备直接进行推理,也可以基于LLaMA进行研究与二次开发。 我们测算了模型在迁移学习阶段的训练算力成本,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。 例如,斯坦福大学于2023年3月对外发布Alpaca,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练得到的对话类语言模型,该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。 在推理阶段,根据我们的初步测算,由8块A100组成的AI服务器可为规模达2,000人的中大型企业提供AI服务,离线部署方案每年的推理算力成本约为33.2万元,若采用云计算方案则每年需花费约66万元算力成本。基于上述推理成本分析,推理成本并不高昂,绝大多数中型以上企业足以负担,为各领域垂类模型落地提供了极为广阔的市场空间。 投资建议 LLaMA等优质开源模型的推出极大加速了下游行业AI应用开发效率。基于“通用基座+迁移学习+微调”的垂类AI模型开发范式或将成为主流,优质的行业数据资源成为影响模型性能的关键。 在此趋势之下,我们看好两类企业:1)拥有开发先进大模型能力的企业。这类企业在先进模型逐步走向闭源的趋势下,有望保持算法优势,如商汤科技、科大讯飞等。2)拥有丰富行业数据的头部公司。这类企业有望基于稀缺的行业数据以及开源模型,开发出可用性更强的垂类模型。如东方财富、同花顺、恒生电子等。 风险提示 海外基础软硬件使用受限;骨干网络创新放缓;应用落地不及预期

关键词:

上一篇:
下一篇:
精彩阅读

全球信息:计算机孟灿|计算机行业深度研究:LLaMA等开源模型凸显先进算法及行业数据的重要性

热点

Meta旗下LLaMA大模型的开源或能为垂类模型落地提供预训练模型底座。

世界短讯!《人人都能玩赚ChatGPT》:一份简明易懂的ChatGPT技术指南

热点

在科技日新月异的时代,人工智能无疑成为了当之无愧的热点话题。

快资讯:中国SaaS还有希望吗?

热点

最近北森上市股价破发,我创建的1000多人的SaaS高管群一片哗然。

观察:试问行业:AIGC到底动了谁的蛋糕?

热点

AIGC的发展速度之快,令人咋舌。

大数据时代必备技能,从0开始学好数据可视化

热点

数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。

【邀请函】广电AI、5G与广电网络论坛

热点

4月18日至4月21日全天,深圳市茁壮网络股份有限公司关于“广电AI、5G与广电网络”的各种创新产品展示。

天天消息!亏损350亿美元,苹果MR来袭,Meta 的“iPhone 时刻”要破灭了?

热点

距离去年的11月份裁员至今不到半年,Meta在3月份又宣布了第二轮裁员,两轮裁员人数涉及2万多人。

【天天热闻】大模型涌现前,巨头涌入AI广告

热点

自ChatGPT在全球掀起狂潮至今,市场上关于AIGC(生成式AI)未来的发展走势和商业场景的探讨愈演愈烈。

新消息丨在万人攒动的马拉松现场使用5G网络,是种什么体验?

热点

重庆作为备受欢迎的旅游网红城市,因美食、文化、历史等特色吸引众多游客前往,年接待量高达5亿人次。

财富

哪些手机支持raw格式?电脑文件平铺怎么设置?

资讯

哪些手机支持raw格式?1、首先进入某个目录,然后将该目录中空白处右键选择平铺,将所有的文件和文件夹都设置成平铺显示;2、接着进入资源管

服务器超时什么意思?检查服务器超时是什么原因?

资讯

服务器超时什么意思?服务器超时有两种含义。第一种含义是,由于客户端与服务器端的网络连接状态不佳,导致客户端没来得及与服务器端成功建

怎么设置笔记本风扇的触发温度?笔记本电脑能设置风扇吗?

资讯

怎么设置笔记本风扇的触发温度?1 进入BIOS设置页面。在开机时,按下笔记本电脑制造商指定的进入BIOS的热键,通常是F2或DEL键。2 找到风

实体店买平板可以换货吗?平板买的太贵想退可以吗?

资讯

实体店买平板可以换货吗?只要平板没有开机就可以退的,这还要看您买的地方是否承诺7天可以有条件退货了,如果没有承诺就退不了,一般网上买

焦点观察:坐拥2100亿美元财富,全球首富阿尔诺什么来头?

资讯

坐拥2100亿美元财富,全球首富阿尔诺什么来头?,和行事高调的马斯克相比,74岁的法国人阿尔诺是一个相当低调的人。

世界今日报丨三千亿美妆市场,开始卷「体育」了

资讯

三千亿美妆市场,开始卷「体育」了,中国美妆市场的新蓝海。

过往十年餐饮资本市场回顾:长坡厚雪,水火交融

资讯

过往十年餐饮资本市场回顾:长坡厚雪,水火交融,民以食为天,食品餐饮赛道长坡厚雪,穿越周期,产业人和资本人都需要坚定“长期主义”的信仰,

自动点击为什么不能用?怎样关闭自动点击设置?

资讯

自动点击为什么不能用?1、首先在手机桌面点击设置图标。2、 进入到手机的设置界面以后,下拉菜单,然后选择其他设置选项。3、接着在其他设

win7台式电脑蓝牙怎么连接耳机?台式电脑连接蓝牙耳机当麦克风?

资讯

win7台式电脑蓝牙怎么连接耳机?可以。通过蓝牙适配器连接蓝牙耳机可以实现语音通话的,建议入手蓝牙适配器5 0版本,毕竟高版本可以向下兼容

电脑怎么解锁手机锁屏密码?手机锁屏与密码如何解开?

资讯

电脑怎么解锁手机锁屏密码?1、PC端安装刷机精灵最新版(官方地址就是百度刷机精灵第一个就是),电脑启动刷机精灵客户端。 2、手机端开启USB

世界短讯!《人人都能玩赚ChatGPT》:一份简明易懂的ChatGPT技术指南

在科技日新月异的时代,人工智能无疑成为了当之无愧的热点话题。

快资讯:中国SaaS还有希望吗?

最近北森上市股价破发,我创建的1000多人的SaaS高管群一片哗然。

观察:试问行业:AIGC到底动了谁的蛋糕?

AIGC的发展速度之快,令人咋舌。

大数据时代必备技能,从0开始学好数据可视化

数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个