白话版,聊聊“深度学习”

2022-04-25 15:17:08   来源:商业新知网

来源:浪潮服务器

1956年,达特茅斯会议,“人工智能”概念被首次提出。 他们梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样特性的机器。

发展至今, 人工智能可以划分为两类:弱人工智能和强人工智能。 前者让机器具备观察和感知的能力,能做到一定程度的理解和推理; 而强人工智能是让机器获得自适应能力,解决一些从没遇到过的问题。 这里的“智能”从何而来? 人工智能又如何取得突破? 要从一种实现人工智能的方法——机器学习说起。

白话版走心解读: 从发展阶段来看,我们目前还处于弱人工智能阶段。幸运的是,似乎还不用担心人工智能是不是会把人类打趴在地;不幸的是,那些落地的人工智能应用已经出现了各种弊端和不足。所以我们现在更需要做的,可能不是恐惧机器会变成我们,而是如何让机器更理解我们。

什么是机器学习?

与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

白话版走心解读 : 在人工智能的研究上,“猫”一直是热门明星,所以我们就用“识别猫咪”来解释一下机器学习。假设要构建一个识别猫的程序:传统上如果想让计算机识别,需要输入一串指令,例如猫长着毛茸茸的毛、顶着一对三角形的耳朵等,然后计算机根据这些指令执行下去。但如果我们对程序展示一只老虎的照片,程序可能会沙雕……

除此外,传统方式要制定全部所需规则,而且过程中必然会涉及到一些困难的概念,比如对毛茸茸的定义。因此更好的方式是让机器自学。为计算机提供大量猫的照片,随着实验增加,系统会不断学习更新,最终能准确地判断出哪些是猫,哪些不是。

这里有三个重要信息: 1. “机器学习”是“模拟、延伸和扩展人的智能”的一条路径,是人工智能的一个子集; 2. “机器学习”要基于大量数据,也就是说它的“智能”是用大量数据喂出来的; ( 敲 黑板! !! 这个后面会用到) 3. 正是因为要处理海量数据,所以大数据技术尤为重要,而“机器学习”只是大数据技术上的一个应用。

虽然传统的机器学习算法在指纹识别、人脸检测等领域的应用基本达到了商业化要求,但“再进一步”却很艰难,直到深度学习算法的出现。

什么是深度学习?

深度学习(Deep Learning)属于机器学习的子类,是目前最热的机器学习方法,但它并不意味着是机器学习的终点。 它的灵感来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。 深度神经网络本身并非是一个全新概念,可理解为包含多个隐含层的神经网络结构。

白话版走心解读: 我们来看看深度学习是如何工作的。以人脸识别为栗子。如果是传统机器学习,首先要确定相应的“面部特征”作为机器学习的特征(眼睛、鼻子等等),以此来对对象进行分类识别。而深度学习能自动找出这个分类问题所需要的重要特征。它是如何做到的?让机器深度学习,总共分三步:1. 确定出哪些边和角跟识别出人脸关系最大;2. 根据上一步找出的很多小元素(边、角等)构建层级网络,找出它们之间的各种组合;3. 在构建层级网络之后,就可以确定哪些组合可以识别人脸。 来个示意。

第一步,输入的是Raw Data,就是原始数据,这个机器是没法理解的。 于是,深度学习首先尽可能找到与这个头像相关的各种边,这些边就是底层的特征(Low-level features); 然后下一步,对这些 底层特征进行组合,就可以看到鼻子、眼睛、耳朵等,它们是中间层特征(Mid-level features); 最后,对鼻子、眼睛等进行组合,就可以组成各种各样的头像,也就是高层特征(High-level features)。 这个时候,它就可以识别出各种人的头像了。

机器学习和深度学习有哪些维度的不同?

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。 一个同心圆就可以展现出它们的关系。

具体不同大致有以下几点。

1. 数据依赖。 随着数据量的增加,二者的表现有很大区别。 深度学习适合处理大数据,而数据量比较小的时候,用传统机器学习方法也许更合适。

2. 硬件依赖。 深度学习十分地依赖于高端的硬件设施,因为计算量实在太大。 它会涉及很多矩阵运算,因此很多深度学习都要求有GPU(专门为矩阵运算而设计的)参与运算。

3. 特征工程。 简单讲就是在训练一个模型的时候,需要首先确定哪些特征。 在机器学习方法中,几乎所有特征都需要人为确认后,再进行手工特征编码。 而深度学习试图自己从数据中学习特征。

4. 解决问题的方式。(重点!) 解决问题时,机器学习通常先把问题分成几块,一个个地解决好之后,再重新组合。 但是深度学习是一次性、端到端地解决。

白话版走心解读: 举个栗子。

我们设定任务是识别出图片上有哪些物体,并找出它们的位置。机器学习的做法是把问题分两步:发现物体和识别物体。但深度学习不同,它可以直接把对应物体识别出来,同时还能标明对应物体名字。这个好处就是,实时性。

5. 运行时间。 深度学习需要花大量时间来训练,因为有太多参数要去学习。 机器学习一般几秒钟最多几小时就可以训练好。 但深度学习训练出的模型优势就在于,在预测任务上运行非常快。 也是刚刚提到的实时物体检测。

深度学习前加个“分布式”,又是怎么回事?

面对越来越复杂的任务,数据和深度学习模型的规模都变得日益庞大。 当训练数据词表增大到成百上千万时,如果不做任何剪枝处理,深度学习模型可能会拥有上百亿、甚至是几千亿个参数。

为了提高深度学习模型的训练效率, 分布式训练出现了——即同时利用多个工作节点,分布式地、高效地训练出性能优良的神经网络模型。

目前主要有两种并行化/分布式训练方法:数据并行化和模型并行化。

数据并行化里,不同的机器有同一个模型的多个副本,每个机器分配到数据的一部分,然后将所有机器的计算结果按照某种方式合并; 模型并行化里,分布式系统中的不同机器负责单个网络模型的不同部分。 比如,神经网络模型的不同网络层被分配到不同机器。

白话版走心解读 : “并行化”顾名思义,就是一起并肩工作。酷暑正当,我们就用制作棒冰举栗子。先说数据并行化。工厂A要在一天内做50000支棒冰,为了更高效完成,这个任务被分给了100个车间,当然开工前需要大家进行培训,确保每个人都了解了棒冰的制作过程。这里的“车间”就是机器,“50000支”就是数据,“培训资料”就是模型。

同理,模型并行化就是这样。同样是50000支棒冰,但其中10000支生产简单,其余40000支工艺复杂。于是车间里两位师傅分别扛起了这两部分任务,分头进行。“50000支”就是数据,“师傅”就是GPU,生产工艺就是“模型”,不同工艺就相当于不同的网络层。

版权声明

来源 :浪潮服务器 , RAD极客会推荐阅读,不代表RAD极客会立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!

关键词: 机器学习 人工智能

上一篇:
下一篇:
精彩阅读

白话版,聊聊“深度学习”

热点

发展至今,人工智能可以划分为两类:弱人工智能和强人工智能。

接过了国产化替代这杆大旗 星环科技的自研更有底气

热点

可以说,国产化IT技术近些年呈现出了更加快速、全面的发展态势。

破局而立的以太全光网,凭什么站在企业级园区网络的“上风处“?

热点

数字化浪潮已至,上层应用创新如雨后春笋般涌现,底层数字基础设施也不得不与时俱进,传统园区网络正迎来一束光的变革。

吴说每周矿业资讯:0418-0424 美国制裁俄罗斯矿业

热点

据美国财政部官网,OFAC指定了从事俄罗斯虚拟货币采矿业的公司加入被制裁名单,这是财政部首次指定虚拟货币挖矿公司。

社交购物元宇宙七朋元视界创新元宇宙新型购物体验

热点

社交购物元宇宙七朋元视界创新元宇宙新型购物体验。

2021年亚马逊Alexa设备出货量锐减 导致智能音箱市场回落

热点

来自市场研究公司Omdia的最新报告称,智慧公寓市场正在蓬勃发展。

主流媒体人 | 元宇宙和媒体传播的未来!

热点

2021年下半年,元宇宙概念横空出世,吸引社会各界人士竞相关注。

腾讯「NokNok」APP上线

热点

‍最近腾讯正在内测游戏社交App「NokNok」,简称KK,中文名「闹闹社区」。

企业如何进行数字化转型?零代码简道云剑指「全民开发」新机遇

热点

2025年低代码市场规模预计达到131亿,行业整体有望保持52 6%的复合增长。

开发者注意!据传App Store 将下架长期未更新App!

热点

今日,一则“苹果商店将下架长期不更新应用程序”话题冲上了热搜榜第4。

财富

台积电3nm工艺下半年生产,2nm明年量产,2023年没戏

资讯

根据台积电的信息,3nm工艺今年下半年生产,不过明年才能大规模量产,2nm则要到2025年才能量产,这两代工艺的VIP客户都是Intel和苹果,他们

体验经济时代,长虹引领电视产业新发展

资讯

体验经济时代,潜在消费者对产品的体验程度,影响着产品的市场表现力。对于2022年的8K电视来说,体验经济模式带来的效应非常明显。体验改变

全球第一!宁德时代2021年净利润159.31亿元

资讯

4月21日晚间,宁德时代发布2021年财报,数据显示,2021年营业收入约1303 56亿元,同比增加159 06%;归属于上市公司股东的净利润约159 31亿元

13mini不受欢迎 苹果将停产5.4英寸iPhone14mini

资讯

苹果要放弃mini系列是有原因的,因为用户都不是很买单。消费者数据研究机构CIRP的一份新报告展示了iPhone阵营各款手机的销售状况。iPhone

联想承诺2025年全线计算机产品100%含再生塑料

资讯

越来越多的科技公司开始参与环保事业,不仅推进清洁能源,也在加大对再生材料的支持,全球最大的PC厂商联想今天承诺到2025年,全线计算机产

为环保不再标配充电器,苹果被巴西法院罚款

资讯

从iPhone 12系列开始,苹果为环保不再标配充电器,这一举措导致苹果被罚款。4月22日消息,据当地媒体Tecmundo报道,巴西戈亚尼亚市一家法

东微半导体2021年净利润1.47亿元,同比增430.66%

资讯

东微半导体昨日发布2021年年度报告。报告期内,公司实现营业收入7 82亿元,较去年同期相比增加153 28%;归属于上市公司股东的净利润约1 47亿

当下自动驾驶商业化落地过程中的五大难点

资讯

当聊到自动驾驶商业化落地的时候,我们通常可能会想到Robotaxi、物流、矿山、港口码头、固定路线区域接驳、无人环卫、自主泊车等等。每一个

石头科技披露2021年年报及2022年一季报 净利润14.02亿元

资讯

4月21日晚间,石头科技披露了2021年年报及2022年一季报。年报显示,2021年石头科技实现营业收入约58 37亿元,同比增长28 84%;归属于上市公

致欧科技更新招股书,财务资料过期被交易所中止申报

资讯

随着移动互联网技术的发展,电商已成为人们购物的重要方式之一。作为世界工厂的中国,凭借着在供应链方面的优势,在亚马逊、ManoMano、Cdis

接过了国产化替代这杆大旗 星环科技的自研更有底气

可以说,国产化IT技术近些年呈现出了更加快速、全面的发展态势。

破局而立的以太全光网,凭什么站在企业级园区网络的“上风处“?

数字化浪潮已至,上层应用创新如雨后春笋般涌现,底层数字基础设施也不得不与时俱进,传统园区网络正迎来一束光的变革。

吴说每周矿业资讯:0418-0424 美国制裁俄罗斯矿业

据美国财政部官网,OFAC指定了从事俄罗斯虚拟货币采矿业的公司加入被制裁名单,这是财政部首次指定虚拟货币挖矿公司。

社交购物元宇宙七朋元视界创新元宇宙新型购物体验

社交购物元宇宙七朋元视界创新元宇宙新型购物体验。

2021年亚马逊Alexa设备出货量锐减 导致智能音箱市场回落

来自市场研究公司Omdia的最新报告称,智慧公寓市场正在蓬勃发展。

龙芯中科胡伟武:自主又兼容夯实信息产业“三箭齐发”

龙芯中科董事长胡伟武在线上发表了关于LoongArch生态建设的演讲。胡伟武表示,指令系统是自主信息产业绕不过去的话题,我国不可能基于国外

锐龙55600G评测:台积电7nm工艺,6核心12线程

自从AMD推出Zen3架构的锐龙5000系列处理器后,在市面上大杀四方,不论是单核性能、多核性能还是游戏性能都远胜于Intel10代和11代酷睿,甚至

欧菲光:公司8P镜头项目已研发成功,目前处于试产阶段

曾经为苹果提供镜头模组的欧菲光今日在互动平台表示,公司团队历经多年技术攻坚,突破高端镜头技术壁垒,一亿像素7P光学镜头已量产,长焦镜

支付宝:处置69375个违规账号和参与“跑分”的账号

4月19日下午,支付宝安全中心官方发布了 关于持续打击电信网络诈骗、租售账号等违规行为的公告 。为保障用户账户安全,营造清澈、安全的

华润啤酒频现“超标排放”环保问题遭罚款

4月18日,北京商报记者在聊城市生态环境局注意到,华润雪花啤酒(聊城)有限公司(以下简称雪花聊城公司)因涉嫌超标排污被聊城市生态环境局罚

Eurocom推出15.6英寸笔记本电脑工作站

Eurocom 正推出 15 6 英寸的 Raptor X15 Mobile Supercomputer,该工作站采用 LGA1700 插槽的英特尔第 12 代桌面处理器。通过最