【天天快播报】带「眼睛」的ChatGPT应用来了!150亿参数多模态大模型加持,读图、聊天样样全能

2023-03-09 10:05:13   来源:商业新知网

国产ChatGPT应用,弯道超车。

作者 | 镁客星球编辑部


(相关资料图)

在许多人的印象里, ChatGPT 是个无所不能的“怪物”。

它可以写诗,可以编代码,甚至可以直接生成长篇论文……此外,ChatGPT还极富情商、表现欲十足,只需数轮对话,就足以征服众人。

但ChatGPT真的是无所不能的吗?

作为聊天机器人,ChatGPT拥有出色的语言理解能力和文本处理能力,但受制于训练模型,ChatGPT并不支持 图片对话 。试想一下,在平日与好友进行聊天时,如果无法发送图片,那自然会失去部分乐趣。

而在国内,有这么一家AI研发团队,他们推出的“ 元乘象Chatlmg ”应用可以准确识别图片并能与用户进行聊天,就好比给ChatGPT加上 一双“眼睛” , 看懂文字的同时,也能完美识别图片 。

日前,镁客网从元乘象研发团队获悉,“元乘象Chatlmg”最近刚刚上线,关注 微信公众号 “元乘象” 即可体验该应用。(注:受限于算力,初期为 邀请制 访问方式)

那么,“元乘象Chatlmg”的使用体验究竟如何,它的图片识别功能是否真的神奇呢?在产品上线前夕,镁客网进行了一次全方位的测评总结。

图 | 元乘象Chatlmg Logo

看图说话?这款ChatGPT应用很神奇

进入“元乘象Chatlmg”,可以看到该应用的界面十分 简洁明晰 ——位于下方的文字对话框,对称式的头像排版,各种元素组合成我们常见的聊天软件界面。

而在该应用的左下方,可以看到一个显眼的“ 上传图片 ”按钮。

目前,该应用图片上传支持三种方式,分别是 照片图库、拍照 和 文件导入 ,一次上传一张。

恰逢三八妇女节,镁客网也选了两样物品交给“元乘象Chatlmg”来帮忙判定一下是否适合,一张是从 搜索引擎 上下载的 口红图片 ,另一张是通过手机现拍的 便签本图片 :

可以看到,“元乘象Chatlmg”精准识别出了两张图片中的产品,并且还延伸出一些其他描述,比如记事本上的小熊很可爱、口红放在白色背景前等等。

与此同时,对于这两份物品是否适合送给女孩子做礼物,也给出了自己的判断,还会提出礼物是否适合需要依据接收者喜好的理性建议。

在“元乘象Chatlmg”给出回复后, 我们又追问了一句 :

嗯,建议非常中肯,上下文理解的逻辑也做到了连贯。

此外,镁客网也上传了一些 其他图片 让“元乘象Chatlmg”来识别。

比如这个:

又比如这个:

还有这些:

可以看出,“元乘象Chatlmg”的识别能力还是相当精准,并能 通过文字形式来描述所看到的图片内容 。

对比基于纯文本互动的ChatGPT,除了写诗歌、撰写文章这类基本互动,多了双“眼睛”的“元乘象Chatlmg”显然又挖掘出几项新功能,物品识别正是其重要功能之一。

之后, 随着数据量的不断扩增以及产品的不断优化,镁客网也期待“元乘象Chatlmg”能给我们带来更多出彩的表现 。

百亿级别参数大模型加持,未来将持续升级

本质上,ChatGPT是一款聊天机器人产品,在GPT-3大模型的帮助下,提供了文本生成的能力。而ChatGPT之所以强悍,也恰恰得益于GPT-3。

作为OpenAI开发的 自然语言处理 模型,其身上有着太多话题点。早在ChatGPT推出之前,GPT-3就已经在AI领域成功出圈。

据悉,该模型达到1750亿参数,一次训练就需调用上万块GPU,花费近460万美元的成本。如此疯狂的“吞金能力”,自然能支撑起ChatGPT这样的疯狂应用。

那么ChatGPT还有什么不足之处吗?答案是有的!

据元乘象研发团队表示,“元乘象Chatlmg”搭载了自研的 百亿级别参数多模态大模型 ,相当于给ChatGPT装上“眼睛”,使其能够更像人一样去对话。

所谓多模态,在AI领域中往往指感知信息,如 图像、文本、语音 等协同,帮人工智能更准确地理解外部世界。

也正是在多模态大模型的加持下,“元乘象Chatlmg”拥有了看懂图像的能力。

据元乘象研发团队介绍,目前该 元乘象AI大模型 参数规模大概150亿;数据方面目前主要是 图文对数据、VQA数据 等。而在训练过程中,该模型放开尽量少的可学习参数,从而保证在有限算力上的高效训练。

在问及该模型的 未来发展路径 时,元乘象研发团队向镁客网透露,除了当下的图文互动外,未来该大模型还会把 图片生成 的能力结合进来,这样在回答的时候也能回复自己生成的图像,让对话变得更生动。

另外,该模式也会加入包含更多模态,如 视频、音频 等,甚至与 数字人 等技术结合,开发出更生动立体的形象。

可以想象,在元乘象百亿参数多模态大模型的加持下,我们与聊天机器人的对话将变得更像真人口吻,AI技术在未来带给我们的惊喜也会越来越多。

中国AI厂商狂奔,国产Chat GPT还有多远?

就在本月举行的十四届全国人大一次会议“部长通道”上, 科技部 部长王志刚 在谈到ChatGPT时,赞扬其为AI及相关行业带来的进步。

与此同时,由ChatGPT引发的各种讨论,也被各位代表、委员们带进了两会。

事实上,早在2017年我国将发展人工智能上升为国家战略前,AI就已是全国两会上的“常客”。 如今ChatGPT火爆全球,不禁让人们再次发问: 中国的AI行业该如何抓住ChatGPT的时代潮流?

借由新品发布的机会,镁客网也与 元乘象研发团队负责人高一钊博士 就此问题进行了一番交流探讨。

在他看来, 国内对于AI大模型的建设需要有长远的布局和工作的连续性,才能开发出真正创新的技术 。

当我们回顾ChatGPT的“发家史”便可以发现,想做好一款AI大模型并非易事,背后是长期的资金投入以及算力技术迭代,另外还要考虑训练数据的优化、计算能耗的降低等方方面面。

换句话说, 想做好一款类ChatGPT应用,并非通过一次简单的“百米冲刺”即可完成,而是需要耐心跑完一场“万米长跑”,才能进入群雄逐鹿的“决赛圈” 。

但就目前的发展现状来看,国内大厂的AI大模型仍处在研发阶段,能像“元乘象Chatlmg”一样走到应用层面的团队仍非常少见——首先国内AI大模型的研发普遍起步较晚, 人才 缺口严重,其次是中文语境下大模型的训练难度更大,耗费的时间远超英文。

这些问题本该需要“耐心”去解决,但随着上一波AI投资热潮的冷却,许多公司被迫缩减预算,最终导致相关AI业务发展陷入了瓶颈。

相比之下,元乘象研发团队则走得相对顺利,一方面,该团队在AI应用领域的长期深耕探索,另一方面也得益于他们在多模态预训练模型上正确判断与前瞻性,最终在整个团队的坚持下,终在ChatGPT时代迎来了“ 开花结果 ”。

谈及AI企业未来的探索之道时,高博士也给出了自己的一些看法:“ 在生态搭建方面,国内可以促进 开源 ,毕竟人多力量大。 ”

结语

自去年发布以来,ChatGPT早已从一种“ 现象级产品 ”进化为一种“ 科技符号 ”,国内科技大厂争先恐后推出类ChatGPT产品,希望在这场竞赛中摘得所谓的“胜利”。

同时,伴随ChatGPT的火热,国内AI行业再次掀起新一轮新品热潮,“元乘象Chatlmg”正是在这期间脱颖而出。

从“元乘象Chatlmg”应用的测评来看,其体验感已经非常友好,甚至拥有“图像识别”这种ChatGPT所不具备的功能。

当然,作为早期版本的“元乘象Chatlmg”,在一些细节方面仍有欠缺,但相信在元乘象研发团队努力与坚持下,未来国产ChatGPT应用也能惊艳行业。

关键词:

上一篇:
下一篇:
精彩阅读

热点聚焦:ChatGPT作者John Shulman:我们成功的秘密武器

热点

除了OpenAI,外界可能很少有人知道ChatGPT模型成功的真正原因。

Google I / O 5 月 10 日举行:期待安卓 14、Bard 聊天机器人

热点

谷歌宣布2023年度I O大会将于5月10日在美国加利福尼亚州山景城举行。

实时焦点:2858万!冯仑被AI坑了

热点

2858万!冯仑被AI坑了!

环球热讯:科大讯飞梁雪岩:兼顾人效与服务,用人工智能点亮酒店数智化道路

热点

通过住中客诉预警,在店解决问题,避免客人离店负面点评;采取分级监管,提升客诉处理效率,保证客诉处理SOP合规。

焦点热门:实测最像ChatGPT的中文产品:能解释三体、懂弱智吧的梗,内测开启人人都能试!

热点

一个名叫Inspo的生成式对话AI,刚刚在“民间”开启内测,马上引发不小反响。

ChatGPT版佛祖爆火出圈:施主,说出你的烦恼

热点

ChatGPT现在已经在为人类“佛系”排忧解难了。

大神李沐被曝离职!投身大模型创业,GitHub项目已开

热点

亚马逊首席科学家李沐,被曝已离职创业。

福宝商标被多方抢注

热点

近日, 大熊猫拉完粑粑屁股蹭妈妈头上 ,后被妈妈“暴揍”的视频逗乐众多网友。

财富

iphone4连接电脑无反应怎么办?iphone4连接电脑只显示没有设备?

资讯

是驱动没装好或者被破坏的关系解决方法右击我的电脑→设备管理器→通用窜行总线控制器然后找到AppleMobileDeviceUSBDriver这时候你

看点:家乐福中国的至暗时刻

资讯

家乐福中国的至暗时刻,家乐福中国:十年称霸,十年踉跄。

BAT出走创业的「她们」

资讯

BAT出走创业的「她们」,当有人还在认为女性成为创业者是对其传统女性身份的威胁时,她们的故事将成为女性在商业领域探索时的灯塔,指引她们在

失落的TVB,把港星送进了直播间

资讯

失落的TVB,把港星送进了直播间,情怀打底,卖货不易。

【天天报资讯】1亿中产买单,没开业先赚1600万,Costco加速开店

资讯

1亿中产买单,没开业先赚1600万,Costco加速开店,一种新的卖场逻辑:看起来少赚一点钱,反而是最赚钱的方式。

全球热推荐:融资丨「合凯维生命科学」完成近千万美元种子轮融资,鼎丰生科资本、创新工场共同领投

资讯

融资丨「合凯维生命科学」完成近千万美元种子轮融资,鼎丰生科资本、创新工场共同领投,本轮融资将主要用于推进公司在亚太地区的商业化进程

天天快报!XR凉了?但还是有人拿到了2亿融资

资讯

XR凉了?但还是有人拿到了2亿融资,元宇宙不火了,对XR行业的影响如何?

融资丨「玻色量子」完成新一轮亿元级融资,开启实用化量子计算新征程

资讯

融资丨「玻色量子」完成新一轮亿元级融资,开启实用化量子计算新征程,资金将持续用于公司实用化光量子计算平台的研发、产品化和市场拓展。

【新要闻】数字广告科技公司PubMatic:2022财年GAAP净收入为2870万美元,超全球数字广告市场预期

资讯

数字广告科技公司PubMatic:2022财年GAAP净收入为2870万美元,超全球数字广告市场预期,PubMatic是一家提供前沿数字广告供应链的独立科技公司,

当前关注:2月全球新增4家独角兽企业,其中中国新增1家;27家中国企业完成IPO上市丨睿兽分析投融资月报

资讯

2月全球新增4家独角兽企业,其中中国新增1家;27家中国企业完成IPO上市丨睿兽分析投融资月报,全球投融资月报

Google I / O 5 月 10 日举行:期待安卓 14、Bard 聊天机器人

谷歌宣布2023年度I O大会将于5月10日在美国加利福尼亚州山景城举行。

实时焦点:2858万!冯仑被AI坑了

2858万!冯仑被AI坑了!

环球热讯:科大讯飞梁雪岩:兼顾人效与服务,用人工智能点亮酒店数智化道路

通过住中客诉预警,在店解决问题,避免客人离店负面点评;采取分级监管,提升客诉处理效率,保证客诉处理SOP合规。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个