天天时讯:真正的包罗“万”象!上海AI实验室、港中文等提出V3Det目标检测数据集,含有13029个类别!

2023-04-11 10:01:45   来源:商业新知网

介绍一篇今天新出的文章,来自上海人工智能实验室和香港中文大学的学者提出了一个海量类别的目标检测数据集 V3Det ,总类别数达到 13029 !


(相关资料图)

▌V3Det: Vast Vocabulary Visual Detection Dataset

论文作者:Jiaqi Wang,Pan Zhang,Tao Chu,Yuhang Cao,Yujie Zhou,Tong Wu,Bin Wang,Conghui He,Dahua Lin

作者单位:Shanghai AI Laboratory(上海人工智能实验室); The Chinese University of Hong Kong(香港中文大学); Centre of Perceptual and Interactive Intelligence

论文链接:http://arxiv.org/abs/2304.03752v1

这个世界有多少种类别的物体?仅目前已经发现的昆虫,就有1000多万种。而目前计算机视觉领域大部分的数据集类别都是非常有限的,之前最多类别的LVIS有1203类,所以在真实世界中检测任意对象的研究往往是在类别受限的目标检测数据集上训练和评估的。

V3Det,正是为了应对这一挑战而开发的,不仅图像数量多(245k),而且类别个数多(13029),且具有精确的标注(1753k个包围框)。

相信构建这一数据集过程也是异常费时费力的!

为更好地理解数据,作者们还为V3Det构建了层次分类树,可以方便访问和研究类别之间的包含关系,每个类别都有专业的描述。

V3Det提供了广泛的探索空间,可以在广泛和开放的目标检测任务上进行广泛的基准测试,为研究提供新的观察、实践和见解。它有潜力成为开发更普遍的视觉感知系统的重要参考数据集!

V3Det与其他知名目标检测数据集的统计比较:

V3Det类别数是之前最大数据集的10倍!

如此大规模多类别的数据集标注过程肯定是异常艰辛的,为了保证标注数据的准确性,数据创建团队付出了大量的工作。

V3Det的标注过程:

包括分组、粗粒度标注、合并与联合验证、细粒度标注、类别的验证、类别描述等过程。

比较有意思的是,在对类别进行描述的步骤中,ChatGPT也参与进来。

下图是对V3Det和其他数据集的统计分析:

包括类别分布、均值分辨率、包围框分布。

下图展示了常见的目标检测算法在V3Det上评估的表现:

作者还根据不同采样方法、表示方法、算法框架等对数据集进行了各种评估:

下面这张图展示了类别层次图的可视化,相当震撼!

V3Det数据集中“粗类别”的统计和描述:

可见Animal & Human 相关的类别是最多的,达到7485类,其次是Flower,1911类。

类别描述示例:

标注示例:

包围框真是密密麻麻!(数据创建团队辛苦了!!)

这是一项特别有意义的工作,也是非常有价值的资产,相信能够促进大规模海量类别目标检测的相关研究。

作者说数据集将于6月份公开,大家拭目以待!

关键词:

上一篇:
下一篇:
精彩阅读

天天时讯:真正的包罗“万”象!上海AI实验室、港中文等提出V3Det目标检测数据集,含有13029个类别!

热点

来自上海人工智能实验室和香港中文大学的学者提出了一个海量类别的目标检测数据集V3Det。

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

热点

字节跳动的税息折旧及摊销前利润(EBITDA)在2022年达到近250亿美元,较前年的140亿美元暴增近八成。

【全球聚看点】海外设计师打造苹果MR头显概念渲染图;索尼新型3D显示屏即将上市,无需 VR 头显也可支持沉浸式体验

热点

Marcus是一名工业设计师和用户体验顾问,他每天使用VR和AR设备来支持他的工作。

环球观速讯丨涉图片侵权、错误信息诽谤等,AIGC将迎来侵权潮?

热点

对于弱小的个人创作者,又如何维护自己的版权,而不是在不知不觉间成为AI的训练数据,这也是个问题。

环球热推荐:政企市场成运营商比拼新焦点 一季度四家战绩谁更给力

热点

随着数字经济的发展,各行各业的数字化转型需求也变得越来越多。这对于运营商们来说,无疑就是个新机遇和新蓝海市场。

世界快播:谷歌云游戏四年探索,全剧终

热点

从天堂到地狱需要多久?谷歌Stadia的答案是四年。

天天短讯!为何“周一睡觉俱乐部”上海首店开出就能制造社交话题?

热点

从延庆路的发展来看,这条路段天生的拥有着“放纵不羁爱自由”的DNA,这也与“周一睡觉”的趣味生活态度产生契合。

环球资讯:GPT-4,究竟强大在哪里?

热点

2023年3月15日,OpenAI向全世界进行了GPT-4的发布会,整个世界都为之沸腾了。

焦点短讯!科普 | 号称以太坊“黑暗森林”的MEV是什么?

热点

区块链显著特征就是其透明度和可追溯性超过了世界上的绝大多数系统,但是在这背后仍然存在着看不见的博弈。

全球观察:深陷免费泥潭的视频会议厂商,该醒醒了

热点

随着高增长成为历史,后疫情时代的云会议,是否也将随之衰退?

财富

没有冰箱怎么保存芒果?芒果能不能放冰箱里?

资讯

没有冰箱怎么保存芒果?不能够放冰箱,如答者所说,芒果是热带水果,一入夏,各种香甜多汁的水果大量上市,其中就有本吃货AI的最爱——芒果!

昆仑万维2022年净利润11.5亿 经营性净利润同比大增112%

资讯

昆仑万维2022年净利润11 5亿经营性净利润同比大增112%,昆仑万维披露2022年年度业绩报告。

零跑汽车的2022:年亏51亿,还需要克服哪些挑战?

资讯

零跑汽车的2022:年亏51亿,还需要克服哪些挑战?,零跑能否实现这个目标,让我们拭目以待。

跟小学生抢饭吃,和老人争学上,不安分的年轻人在想什么鬼点子?

资讯

跟小学生抢饭吃,和老人争学上,不安分的年轻人在想什么鬼点子?,洞察教育行业趋势,发掘培训产业价值

微头条丨年轻人集体“上山”,捧出一个IPO

资讯

年轻人集体“上山”,捧出一个IPO,这家公司“躺平式”挣钱,一年入账1亿

B 站停更潮,一场内容生产危机?

资讯

B站停更潮,一场内容生产危机?,B站停更潮风波席卷网络

全球热文:小米会不会收购小鹏?

资讯

小米会不会收购小鹏?,我自己会写下“精彩”,但是我期望我的小朋友会写下“快乐”

【快播报】为什么说抖音已成为餐饮人线上经营的必争之地?

资讯

为什么说抖音已成为餐饮人线上经营的必争之地?,烟火气的恢复给餐饮人带来很大的信心

【播资讯】TikTok、Lazada混战:东南亚电商的“面子”和“里子”

资讯

TikTok、Lazada混战:东南亚电商的“面子”和“里子”,巨头涌入、竞争加剧,让东南亚电商市场迎来了前所未有的热度,也充满想象空间。但该地区

世界新动态:腾讯游戏一个400多人工作室被“掏空”了

资讯

腾讯游戏一个400多人工作室被“掏空”了,调整可能还会持续

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

字节跳动的税息折旧及摊销前利润(EBITDA)在2022年达到近250亿美元,较前年的140亿美元暴增近八成。

【全球聚看点】海外设计师打造苹果MR头显概念渲染图;索尼新型3D显示屏即将上市,无需 VR 头显也可支持沉浸式体验

Marcus是一名工业设计师和用户体验顾问,他每天使用VR和AR设备来支持他的工作。

环球观速讯丨涉图片侵权、错误信息诽谤等,AIGC将迎来侵权潮?

对于弱小的个人创作者,又如何维护自己的版权,而不是在不知不觉间成为AI的训练数据,这也是个问题。

环球热推荐:政企市场成运营商比拼新焦点 一季度四家战绩谁更给力

随着数字经济的发展,各行各业的数字化转型需求也变得越来越多。这对于运营商们来说,无疑就是个新机遇和新蓝海市场。

世界快播:谷歌云游戏四年探索,全剧终

从天堂到地狱需要多久?谷歌Stadia的答案是四年。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个