植物百科网
当前位置: 首页 农业百科

图像标注有哪些具体应用(收藏图像数据标注有哪些好用的工具)

时间:2023-07-12 作者: 小编 阅读量: 1 栏目名: 农业百科

关键点标注通过人工的方式,在规定位置标注上关键点,例如人脸关键点、骨骼点。常用于面部或姿势识别模型。线标注主要用于自动驾驶车辆的道路识别,定义不同道路。视频标注以帧为单位在一系列图像中定位和跟踪物体,多用于训练车辆、行人、骑行者、道路等自动驾驶领域的模型。用于多传感器融合平台的数据处理,多应用于自动驾驶场景。支持本地部署,无需担心数据外泄。

随着AI与传统行业的不断融合以及5G的发展,AI数据服务方式由粗放式向着精细化方向过渡,数据标注工具的发展也经历了从「能用就行」「好用且高效」的阶段。

大家都知道不同的标注类型使用的标注方法、工具、存储类型都不一样,在了解图像标注工具之前,我们先来看看图像标注都有哪些数据类型

图像/视频标注类型

2D框

给标注工具提供一幅图像,让其在图像内特定对象周围绘制一个框。

最简单的图片数据标注类型,成本最低,应用最广泛。

多边形分割

标注工具会通过在需要标注的对象的外边缘,放置许多个点来绘制成线,勾勒轮廓。

用于图片和视频中精确的物体检测和位置定位,更精准、更耗时、成本更高。

关键点标注

通过人工的方式,在规定位置标注上关键点,例如人脸关键点、骨骼点。常用于面部或姿势识别模型。

线标注

主要用于自动驾驶车辆的道路识别,定义不同道路。

语义分割

根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应的属性,以帮助训练图像识别模型,常应用于自动驾驶汽车、人机交互、虚拟现实等领域。

比较精准,耗时比较长,对图片上的所有内容进行标注。

视频标注

以帧为单位在一系列图像中定位和跟踪物体,多用于训练车辆、行人、骑行者、道路等自动驾驶领域的模型。

2/3D融合标注

通过3D点云数据,返求出2D图片的相对位置,对点云数据和图片数据同时标注。

用于多传感器融合平台的数据处理,多应用于自动驾驶场景。

标注工具推荐

  • CVAT

CVAT是免费的、在线的、交互式的视频注释工具,它的灵感来自Vatic。支持本地部署,无需担心数据外泄。

网址

https://Github.com/OpenCV/cvat

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.3D点云

3.视频标注

文件导出格式

CVAT for video、CVAT for images、PASCAL VOC、(VOC) Segmentation mask、YOLO、COCO、TFRecord、MOT、LabelMe 3.0、Datumaro

亮点/优势

1.支持多人协作

CVAT带有用户管理系统,可以创建、删除新成员,并为成员分配不同角色。如管理员、用户、标注员、质检员

2.标注功能强大

能用于几乎所有CV相关标注任务,如点,多边形,语义分割等,并且包含了插值标注即一个视频中若干帧,标注起始帧中间会自动生成、 带有标注任务列表的仪表板等功能

3.预处理功能

使用TensorFlow OD API的自动标注,可以预处理一部分数据

4.持续更新

开源环境较好,工具在不断完善中,有任何问题可以在gitchater问,回复很快

不足

1.没有「贝塞尔曲线」,只能一个一个点

2.只适用于谷歌浏览器,在其他浏览器中表现不佳

3.尽管 CVAT 支持一些自动测试,但所有质检都必须手动完成

4.由于Chrome Sandbox的性能限制,CVAT在某些用例中可能会出现性能问题

  • VOTT

微软发布的一款基于javascript开发用于图像目标检测的标注工具,使用React Redux进行开发,支持Windows和Linux平台运行。

分为V1和V2两个版本,目前V1已经废弃,V2是V1版本的重构和优化,建议大家直接用V2。

网址

https://github.com/microsoft/VoTT

标注类型

支持点、线、2D框、语义分割与视频数据标注

文件导出格式

CNTK/Pascal VOC、TFRecord、csv、VoTT等格式

亮点/优势

1.安装方便,直接下载exe文件即可

2.VoTT的学习成本低、上手快

不足

1.不支持多人协作

2.VoTT的标注会超出图像的最大像素范围,如果模型对坐标有规定范围的话,则需要进行特定处理

3.数据无法加密保存,不适合私密数据标注

4.不能导入已有的标注结果(如bbox)

5.程序不稳定:VoTT是桌面应用,经常死机,经常会报错

  • Labelme

Labelme 是一个图形界面的图像标注软件。其的设计灵感来自于 http://labelme.csail.mit.edu/ 。它是用 Python 语言编写的,图形界面使用的是 Qt(PyQt)。

网址

https://github.com/wkentaro/labelme

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.视频标注

3.对图像进行进行 flag 形式的标注(可用于图像分类和清理)

文件导出格式

JASON、VOC与COCO

亮点/优势

1.用户定制界面

2.支持全面标注方式:与labelImg相比,labelme除了矩形框之外,还可以使用圆形框,多边形框,点,线等来对图像进行标注,用于目标检测、图像分割等任务

3.可以对图像进行flag形式的标注,用于图像分类和清理任务

  • LabelImg

LabelImg是图形图像标注工,用Python编写的,并将Qt用于其图形界面,可以用于进行目标检测项目的标注工作。

网址

https://github.com/tzutalin/labelImg

标注类型

2D矩形框,目标检测

文件导出格式

PASCAL VOC 、YOLO 、CreateML

亮点/优势

1.操作简单快速,而且生成的标注文件以XML文件保存,读取方便,格式标准

2.支持VOC2012格式与tfrecord自动生成

不足

支持的标注类型少:仅支持2D框标注

  • VIA-VGG Image Annotator

一款开源的图像标注工具,由Visual Geometry Group开发。可以在线和离线使用。

可标注矩形、圆、椭圆、多边形、点和线。

网址

下载地址:http://www.robots.ox.ac.uk/~vgg/software/via/

Github:https://gitlab.com/vgg/via

标注类型

1.多边形分割、语义分割、2D框、线标注、点标注

2.Version3增加了对视频和音频的标注

3.人脸标注

文件导出格式

csv和JSON

亮点/优势

1.人脸数据标注提供了各种方便的操作,人脸数据标注首选工具

2.网页源代码开源,可离线使用还可进行二次开发,比如增加鼠标十字线

3.标框可以复制(可前后帧复制),同样大小可直接复制且继承属性,属性面板较为清晰

4.适用多个浏览器:Chrome、Firefox、Safari、 Explorer、GNOME Web等

不足

多边形工具,一旦绘制完多边形无法增加锚点,只能调节点的位置

  • Pixel Annotation Tool

图像语义分割与实例分割标注神器,交互式标注算法思想是基于opencv中分水岭算法实现。

网址

https://github.com/abreheret/PixelAnnotationTool

也可以直接下载编译好的二进制文件使用,下载地址如下:https://github.com/abreheret/PixelAnnotationTool/releases

标注类型

语义分割与实例分割

亮点/优势

1.快捷,半自动化,类似PS蒙版,基于OpenCV中分水岭算法实现

2.可以返回上一步

不足

1.标注对象若颜色分布不均匀,软件无法识别

2.如果识别出来,大概率覆盖掉周围物体,很难修改

  • Vatic

Vatic是一个带有目标跟踪的半自动化视频标注工具,适合目标检测任务的标注工

网址

https://github.com/cvondrick/vatic/tree/contrib

标注类型

适合目标检测任务的视频标注

文件导出格式

JSON

亮点/优势

1.内含基于opencv的tracking,一段视频只需抽样标注,大大减少了工作量

2.支持接入亚马逊的众包平台Mechanical Turk,具体使用时,可以设定要标注的物体label,比如:水果,人,车,等等,然后指派任务给到众包平台

3.简洁使用的GUI界面,支持多种快捷键操作

不足

仅支持2D框标注。

数据标注

数据是公认数字时代的石油。为了更好地对数据资源进行管理和开发利用,发挥数据资源的价值,国家定会加快培育数据要素市场,发挥数据生产要素的作用,激活数据要素潜力,进一步完善数据生态,编制出台培育数据要素市场的指导性文件,数据标注行业,也将在快速发展的同时,更加规范化、制度化。

    推荐阅读
  • 突触名词解释(突触是什么意思)

    突触名词解释突触是指一个神经元的冲动传到另一个神经元或传到另一细胞间的相互接触的结构。突触是神经元之间在功能上发生联系的部位,也是信息传递的关键部位。在光学显微镜下,可以看到一个神经元的轴突末梢经过多次分支,最后每一小支的末端膨大呈杯状或球状,叫做突触小体。这些突触小体可以与多个神经元的细胞体或树突相接触,形成突触。从电子显微镜下观察,可以看到,这种突触是由突触前膜、突触间隙和突触后膜三部分构成。

  • 《守望先锋》对战局影响大招top一览 守望先锋对局战绩

    今天小编要为大家带来的是玩家“黑呦酱”分享的《守望先锋》对战局影响大招top一览,感兴趣的玩家赶紧一起来看看吧!守望先锋大招分为四类,控制类,自身BUFF类,辅助类以及伤害类,由于伤害类大部分使用大招时,本体无法进行有效杀伤,且控制类及自身BUFF类需要其他技能的配合,so,此间因素也要加入考量。

  • 运动后喝黑咖啡还能燃脂吗 运动时喝黑咖啡会加快燃脂吗?

    2、运动过程中身体脂肪会加速燃烧,从而具有一定减肥作用;而黑咖啡热量比较小,加上其中含有大量的咖啡因以及维生素、纤维素物质,适量喝可以促进人体肠胃蠕动,加速脂肪代谢分解,对减肥具有促进作用。

  • 斯威汽车质量怎么样(斯威质量好不好)

    2018年6月起,斯威“品质特工队”以四大火炉的重庆作为起点,途径海南、吐鲁番、格尔木三地,历时近一年进行了数十万公里极限环境适应性试验。极端干燥高温环境下,常见车内温度往往会狂飙到60℃以上,而在斯威G01的车厢里,却始终能够保持清新凉爽的状态。一整套严酷考验下来,斯威G01的性能表现完全得以充分认证。这样一算,斯威G01差不多完成了近百万公里的专业级严酷考验。

  • 春天兰花怎么养 春天兰花怎么养浇水

    白墨兰花哪个品种最好白墨兰花是墨兰的珍贵变异品种假鳞茎椭圆形,已有数百年栽培历史,流传至今,不下十数个品种,它叶色莹润、体态优雅、幽香静远、且抗病,白墨兰花比较好的品种一般分企剑和软剑两个品系。什么兰花开花最香兰花品种很多,按花香来排,在兰花界春兰居首,惠兰次之,随后便是建兰、墨兰和寒兰,春兰的花香味最正宗,持久性也极强。

  • 奔驰e300l前进挡总共有几个(你看了奔驰22款E300L升级这套原厂HUD抬头显示效果觉得怎么样)

    从行车安全的角度来考虑,加装一台HUD是非常有必要的。HUD的全称是HeadUpDisplay,中文翻译过来就是抬头显示器。今天星骏汇小陈通过以上的产品配件图了解,我们看到这台奔驰22款E300L升级HUD抬头显示所需要更换的配件有,抬显仪器,高配仪表盖板,高配仪表电脑,雨量传感器,空调管升级HUD抬头显示把仪表台上的那一块盖板换掉,换成高配的预留好显示器孔位的盖板,装上显示器,从而使仪表显示的内容投射到挡风玻璃上面。

  • 儿童葫芦丝表演(通城千人共奏葫芦丝)

    儿童葫芦丝表演香城都市报讯 10月27日,通城县隽水中学参加湖北省“黄鹤杯”美育节节目视频录制现场,七、八年级千名学生,同奏乐曲《龙的传人》。该校相关负责人介绍,本学期,每天下午预备铃响5分钟,七、八年级各班集体合奏葫芦丝。丝竹声声,已渐成校园一道靓丽的风景线。近年来,该校贯彻落实社会主义核心价值观,注重未成年人思想道德建设,坚持开设中华传统和特色民族特色教育课程,促进学生“德智体”全面发展。

  • 鸡娃时代孩子的成长之道(与其1岁就开始鸡娃)

    出生时大脑发育已经完成25%,1岁完成了50%,3岁完成了60%,6岁达到90%。现在小学虽然是零基础入学,取消了统一考试,但是它对学生的要求并没有降低。吃够了佛系养娃的亏,橙子家的老二断然不肯再佛系养了。北京卫视于2018年摄制的纪录片《起跑线》中,有一个7岁的北京女孩令人印象深刻。她的家庭,在北京三环内有一套房,一辆车。妈妈认为,孩子从小培养兴趣,靠的是父母的指引。

  • 环氧树脂的作用与用途(环氧树脂有什么作用与用途)

    环氧树脂的作用与用途具有优良的物理和电绝缘性能,强度高、收缩性低,耐腐蚀以及有高绝缘的优势,所以被称为万能胶。电器、电机绝缘封装件的浇注。从常压浇注、真空浇注已发展到自动压力凝胶成型。长时间接触胶水时,有人会有细微的皮肤过敏和细微瘙痒疼痛的情况,建议在运用时戴上防护手套,如果出现了这样的情况,需要用酒精擦洗,然后用清水冲洗干净。

  • 明月曾照江东寒剧情(明月曾照江东寒剧情介绍)

    明月曾照江东寒剧情剧情简介:美少女战清泓是武林副盟主战破敌之女,从小被父亲禁止涉及江湖事。十年一期的武林大会即将来临,战清泓瞒着家人偷跑下山,立志夺取武林盟主之位。战清泓与温宥也开始互生情愫,奈何最终被世俗礼法所阻碍。与此同时,江湖上风起云涌,战清泓发现自己自幼背诵的家训竟是人人趋之若鹜的第一神功《鹤羽剑法》。