数据标注是做什么的

电脑教程011

数据标注是做什么的,第1张

     数据标注是做什么的?下面就让我们一起来了解一下吧:

      数据标注是使用特定工具对图像、文本等进行处理的工作。数据标注就是使用自动化的工具从互联网上抓取、收集数据包括文本、图片、语音等等,然后对抓取的数据进行整理与标注。

      常见的几种数据标注类型介绍为:

      1、分类标注:分类标注,就是我们比较常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合,一张图能够有很多分类/标签,比如成人、女、黄种人、长发等,对于文字,可以标注主语、谓语、宾语,名词动词等。

      2、标框标注:机器视觉中的标框标注,还是比较容易理解的,就是框选要检测的对象,比如人脸识别,首先要先把人脸的位置确定下来。

      3、区域标注:相比于标框标注,区域标注要求会更加精确,边缘可以是柔性的,比如自动驾驶中的道路识别。

      4、描点标注:一些对于特征要求细致的应用中常常需要描点标注,比如人脸识别、骨骼识别等。

      5、其他标注:标注的类型除了上述几种常见的之外,还有很多其他比较个性化的。不同的需求会需要不同的标注。比如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。

      以上就是的分享了,希望能够帮助到大家。

数据标注是对未经处理的初级数据, 包括语音、图片、文本、视频等进行加工处理, 并转换为机器可识别信息的过程。原始数据一般通过数据采集获得, 随后的数据标注相当于对数据进行加工, 然后输送到人工智能算法和模型里完成调用。

简单来说,数据标注就是数据标注员借助标注工具,对图像、文本、语音、视频等数据进行拉框、描点、转写等操作,以产出满足AI机器学习标注数据集的过程。