咖思漫 > 杂谈 > 正文

​聊一聊,数据标注员的工作内容,避避坑

2024-10-29 17:58 来源:咖思漫 点击:

聊一聊,数据标注员的工作内容,避避坑

笔者记得上学的时候总想着干点啥整点钱,然后社会上会有各种企业推荐兼职工作的,但是需要押金。这里面有骗人的当然也有确实给你推荐过的。再后来智能手机的兴起,找兼职工作就比以前变得简单了,但是同样的也更复杂了。

数据标注作为一份工作的话好处就是不受工作地点与时间的限制,当然了一些需要固定IP的项目除外。

我们今天天就简单聊聊常见的数据标注项目都有哪些,都是做啥的,工作界面是什么样的,光听别人说还是有些抽象,咱也图文结合的方式聊一聊。

一、语音标注

语音标注也成语音转写,顾名思义就是根据要求将所听到的话转写出来。项目分为长语音、短语音、中英混转语音、小语种、方言等等。我们通常需要根据要求将文字填写出来,这其中需要先根据要求进行截取,截取的时长叫做有效时长;当然这里面还涉及到一个打标签的事情,比方性别、年龄段等等。随着产品的更新迭代,语音转写有预识别的项目越来越多,这样的话操作相对来说就变得更为简单,也就是说我们只需要复制粘贴改错误的地方就可以了。

这个工作服务的最多的是AI语音,比如我们熟悉的小爱同学。

二、2d拉框

通常2d拉框做的最多的都是2d障碍物的项目,需要框选的有车辆、行人、锥桶等障碍物。这里面主要注意的是可见性的问题,要分清遮挡和截断的区别,同样的遮挡1/3,2/3还是完全遮挡这要看具体的项目要求里面的解释。相对来说2d拉框要比语音项目还好上手一些,成长速度也挺快的,但是产值的峰值有限,毕竟手速有限。

2d拉框还有一点应该着重注意的就是贴合的把握,一般初学者在这里容易栽跟头,同样的每个框也要表明属性。

这个工作服务的最多的应该是自动驾驶领域。

三、3d点云

点云成像数据通常是有激光镭射雷达、红外线成像方式在空间中打点成像,这里面包含三维立体数据、肉眼颜色的感官变化等复杂的数据处理。可以理解为通过点的造型透视出所要标注的三维立体物。

3d点云比2d在图形的表达上更为直接,同样的我们在作业的过程画的3d框更为立体,属性也更为丰富。

可以说3d点云的标注才是无人驾驶领域里面的工作基础,在所有的3d成像的图片当中,我们需要把目标物体标注出来。这里面种类比较多,比方说有的地面的水在一些项目要求当中也需要框选标注出来。

笔者理解的3d类型的包括2、3d融合的项目最终很重要的目的就是智慧城市的建设,也许在不久的将来,比方我临时需要一件蓝色的西装,无人驾驶的车辆可能就在我去哪里的路上与我会合了。

其实每个项目细分还有很多小项目,常见的还有2d车道线标注,3d语音分割等等,应用场景已经延伸到了生活的方方面面。所以,如果出现一个特别智能的产品在惊奇之余不要觉得不可思议,因为这不是因为一个人的idear,是万万人努力的成果。