倍赛:3项举措确保数据标注与采集服务高质输出

近年,人工智能技术发展迅速,其应用场景遍布于交通、金融、文娱、教育、医疗以及零售等各领域。“AI普及”除得益于算法技术获取层层突破,位于“基础层”的“结构化数据”也功不可没。

作为AI算法的“导师”——结构化数据帮助模型理解数据特征以及背后意义,最终实现智能化。然而,“导师”的水平差异同时影响“学生”拥有不同的能力表现,即结构化数据的量级和标注精度,将决定模型识别与认知的准确性。


倍赛:3项举措确保数据标注与采集服务高质输出

倍赛BasicFinder


作为人工智能数据基础设施及服务供应商的头部玩家,倍赛BasicFinder自创立之初始终致力于帮助AI企业通过更低的成本获取高质量的结构化数据,经过长时间的市场实践和创新,倍赛BasicFinder“精炼”出3项服务与产出举措以保证“低成本,高质量”的服务承诺:

1. 追求应用专业设备和专业人员;

2. 应用数据标注与数据采集一体化工具平台;

3. 高度定制化数据采集与数据标注服务。

下面倍赛BasicFinder将通过3个案例来解读各举措效应

语音合成(TTS)数据定制案例

——追求应用专业设备和专业人员举措解读

如倍赛BasicFinder曾为某媒体平台提供有声读物的语音合成(TTS)数据定制方案。


倍赛:3项举措确保数据标注与采集服务高质输出

语音合成(TTS)数据定制方案

在整体数据解决方案的执行过程中,倍赛BasicFinder充分考虑到客户语音数据的质量要求、安全性和效率,采取了进一步的控制措施。数据质量方面,倍赛为合作媒体选择了专业的男女声优,声优必须达到普通话一级以上水平(包括一级甲等和一级乙等),同时为声优选择配备高品质硬件设备的专业录音棚录音。其次,倍赛BasicFinder的语料文本设计师,均为国内知名语言学专家。数据安全方面,我们为媒体平台提供受采人的授权书,避免客户受到版权问题困扰。标注效率上,倍赛应用自主研发的标注工具平台——BasicFinder SaaS,该平台拥有的语音合成标注工具套件,极大地提升了标注的效率。

短视频行动识别场景案例

——应用数据标注与数据采集一体化工具平台举措解读

某短视频平台曾向倍赛BasicFinder发出数据采集和标注工具采购需求。客户方的数据采集需求为人的定制动作图像采集,对于采集环境和设备没有特殊要求,对工具的要求需支持相应采集数据的语义分割标注作业,而且采集与标注作业将分多个批次,并且每个批次对采集和标注标准都有部分调整。经过详细沟通,倍赛BasicFinder提出BasicFinder SaaS数据采、标一体化方案。


倍赛:3项举措确保数据标注与采集服务高质输出

BasicFinder SaaS 数据标注、采集方案

案例执行过程中,客户通过使用BasicFinder SaaS 数据标注与采集一体化工具平台,直接将编制好的需求文档从平台发布,SaaS平台系统将需求自动同步至“倍赛APP”数据采集众包平台。接下来,“倍赛APP”上遍布于全国各地的10万+用户根据项目介绍领取感兴趣的任务。“倍赛APP”数据采集众包平台的用户需要通过在线培训和系统考核合格后方可执行任务。在采集项目的执行过程中亦或尾声,客户都可以通过BasicFinder SaaS 工具平台对数据进行审核、验收以及下载,当然也可以再次应用BasicFinder SaaS 执行数据标注作业。

该案例客户通过使用BasicFinder SaaS数据标注与采集一体化工具平台,客户降低了寻找数据采集供应商并与之沟通的时间成本,同时增加采集作业和标注作业的连贯性,通过众包平台也进一步压缩了数据采集成本,并增加了数据样本的多样性、泛化性。

新零售数据综合解决方案

——高定制化服务举措解读

在倍赛BasicFinder与某零售商的合作中,该零售商希望通过AI技术获得货架商品管理能力和营销分析能力。例如,客户希望通过实时跟踪货架商品库存变化及时补货,并对热销商品进行AI营销分析。倍赛BasicFinder基于客户的场景需求为其提供数据采集和数据标注的综合解决方案。


倍赛:3项举措确保数据标注与采集服务高质输出

新零售数据标注与采集综合解决方案

首先,倍赛BasicFinder与该零售商开展有效沟通,深度还原应用场景,精准理解客户需求。


倍赛:3项举措确保数据标注与采集服务高质输出

标注数据应用场景还原

其次,倍赛BasicFinder根据数据采集需要搭建环境。倍赛团队考察数据采集现场,寻找最佳数据采集位置并部署设备。


倍赛:3项举措确保数据标注与采集服务高质输出

数据采集环境搭建方案

然后,执行数据采集与数据清洗。数据采集过程中会产生无效或重复数据,通过数据清洗将其去除,为数据标注做好准备。

第四步,对清理完成的数据进行标注。并对已经标注数据进行双层质检,确保数据标注精度达标。


倍赛:3项举措确保数据标注与采集服务高质输出

标注数据映射应用场景

最后,数据交付。倍赛BasicFinder将标注完成的数据与采集的原始数据交付给客户进行验收,验收满意后,与客户确认是否已经备份好数据,为保证客户数据独有性,倍赛将清除所有相关数据。

在该案例中,倍赛BasicFinder根据客户的具体AI应用场景量身定制数据采集与数据标注解决方案,其发挥的重要优势是直接在贴合场景中采集数据缩减采集时间成本,提升了采集数据的有效率。与此同时,在高效沟通下,标注员也更加理解标注需求,数据标注的质量得到保障。

综合以上三个案例,可以看出倍赛BasicFinder “精炼”的三项举措分别对应着“服务态度”“技术工具”“人才与硬件配置”。倍赛通过深度提升相应举措的输出标准为客户提供具有低成本和高品质的产品及服务。


分享到:


相關文章: