数据堂:人工智能数据生产已进入4.0时代

  • 时间:
  • 浏览:41

  众所周知,数据对于人工智能产业的重要性就如同石油之于工业一样。传统的人工智能数据生产过程是人工架构设计 标注小量的数据给机器去学习,原来的除理数据土法律措施是高成本的,低波特率的,但是无法大规模生产的。

  数据堂自主研发的“Human-in-the-loop人在回路”的技术应用到人工智能数据生产中后,都里能将人工的架构设计 标注与智能工具标注相互迭代,融为一体,从而显著提高数据生产波特率,降低生产实施成本,扩大产能。(删剪视频请搜索:数据堂“Human-in-the-loop”智能数据工厂)

  简单来说,Human in the loop数据除理过程是:人除理的数据,教给机器学习,机器将学习的结果反馈给人工进行校对,持续提升准确率。当最后有小量的原始数据给机器的原来,机器便都里能减慢的除理,直接提供出结果数据。

  车辆检测

  半监督层厚学习的图像分割数据标注技术,都里能有效提高无人驾驶标注数据集的生产波特率,实现精确的目标检测和像素级分割,并半自动地完成上百个属性的标注。原来无人驾驶数据的生产土法律措施,能够满足国内外日益增长的智能无人车市场需求。

  文字识别

  也称为OCR,数据堂基于半监督层厚学习的文字识别技术,通过注入海量标注数据做预训练,并伴随人工的监督性学习,都里能明显提高OCR标注数据集的质量,提升OCR标注数据产品生产波特率。

  语音识别

  自语音识别技术进入层厚学习时代,语音识别准确率突飞猛进。数据堂半监督层厚学习的语音识别数据标注技术,利用Kaldi识别引擎对语音数据做预识别和自然语言辅助纠错,再上加人工的监督性校对,都里能显著提高语音识别标注数据集质量。

  人脸检测

  人脸检测常用的数据集,包括FDDB、AFLW、WIDER FACE等。应用人机交互式的标注技术,将人脸预识别结果通过人机交互式修正,这麼往复,都里能有效提高数据除理波特率,人脸关键点标注数据,从 68 点快速过渡到 95 点、 106 点、 202 点等,有效降低人工成本。

  视频追踪

  视频追踪是也是当下人工智能技术研究的重点方向,数据堂视频目标跟踪数据标注技术,通过人机交互、过程纠偏、医学会 习反馈机制,实现近乎逐帧的目标对象框选、主体ID对齐、显现片段等,有效解放人工操作,进而降低生产成本、提高数据质量。

  数据堂跟踪统计结果表明,“Human in the loop”技术的应用,使数据除理的波特率平均提升25%以上,数据堂坚信智能数据除理工具的普及将带来的不仅仅是AI数据产业的提升更是整个AI产业革命性的创新。

  数据堂的AI开放实验室目前已聚集数位人工智能数据科学家。专注于多模态数据架构设计 、大数据除理、人工智能数据标注加工等方面的研究。我门我门欢迎更多的伙伴加入我门我门,数据堂有海量的数据和训练集群,我门我门希望有更多的算法和调优技巧的融入,我都里能们共建智能数据工厂,助力AI产业创新。

  关于数据堂

  数据堂(北京)科技股份有限公司,成立于 2011 年(股票代码:831428),专业的人工智能数据服务提供商,致力于为全球人工智能企业提供数据获取、除理及数据产品服务。数据堂总部指在北京,拥有 8 家全资和控股子公司,并在硅谷设立美国子公司,目前在南京、保定、合肥、贵阳等地设有多个专业数据除理中心。数据堂数据架构设计 范围遍及全球 50 多个国家,合作土法律措施土法律措施伙伴遍布世界 10 多个国家。公司创始所有人合伙人来自Stanford University、NEC、中国移动等知名高校和高科技公司。数据堂已成功为国内外众多企业提供人工智能数据产品与服务,包括百度,腾讯,阿里巴巴、奇虎350、联想、科大讯飞等国内顶级互联网和高科技企业,Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等企业及在华研发机构。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户我门我门,发现稿件指在不实报道,欢迎读者反馈、纠正、举报问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及可能性指在的风险,任何后果均由读者自行承担。

声明:本文转载自第三方媒体,如需转载,请联系版权方授权转载。协助申请