计世网

想放大AI数据价值?你需要这样的数据管理“利器”
作者:刘沙 | 来源:计世网
2021-09-17
云测数据标注平台-AI数据集管理系统可以帮助企业轻松管理数据资产。

 

  熟悉AI产业的人都知道,数据、算法和算力是推动AI产业发展的三大核心要素,而数据又是算法和算力得以施展的前提。就像巧妇难为无米之炊,如果没有好的数据基础,再强的算法和算力也没有用武之地。

  然而,在AI普及落地的过程中,企业却普遍面临着数据量大、难以快速找到特定场景数据的困境。在AI数据训练的过程中,AI数据管理更是面临着数据资产不能充分利用、管理方式不够完善等挑战。

  这样的挑战在我们的工作中并不少见,如:很多企业都很难在爆发式增长的海量数据中快速找到有价值的数据;数据被零散地存储在不同的公有云和私有云中,甚至在个人电脑和硬盘里;配合算法迭代的不同版本的数据却不能被及时命名和分类等等。

云测数据总经理贾宇航


  五大先进技术化解AI数据管理难题

  为了帮助企业解决这些痛点,近日,国内领先的AI训练数据头部服务商--云测数据在服贸会上发布了“云测数据标注平台-AI数据集管理系统”,给苦于AI数据管理难题的企业带来了福音。

  云测数据总经理贾宇航告诉记者,云测数据标注平台-AI数据集管理系统专注于Al数据集的上传、管理、存储、分享,数据类型标签化管理,同时可以支持标注结果的存储、标注结果可视化等功能,从而助力企业进行数据管理,提升数据训练的匹配度,高效开展模型训练,增强Al领域的核心竞争力。

  据介绍,云测数据标注平台-AI数据集管理系统的先进性体现在以下五个方面:

  首先是安全高效的数据存储:支持混合云存储,多场景数据托管,可全方位协调机制,提升数据管理效率。

  在公有云存储方面支持阿里云、腾讯云、亚马逊云科技等主流云服务;在私有云存储方面,可满足S3协议方案的对象存储系统,如Ceph、Minio;在URL资源导入方面,其他文件存储系统可以直接引入使用。

  贾宇航表示,该管理系统是可以私有化部署的,可以适配不同企业的不同运行环境。


  其次是便捷快速的数据检索:可实现多级标签管理、数据深度检索。

  该系统支持标签级数据检索,可快速筛选价值数据:文件管理标签化,支持无限级KV标签;多细粒度标签检索,快速构建数据场景;文件子集管理,让数据归档井然有序。

  贾宇航指出,企业可以针对不同的角色给同一类数据打上不同的、各自独有的标签,也可以对标注的结果进行自动读取、标签化检索。

  第三是全场景数据可视化,让数据更容易理解。

  丰富的可视化组件,支持box2d、ellipse、polygon、line、curve、point、parallel、box3d、cuboid、side_cuboid、sentence等多种可视化工具,并支持连续帧、ID跟踪、点云多传感融合、音视频等多种数据场景,支持标签筛选、分组显示、旋转变化等交互查看方式,让数据更容易理解和检查。

  贾宇航强调,过去企业用户查看数据标注结果,需要通过专门的数据标注结果可视化工具,或者购买,或者自己研发。现在该功能已经被云测数据直接集成在AI数据集管理系统中,企业用户可以直接查看结果、进行筛选。

  第四是丰富的扩展工具,可灵活管理使用。

  该系统支持Python SDK、CLI、Open API等多种扩展工具,方便上传、管理、统计可视化数据,客户可根据场景灵活使用,或打造数据中台将数据获取、数据标注、数据存储使用、模型迭代形成数据闭环。同时可提供完善的技术使用文档。

  第五是清晰的数据权限管理。

  该系统支持多种团队协作权限管理,团队成员明确分工,数据使用按需分配,避免数据操作隐患及反复迁移:支持角色权限管理,操作权限分配;支持数据分享管理,隐私数据隔离;支持开发者授权管理,白名单授权机制。

  “过去企业需要安排专人管理数据,现在通过系统就可以更直接更有效地实现上述功能。”贾宇航谈到。

  凭借上述优势,云测数据标注平台-AI数据集管理系统可以帮助企业轻松管理数据资产,将非结构化数据结构化管理,形成统一数据规范,进行数据资产化积累,不断积累核心数据竞争力;而且,结合业务数据场景,企业可以打通数据闭环,构建数据中台服务,释放AI数据价值。从而帮助企业高效获取、加工和管理数据,深入挖掘、全面提升AI数据价值。

  贾宇航为记者列举了一个实例,如一家做自动驾驶视觉感知的企业,应用AI数据集管理系统给自身的数据进行场景化的标签选定和存储。其数据量非常庞大,且数据场景复杂。比如单单在天气方面划分为白天、黑天、晴天、雨天、雪天等多种类型。

  该企业发现,机器对于雪天的识别效果不好,那如何针对性地对相关算法进行数据训练呢,这时候就可以通过数据管理系统中标签功能,调动已有数据库中对应的雪天数据,快速完成数据抽取和验证,实现数据管理事半功倍的效果。

  “事实上,看了很多实际案例以后,我们发现,运用AI数据集管理系统的企业,其运转的节奏、迭代的周期都在加快,研发方式也从瀑布式开发向敏捷开发转变了,实现了更高效的数据管理。”贾宇航强调,“这也是这套AI数据集管理系统存在的意义。”

  紧跟客户需求的探索和积累

  当然,市场也存在其他AI数据集管理产品,那么云测数据的优势何在呢?对此,贾宇航表示,云测数据是一家在企业级服务领域深耕多年的公司,核心是帮助企业实现产业化落地,会根据企业客户的实际需求去进行产品迭代。所以在研发AI数据集管理系统时,将其定义成可以私有化部署的,并且可以被灵活运营集成的工具,方便企业进行二次开发和深度定制。

  而且云测数据作为AI数据的头部企业,在自动驾驶、车企、智慧城市、智能金融、智能IOT、智能家居等领域的数据应用一直走在行业前沿,并一直努力探索,基于新的算法、新的应用场景研发出更好的产品和服务,为AI产业化落地赋能。

  事实上,这已经是云测数据第二次在服贸会亮相。在2020年服贸会上,云测数据发布了“无数据 不AI,云测数据服务标准--项目最高交付精准度99.99%”的成果。“本次发布的云测数据标注平台-AI数据集管理系统与其是一脉相承的。”贾宇航解释到,这是在解决AI数据生产过程的难题之上延伸到改变AI数据管理的困境,充分展示了云测数据基于行业前瞻和前沿技术服务积累,进一步拓展深化AI训练数据价值的领先实践。

  一横一纵勾画AI数据产业未来

  谈到未来的发展计划时,贾宇航告诉记者,针对AI数据行业的发展趋势,云测数据制定了“一横一纵”的规划。

  在纵向领域,以自动驾驶为例,正在向车外环境感知、车内智能仓、人机交互等方向发展,未来会应用更多不同维度的数据,以确保实现高清度。“这些领域都在深化发展,云测数据也会往这些方向持续布局,增强自己的方案和服务能力,以确保在这些行业有新的突破的时候,云测数据也能够有对应的积累,满足客户相关的需求。”

  在横向领域,则会关注其他不同行业的落地方向,比如新零售、金融垂直领域等等。云测数据希望把自身对于AI数据服务的经验应用到更多具有增长潜力的行业。贾宇航谈到,“云测数据愿意为这样的行业打造AI数据服务解决方案,通过高质量的AI数据助力相关领域早日实现产品落地。”

责任编辑:刘沙