计世网

从IA到AI的思考:企业级客户的人工智能路
作者:刘沙(编辑) | 来源:计世网
2018-07-26
企业内部的数据以及可开源产品之间数据的整合,以及在数据本身,数据的生命周期,从产生、使用、抽取、变形到最后销毁和删除,以及怎样在各种平台下使用各种类型的数据,都是现在最新的话题。

 

IBM大中华区大数据与分析业务技术总监 刘胜利

提到IA到AI,从信息架构到人工智能,我想从几个方面来讲这个话题:

在座的CIO、CDO或项目负责人,我们应该怎样自信的站在领导人面前讲我们的角色?通过近几年不断接触各行各业的领导,我体会到我们在数字化转型做得比较超前的,或者说有创新性的企业都是CIO、CDO或是创新部门在做这种驱动。CIO、CDO要参与企业的规划,参与数字化的设计,参与企业核心能力的建设。

再回到数据本身,企业内部的数据以及可开源产品之间数据的整合,以及在数据本身,数据的生命周期,从产生、使用、抽取、变形到最后销毁和删除,以及怎样在各种平台下使用各种类型的数据,都是现在最新的话题。

企业在数据上要具备几个能力:

第一是管理混合数据的能力,包括关系型数据库、大数据平台Hadoop、内容管理、知识管理、Nosql、流处理能力、Spark能力、云化能力、开发与运维能力。这些构成了企业的数据源,管好这些数据源才能用好未来的数据。

第二是所有企业都是比较容易忽视的能力,也是最难培养的能力。数据治理以及数据的生命周期这一块有大量的工作可为,这一块工作对于IT企业来讲是一种强筋健骨的能力,包括云上云下的思考,以及合规的问题都在数据的范围,企业需要慎重思考。

第三是当前数据领域最热门的话题,也就是数据科学。数据科学涵盖了AI、人工智能、机器学习,这一块包括一些业务人员在用。当前有一个很大的转型,过去的IT是IT人员用的,今天的IT要让企业级领导做分析决策、直接使用,未来将要发生什么,下一步采取什么动作,多数企业对于将来发生和将要采取什么步骤是需要加强的。

IBM数据产品简化成三条产品线,覆盖数据处理的各个方面:Collect数据收集与管理、Organize数据管控、Analyze数据分析。在数据分析领域以及数据科学领域,包括IBM自己在内,投入了大量的资源和能力转向数据科学,包括优化以及机器学习的算法,数据科学这一块是比较成熟的,有一些工具可以使用。

在IBM全球发展方向上,我们认为从数据治理到分析,合在一起构成了数据科学,数据科学完整加载这些内容才能实现真正有价值的人工智能。

谈到AI,往往大家看到的都是美丽的冰山露在水上的部分,而数据科学是全部。实际上要看整个冰山,不是看冰山露在水面上美丽的部分。真正做机器学习、数据科学的项目80%的时间花在冰山下,也就是数据管理和治理。

以下是我对开源、自主、可控的一些理性思考:开源不等于自主、可控。开源就像西天取经一样的,你会不断遇到问题,读懂源代码、开源编译和维护要求成本非常高,大家要理性的思考这个问题。为什么自主不是可控的?基于开源开发的软件,由于无法跟随原软件升级,变得失控了。现在这个问题变得非常严重。试用基于开源开发的软件,是更严重的锁定。使用开源早的企业逐渐认识到,企业需要的不是被锁定,而是有选择的主动权。我们应该采用什么样的开源策略?要求商业软件始终遵循一致的标准才能最大可能的减少锁定。

企业处在不同的阶段,我们到底应该怎样做,要有科学的方法论。IBM在做数据治理、数据科学方面有现成的方法论,有机会大家可以做一些探讨。

责任编辑:焦旭