您的位置:计世网 - 热点

总编签字:数据学将深刻影响人类未来

  哪门新兴学科将深刻影响人类未来?数据学或者数据科学肯定是其中之一。2002年数据学已被国际科学委员会确立为不同于计算机科学的独立学科。近年,作为科学的数据学体系越来越清晰、完整,在实用中越来越重要。

  一些人士和组织认识到数据对未来的重要性,在数据学认知缺位的情况下,或自已臆想,或引用别人并不正确说法,滥用数据学的概念和理论。在这种情况下,知识界需要对作为科学的数据学较有严肃的认知。

  进入信息社会以后,数据以自然方式增长,其产生不以人的意志为转移。数据学最重要的基础在于定义了数据自然(data nature)。数据自然是所有存入信息系统的数据总集合,包括数字、字符、音视频以及计算机程序等。与大自然一样,数据自然也有未知、复杂、多样等属性。

  在数据自然的视角下,人、社会、大自然及其历史,都将转变成数据自然,人类同时生活在大自然和数据自然之中。人类将通过探索数据自然来了解大自然,了解社会和人类行为。在数据自然的视角下,数据学被定义为研究探索数据自然奥秘的理论、方法和技术,通过研究数据自然,揭示大自然和人类行为的规律。

  在数据学的体系中,要在数据自然中获得收益,与在大自然中获得收益类似,需要采用一系列技术方法。

  首先要对数据自然进行数据勘探,探查数据集的总体特征和数据集的结构,判断数据集的价值,为下一步开发利用该数据集提供依据。数据抽样和数据分析是数据勘探的基本方法。

  完成数据勘探,与采矿、洗矿类似,可将相关数据集从数据自然中提取出来并加以清洗,称之为数据获取。数据再通过整合,使之在逻辑上相关联并使之便于访问,就可存入数据仓库。接着,可采用数据挖掘技术对数据仓库进行处理,寻找数据的内在规律并以可视化的形态展示。数据获取、数据整合、数据仓库和数据挖掘均经过多年发展,比较成熟,现在都可以归入数据学的范畴。

  面对大自然,人类可以用科学实验的方法,通过有控制的干预,发现对象的新特点、新规律,从而加以利用,获得收益。例如在实验室中可以合成新的化合物,培养新的物种,再将其量产。

  按数据学理论,面对数据自然,也可以采用数据实验的方法,通过干预和控制数据,发现数据自然、人类社会和大自然的新规律,新特点,并设计出将其转化为生产性活动模式。

  数据实验可以模拟企业运行、政府运作、社会现象。比如,可以模拟新产品投产上市后的运行,模拟不同气候条件下流感的传播等。在数据实验中,可以输入不同参数,对数据模型调优。数据实验还可以模拟自然现象,比如极端气候,用来评估灾害。

  数据实验是数据学最主要的研究方法,用来模拟大自然和人文社会,用来验证假说和规律。它比用于发现数据相关性的数据勘探和数据挖掘,在探索数据自然的深度上又前进了一大步。

  近年,一些先进的企业设立了首席数据官(CDO),招聘数据科学家,成立与IT部门并立的数据部,试图在企业运营中运用数据学的方法。未来,我们可以期待数据学将像从前的IT一样,对企业和人类社会产生极为深远的影响。计世传媒集团副总编 孙定


文章评论

关注作者的人