计世网

机器学习和高级分析的现代化平台
作者:刘沙(编辑) | 来源:计世网
2018-07-26
一个做AI的创业者说:数据越陈越像酒,应用越陈越像鱼。从应用角度来讲,应用有自己的生命周期,每个应用3-5年会下线更新。

 

Cloudera 技术总监 刘隶放

一个做AI的创业者说:数据越陈越像酒,应用越陈越像鱼。从应用角度来讲,应用有自己的生命周期,每个应用3-5年会下线更新。

现在是机器学习崛起的时代,这是由两方面因素带来的,一是随着计算成本不断降低,为大规模计算带来可能,另一方面是大量数据为企业内部和外部做数据分析带来基础。

Cloudera 在三个方面帮助企业客户工作:一是帮助客户在业务洞察力方面提升企业价值,二是对于联网的产品提供更优化的服务,三是通过机器学习保护企业的业务。中国联通、中联重工、中国银联都是Cloudera在中国最重要的客户。

面向机器学习的企业平台可以在三个方面帮助企业客户:一是驱动客户洞察力,帮助客户做流失分析和预防;二是保护业务,包括网络安全、欺诈、反洗钱、风控建模和评估、SPAM检测;三是联网产品和服务 (IoT),能够检测出所有的网络问题、业务欺诈问题,帮助客户做预测性维护。

很多大型企业都选择Cloudera CDH 平台作为大数据平台,Cloudera在垂直行业中有超过1000个客户,在财富8000中有超过500个客户。

我们在很多领域都有案例,如在疾病控制中心,用机器学习可以跟踪感染性疾病的传播、识别具有严重公共卫生问题的社区、查看显示感染传播的数据模式。数据包括患者调查,病毒遗传数据,实验室检测结果等。如帮助戴尔每天分析约2万个潜在的恶意软件,调查有可能出现的潜在安全事故,推送给客户,大规模改善客户的威胁防护,让存储成本从每GB 17美元降低到每GB 0.21美元。

我们为机器学习提供企业级开放平台:一是满足企业管理需求:安全、性能、合规;二是具有良好的扩展性,可以长期发展;三是可以在任何场景下运行,包括公有云、私有云、混合云和本地部署。

我们为机器学习提供三类解决方案:针对数据孤岛问题提供Platform + SDX +C6;针对模型开发问题提供Cloudera Data Science Workbench;针对技术选型问题提供Fast Forward Labs。

数据管理是机器学习的基础,Cloudera数据科学家工作台是从模型开发到生产部署的端到端的工具,首先,它是统一平台,能够打破分析和信息孤岛,支持企业内部、虚拟化部自助式分析,通过浏览器方式访问,同时满足企业级安全需求。其次,它可以实现弹性部署,支持GPU,提供数据科学家需要的计算能力数据,应对日益增多的资源需求。第三,支持Python、R、Scala,为数据带来开源机器学习的灵活性,创新性和价值。第四,可用在容器化环境,提供简单的协作开发,结果共享,代码重用和依赖性管理。最后,可以进行本地部署或者云端部署。

我们相信:数据可以让今天的不可能,在明天成为可能。

责任编辑:焦旭