计世网

物联网领域正涌入大批不领工资的“数据科学家”
来源:物联网智库
2020-06-01
AIoT智联网是AI(人工智能)和IoT(物联网)技术在实际应用中的落地融合。近年来,智联网AIoT一词热度剧增,她正在以极快的速度从襁褓中的婴儿长大成人。

 

导读

TinyML是指在毫瓦(mW)功率范围以下的设备上,实现机器学习的方法、工具和技术。这里的关键词是“毫瓦功率范围以下的设备”。TinyML功耗极低,不仅适用于边缘硬件,还可用于物联网终端设备,支持各种不同的电池驱动的设备,和需要始终在线的应用。最近TinyML与AutoML正在快速融合,构建嵌入式自动化机器学习算法,发挥更大的效力。

AIoT智联网是AI(人工智能)和IoT(物联网)技术在实际应用中的落地融合。近年来,智联网AIoT一词热度剧增,她正在以极快的速度从襁褓中的婴儿长大成人。

昨天,All inAIoT还是单个企业的市场宣言;今天,AIoT in All已经成为各行各业尝试转型以及寻找下一增长点的主力。

根据中国信息通信研究院统计预测数据显示,2020年全球人工智能市场将达到6800亿元人民币。据研究机构Markets and Markets在2019年发布的报告称,2019年全球AIoT市场规模为51亿美元。到2024年,这一数字将增长至162亿美元,复合年增长率为26.0%。

AIoT的成熟,一方面需要企业的重视与投入,另一方面需要技术的支撑与迭代。上周,我们谈到阿里投百亿加速AIoT布局的“大手笔”;这周,我们来看看AIoT的领域吹起的技术“新风向”。

在文章《一文读懂即将引爆的TinyML:在边缘侧实现超低功耗机器学习》中,我曾经介绍过一个新趋势:TinyML,并提到将会持续追踪TinyML的进展。

TinyML是指在毫瓦(mW)功率范围以下的设备上,实现机器学习的方法、工具和技术。这里的关键词是“毫瓦功率范围以下的设备”。TinyML功耗极低,不仅适用于边缘硬件,还可用于物联网终端设备,支持各种不同的电池驱动的设备,和需要始终在线的应用。

这些设备包括智能摄像头、远程监控设备、可穿戴设备、音频采集硬件以及各种传感器等…TinyML是一个新兴领域,是快速增长的机器学习技术和应用,是一片巨大的、未被充分开发的蓝海。

最近TinyML与AutoML正在快速融合,构建嵌入式自动化机器学习算法,发挥更大的效力。

AutoML全称是Automated Machine Learning,自动化机器学习,这是2014年以来,机器学习和深度学习领域最炙手可热的领域之一。

我们都知道,机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等各个方面。AutoML试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。

就在今年3月,谷歌证明了AutoML可以走得更远。根据谷歌已将代码开源的AutoML-Zero,如今有可能仅使用基本的数学运算作为构建块,就可以自动“进化”为完整的机器学习算法。

因此本文将介绍TinyML与AutoML相结合的最新进展,值得你关注的包括:

TinyML与AutoML“携手”的最大价值体现在哪里?

嵌入式自动化机器学习算法的具体应用场景有哪些?

这个领域的初创公司和各类资源的情况如何?

01TinyML+ AutoML的价值何在?

21世纪最性感的工作是什么?

你可能已经脑补了五花八门的答案,但《哈佛商业评论》(Harvard Business Review)认为是“数据科学家”。HBR在文章中写道,“如果‘性感’意味着拥有非常抢手的稀有品质,那么数据科学家就是。”

数据科学家很难招到、工资很高、更难留住,这也许是每个试图尝试AI应用的物联网企业都会头疼的问题。

数据显示,在2018年,初级数据科学家的平均工资为11.5万美元/年,能够管理10至15人团队的数据科学家则可以拿到35万美元的年薪。

2019年,全球对数据科学家的需求量是供应量的1.5倍。超过40%的公司认为招聘不到数据科学家是严重阻碍他们竞争力的原因之一。超过60%的公司试图通过内部培训,让现有员工变身成为数据科学家。

在物联网领域,数据科学家除了稀有,还面临另一个问题:在物联网终端,很多AI绝技无法施展。分布最广的物联网设备往往体积很小、电量有限。它们被作为终端硬件,通过嵌入式传感器采集各种数据;计算能力有限,对功耗极为敏感。物联网领域占比超过95%以上,都是需要超低功耗、占用极少存储空间、完成实时数据处理的场景。能够在这类设备上实现机器学习的人才,更是精英中的高阶精英。

TinyML与AutoML“携手”,就是试图让物联网领域的机器学习,突破人才稀缺和硬件受限的掣肘,让机器学习算法在物联网终端自我进化,让非技术人员可以轻松的使用人工智能进行数据分析,让原本“物以稀为贵”的机器学习以亲民的方式“飞入百姓家”。

TinyML在《一文读懂即将引爆的TinyML:在边缘侧实现超低功耗机器学习》中已有详细介绍,此处重点来说AutoML。

02什么是AutoML?

为了更好的理解AutoML,清华校友翟伟所在公司Qeexo通过一个有趣的对比进行了解释。

在某种程度上,人工智能与印刷术非常相似,它们的诞生都是人类历史上的巨大转折,而且演进过程也有一定的可比性。

印刷术发明之前,文化的传播主要靠手抄的书籍。手抄费时、费事,又容易抄错、抄漏,既阻碍了文化的发展,又给文化的传播带来不应有的损失。

就像在人工智能诞生之前,工程师们要自己写计算程序完成数据分析,不仅效率低而且有可能存在很多误判。

印章和石刻给印刷术提供了直接的经验性启示,用纸在石碑上墨拓的方法,直接为雕版印刷指明了方向。

雕版印刷的版料,一般选用纹质细密坚实的木材,然后把木材锯成一块块木板,把要印的字写在薄纸上,反贴在木板上,再根据每个字的笔划,用刀一笔一笔雕刻成阳文,使每个字的笔划突出在板上。木板雕好以后,就可以印书了。

就像在人工智能的初始阶段,工程师们为每个用例,从零开始写机器学习的代码,一个用例对应一块“雕版”,在不同用例之间代码很难重复利用,灵活性差、对工程师的技艺要求高。

活字制版避免了雕版的不足,只要事先准备好足够的单个活字,就可随时拼版,大大地加快了制版时间。活字版印完后,可以拆版,活字可重复使用,且活字比雕版占有的空间小,容易存储和保管。这样活字的优越性就表现出来了。

就像随着人工智能的发展,工程师们开始使用解耦的思维,使用现有的机器学习模块与框架活用拼凑AI。这个阶段开发一个上手的应用或许很简单,但是要开发真正的产品却很难,需要一个团队的专业人士,花费几个星期的时间完成。

而现在,我们每个人都知道如何使用电脑打字,并使用打印机将文稿印出。

AutoML就是试图将人工智能也带入到同样阶段的做法,让一位非专业人士,花费几分钟的时间,即可完成多个人工智能模型。在这个阶段,合适的AutoML工具是关键。

谷歌最近发布了一篇论文名为《AutoML-Zero:从零开始的自动机器学习》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。

AutoML-Zero这个名字难免让人产生联想。当年AlphaGo战胜了人类最强棋手,但前提是它先学会了人类棋谱,离不开人类指导。接着谷歌又推出了AlphaGo Zero,只让AI知道围棋规则,从零开始学下棋,结果再次登上棋艺顶峰。

AutoML-Zero似乎想要证明,既然AI能从零学习围棋,也可以从零开始摸索机器学习算法。

谷歌这篇论文的全文可以通过文末的提示下载阅读。

现在谷歌已将AutoML-Zero的开源程序提交到GitHub,普通电脑只需5分钟就能体验一下它的实际效果。

03应用场景有哪些?

目前一些智能可穿戴设备,包括智能耳机和智能手表已经在使用相关技术。通过加速度传感器和陀螺仪辅以相应的嵌入式自动化机器学习算法,可以更好的分析用户行为,并且支持自定义手势创建、情境感知、活动分类、步态分析,提供更加贴合用户自身的服务。

智能家居也是应用场景之一。智能水壶和智能灶台可以通过声学传感器和算法,检测水是否烧开、烧开的水是否溢出、壶和锅的温度有没有过高。还可以监测智能微波炉中的玉米花是否爆开,以便及时关闭设备。

当然,你也许会想,这些场景都是“小儿科”,只有在最复杂的工业场景中实现应用,才能验证“TinyML+AutoML”嵌入式自动化机器学习算法真正有效。如你所料,有些企业正在将嵌入式机器学习自动算法用于预测性维护。

对于预测性维护(PDM)的发展阶段进行简单划分,可分为4个阶段:

PDM 1.0—反应性维护:当问题出现时再来解决它,例如救火。

PDM 2.0—预防性维护:包括外观检测,以及能够提供更具体、更客观的有关机器或系统状况相关信息的定期资产检测。

PDM 3.0—基于规则的预测性维护:也就是“状态监测”。传感器持续收集来自设备的数据,并根据预先设定的规则,包含在预先设定的临界值出现时发出警报。

PDM 4.0—基于机器学习的预测性维护:依靠大量的历史数据或者测试数据,结合为不同情境定制的机器学习算法,预测错误出现的时间和位置,然后发出警报。

PDM 4.0是通过先进的分析技术对资产的技术条件、使用、环境、维修历史、其他类似设备以及任何可能与之相关的大数据进行分析,预测未来将会发生的故障,并最终制定出最有效的预防措施。

在这个过程中,听声能力很重要,就像维护维修专家能够通过汽车引擎的声音,来诊断车辆的问题一样,工业设备如果拥有了一双远程的“顺风耳”,结合振动分析,就可以让PDM方案更精确。声音同样还能被用于诊断液体泄露、管道腐蚀和液位测量。

PDM4.0还面临一个规模化应用的窘境,由于每个设备的安装条件、载重性能和外部环境都不相同,单一的AI模型可能无法在类似的电机上批量复制。

TinyML+AutoML使用时间序列传感器,包括模拟和数字麦克风,可以自适应的创建AI模型。通过声音传感与分析,有助于识别预测性维护应用的问题。

04初创公司&各类资源

关于TinyML+AutoML,有很多现成的工具和软件可以使用,物联网企业不需要招聘昂贵的数据科学家,也不需要扩充团队,就可以初步尝试。

这里介绍比较有代表性的初创公司和资源,包括QEEXO、MindsDB和Cartesiam。

QEEXO

这家公司成立于2012年,总部位于加利福尼亚州山景城,机器学习的研发团队位于宾夕法尼亚州匹茨堡,在北京和上海拥有工程师团队。

目前已经有260多种硬件平台,超过3亿台设备,搭载了QEEXO的机器学习引擎。

知名的包括在华为手机中嵌入的指关节操作技术。

指关节操作功能通过使用指关节在屏幕上敲击或勾画,快速调用系统功能,支持利用指关节双击全屏截屏、敲击并画圈局部截屏、敲击并画字母S滚动截屏、双指关节双击录屏、直线分屏等5种手势操作。今年5月,荣耀发布了新机荣耀X10,指关节操作功能首次下放给了“千元机”。

QEEXO与瑞萨电子等领先硬件厂商进行合作,完成了多种硬件的适配。QEEXO可支持Arm Cortex – M0到M4核的单片机,如瑞萨RA6M3组单片机产品。

据悉,QEEXO的自动机器学习算法将在亚马逊AWS上架,以SaaS年度订阅的方式提供服务,并将在下周周一,6月8日进行全球商用版Qeexo AutoML的正式发布。

MindsDB

MindsDB公司成立于2017年,总部位于加利福尼亚州伯克利,源自美国加州大学伯克利分校的研究项目,其同名服务已在GitHub上发布开源版本。

最近MindsDB完成了一笔300万美元的融资,用于扩充团队和验证商业模式。

Cartesiam

Cartesiam公司创立于2016年,总部位于法国土伦,商务运营中心位于巴黎和纽约,主要实现让普通的ARM微控制器都能运行的无监督学习AI。

今年2月,Cartesiam发布了一个名为NanoEdge AI Studio的软件系统,该系统能够安全地生成AI算法,并且生成的算法只需两分钟就可在ARM微处理器上运行,容量大小仅为4~16KB RAM。

法国的工业电子制造商Eolane与Cartesiam合作推出了一款名为Bob Assistant的温度/振动传感器,主要用于预测工业维修。目前,该解决方案已经被许多欧洲客户所采用,成为首个大规模部署的工业4.0预测性维护解决方案。

5月19日,Cartesiam发布了针对STM32开发板优化的新版NanoEdge AI Studio软件工具。STM32是意法半导体开发的微控制器。新版提供一个新的硬件平台选项,让开发者可以直接选择意法半导体的Nucleo-F401RE或Nucleo-L432KC开发板。在选择之后,用户可以解锁设计流程的最后一步,下载可在所选硬件平台上立即运行的自定义机器学习库。

----写在最后----

看似微小的TinyML和自我进化的AutoML蕴含大机会,物联网企业需要转变的首先是思维,积极拥抱和勇于尝试,或许就会开辟一番新天地。

最后,衷心感谢清华校友、QEEXO中国区市场负责人翟伟在写作过程中帮我提供的大量资料以及各种支持。6月8日,QEEXO嵌入式自动化机器学习服务的商用版本即将正式发布,邀请你与我们共同见证。

本文总结:

TinyML与AutoML正在快速融合,构建嵌入式自动化机器学习算法。

TinyML与AutoML“携手”,让原本“物以稀为贵”的机器学习以亲民的方式“飞入百姓家”。

嵌入式自动化机器学习算法具有广泛的应用领域,包括智能家居硬件、智能可穿戴设备、建筑物振动监测和工业预测性维护。

这个领域中比较有代表性的初创公司和资源,包括QEEXO、MindsDB和Cartesiam。

责任编辑:张旖旎