计世网

Python在最受欢迎数据科学语言中排第一
来源:199IT
2018-05-08
今年的调查显示,Python和R在数据科学项目中的使用量已经有了明显差异。使用R的受访者比例下降10%,从60%降至50%,而Python则增长了6%,从64%增长至70%。

 


  DZone调查了540位软件专业人士,并发布了“2018年大数据技术指南”。

  人口统计

  目前,42%的受访者是开发人员或工程师,23%是开发团队领导。

  54%有10年以上的工作经验,28%从事相关工作15年以上。

  39%在总部位于欧洲的公司工作,30%在北美公司工作。

  23%在超过10,000人的企业工作,22%在500-10,000人的企业工作。

  77%开发Web应用程序或服务,48%开发企业应用,21%开发原生应用。

  78%的受访者所在公司在使用Java,62%使用JavaScript,37%使用Python。

  56%的受访者将Java用作他们的主要工作语言。

  Python

  Python逐渐成为最受欢迎的数据科学语言,但是它已经打败了曾经最流行的数据语言R。今年的调查显示,Python和R在数据科学项目中的使用量已经有了明显差异。使用R的受访者比例下降10%,从60%降至50%,而Python则增长了6%,从64%增长至70%。这相当于Python的用户比R多20%。Python并不是专门为数据分析设计的,它的动态输入、简单易学的语法和不断增长的库使其成为刚开始涉入数据科学和分析的开发人员的最佳选择。

  大数据和挑战

  人们对大数据的概念有不同的定义,除了要处理庞大的数据量,数据种类和流速也更复杂。76%的受访者表示他们不得不处理大量的数据,46%表示必须处理高速数据,45%要处理多变的数据。这些人都面临着各自的挑战。第一类受访者最大的挑战是大量的文件(47%)和服务器日志(46%)。第二类受访者面临的最大挑战是服务器日志(42%)和传感器/远程硬件(42%)。来自文件的数据源是第三类受访者的最大挑战(56%)。

  数据库管理系统

  Oracle在数据库方面的领先地位自2016年越来越不明显,时刻都有被MySQL超越的风险。MySQL从2017年就是最受欢迎的数据库管理系统,尽管受欢迎程度从2017年的61%降至55%。另一方面Oracle则从2017年的48%上升至54%。PostgreSQL的使用量从2017年的35%增长至41%。

  云数据

  处理存储在云计算的数据的受访者正在增长,从2017年的31%增长至39%。

责任编辑:刘沙