炼数成金 门户 商业智能 机器学习 查看内容

超越R,Python成为最受欢迎的机器学习语言

2016-11-1 16:46| 发布者: 炼数成金_小数| 查看: 21996| 评论: 0|原作者: Jason Brownlee|来自: 机器之心
摘要: 你应该挑选正确的工具做机器学习。你正在做的特定预测模型问题要求特定的编程语言、库、甚至是机器学习算法。但如果你只是刚开始呢?还在找一个平台学习并实践机器学习呢?在此文章中,你会发现 Python 正在成为做机 ...
工具 Python 机器学习 商业智能 ETL
你应该挑选正确的工具做机器学习

你正在做的特定预测模型问题要求特定的编程语言、库、甚至是机器学习算法。但如果你只是刚开始呢?还在找一个平台学习并实践机器学习呢?

在此文章中,你会发现 Python 正在成为做机器学习逐渐流行的平台,在采用率与能力上极可能超过并推翻 R 语言。

读完该文章后,你将会明白:

对 Python 机器学习的搜索量增长迅速,已经超越了 R 语言机器学习的搜索量;
Python 机器学习招聘的比例正在增长,已经超越了 R 语言;
调查中,近 50% 的调查对象使用 Python,而且正在增长;

用 Python 做机器学习的趋势在增长

让我们看一下以下三个领域,从此三方面都能看到使用 Python 进行机器学习的趋势正在增长:

搜索量
招聘广告
专业工具使用

搜索量

搜索量可能表明学生、工程师和其他从业者搜索信息开始或者深入这一主题的趋势。

谷歌提供了一个名为 Google Trends 的工具,能让我们观察关键字随时间变化的搜索量。

我们能够调查 2014 年至 2016 年「Python 机器学习」的增长趋势,如下图所示:
我们能够看到在 2012 年趋势开始上涨,在 2015 年急剧上涨,这可能是因为 TensorFlow 这样的 Python 深度学习工具。

我们也可与 R 机器学习的搜索量进行对比,我们可以看到在 2015 年中期,Python 机器学习已经超过 R 机器学习:

蓝色代表「Python 机器学习」,红色代表「R 机器学习」。

Python 机器学习招聘增长

Indeed 是一个招聘搜索网站,像 Googel Trends 一样,它可提供匹配关键词的招聘广告量。

我们能够调查过去 4 年的「Python 机器学习职位」。
我们能够看到 X 轴上的时间和匹配关键词的招聘比例。该图显示从 2012 年至 2015 年几乎呈现线性增长,在 2016 年有曲棍球式的增长。

我们也可以对比 Python 和 R 的招聘广告。
蓝色表示 Python 机器学习,橙色表示 R 机器学习

与谷歌搜索量有显著的对比。从 Indeed 网站获得的招聘广告的比率显示从 2012 年开始,对 Python 机器学习技能的需求一直高于对 R 机器学习技能的需求,差距在近几年逐渐拉大。

KDnuggets 调查结果:更多人使用 Python 进行机器学习

通过回顾 KDnuggets Software Poll Results 我们能够观察机器学习从业者使用的工具:

下面就引自 2016 年的结果:

R 语言仍然主导工具,占有 49% 的份额,但 Python 增长迅速,几乎赶超 R 语言。——Gregory Piatetsky。

该调查追踪了机器学习和数据科学从业人士使用的工具,在调查中,从业者可以选择多种工具。以下是过去 4 年 Python 机器学习的增长比例:
下面是一张增强趋势图:
我们可以看到几乎呈现线性增长趋势,在 2016 年刚好低于 50%

值得注意的是,近几年的调查中参与调查的对象也从几百增加到了几千人,参与者是自选择的。

O'Reilly 调查结果:更多人使用 Python 进行机器学习

O'Reilly 展示了年度数据科学薪水调查结果。

他们收集了大量数据科学家和机器学习从业者的数据,并展示了调查结果。该调查追踪了从业人员对工具的使用情况。从下面这段话中,我们可以看到 Python 如今在数据科学薪资中扮演重要角色:

Python 和 Spark 是最对薪资有贡献的工具。

回顾此调查结果,我们可以看到类似的增长趋势:
图形展示如下:
有趣的是 O'Reilly 的调查结果非常类似于 KDNuggeets 的结果。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

  GMT+8, 2017-10-18 07:16 , Processed in 0.132375 second(s), 24 queries .