您好,欢迎来到12图资源库!分享精神,快乐你我!我们只是素材的搬运工!!
  • 首 页
  • 当前位置:首页 > 开发 > WEB开发 >
    2018年数据迷信和机器学习调查:Python完胜R言语,Hadoop被丢弃!
    时间:2018-06-08 12:16 来源:网络整理 作者:网络 浏览:收藏 挑错 推荐 打印

    2018年数据迷信和机器学习调查:Python完胜R言语,Hadoop被丢弃!

    近日,数据迷信网站KDnuggets发布 2018年数据迷信和机器学习工具调查结果。下面一同来看看调查结果

    最受喜爱的剖析、数据迷信、机器学习工具

    2018年数据迷信和机器学习调查:Python完胜R言语,Hadoop被丢弃!

    图1:2018年的最受喜爱的工具及其在2016 - 2017年调查中的份额

    *为了更有效的比较,KDnuggets重新计算了2016年,2017年问卷调查结果,扫除了受访者“单一”的选项。

    下表是前11名的工具排行,其中每个工具至少有20%的份额:

    表1:KDnuggets2018年顶级剖析/数据迷信/ ML软件调查

    在这里,“2018%share”是指运用该工具的受访者百分比,“ %change 2018 VS 2017”是表示2017年调查的变化 ,用绿色表示增长幅度到达10%以上,白色表示下降幅度到达10%以上。

    往年,每名受访者的平均运用工具数量为7个,略高于2017年投票中的6.75(不包括单一工具回复)。

    与2017年软件投票相比,往年前11名中,出现了一个新面孔Keras,Keras取代了去年Knime的位置。下面是针对以上数据的一些察看发现:

    Python消灭了R

    到2017年,Python曾经拥有超过50%的份额,如今曾经将其份额提高到66%,而在我们此次的调查中,R份额初次出现下降,而且是一下子降到50%以下。

    RapidMiner激增

    在过去的几次调查中,RapidMiner不断是最大的数据迷信平台之一,它的份额从2017年的33%大幅添加到50%左右。

    这样的增长速度能否是由于厂商的推行带来的呢?RapidMiner开创人兼总裁Ingo Mierswa的表示:

    与许多供应商一样,RapidMiner经过多种渠道向用户推行KDnuggets问卷调查,之前我们也做过异样的推行,但与之前不同的是,首先往年失掉了更好的回应,超过400位用户亲身回复了邮件,更重要的是,最近一年里,RapidMiner的月生动用户增长了300% ,因此可以向更多的用户发送了关于KDnuggets问卷调查的邮件。

    SQL是波动的

    SQL(包括Spark SQL和SQL to Hadoop工具在内)在最近的3次调查中依然占有约40%的份额。所以,假设你是一位有抱负的数据迷信家,学习SQL吧,它能够会对你很有用!

    趋向

    在调查中,运用率超过2%的新工具是Spark SQL,拥有11.7%的份额。

    下表列出了2018年份额增长20%以上的工具,并在2018年到达至少3%的份额。

    表 2:运用率增幅最大的主要剖析/数据迷信/机器学习工具

    整合

    值得一提的是,在2017年拥有2%以上份额的56个工具中,有19个(仅约三分之一)工具在2018年份额有所添加,而有37个的份额下降。结合Datawatch收买Angoss,Minitab收买Salford等近期的收买案可以表明,数据迷信平台的整合行将展开。

    2018年拥有3%以上份额,却在2018年份额下降25%以上的工具见下表:

    表 3:运用率跌幅最大的主要剖析/数据迷信工具

    深度学习工具

    运用深度学习工具的受访者比例保持波动,2018年有33%的受访者表示运用深度学习工具,2017年为32%,2016年为18%。 谷歌Tensorflow依然是最主要的平台。

    顶级深度学习工具排名如下:

    ● Tensorflow, 29.9%

    ● Keras, 22.2%

    ● PyTorch, 6.4%

    ● Theano, 4.9%

    ● Other Deep Learning Tools, 4.9%

    ● DeepLearning4J, 3.4%

    ● Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%

    ● Apache MXnet, 1.5%

    ● Caffe, 1.5%

    ● Caffe2, 1.2%

    ● TFLearn, 1.1%

    ● Torch, 1.0%

    ● Lasagne, 0.3%

    大数据工具:Hadoop被丢弃

    2018年,约33%的开发者运用Hadoop或Spark等大数据工具 - 与2017年大致相反,但Hadoop运用率清楚下降,下降幅度高达35%,以下是详细信息:

    编程言语

    Python似乎不只超过了R,还包括大少数其他言语,目前Python和SQL,Java和C / C ++简直保持在相反水平。自从KDnuggets 停止这项调查以来,R第一次出现了下降。其他言语异样也有所下降。

    以下是按抢手度排序的主要编程言语:

    ● Python, 65.6% (was 59.0% in 2017), 11% up

    ● R, 48.5% (was 56.6%), 14% down

    ● SQL, 39.6% (was 39.2%), 1% up

    ● Java, 15.1% (was 15.5%), 3% down

    ● Unix, shell/awk/gawk, 9.2% (was 10.8%), 15% down

    ● Other programming and data languages, 6.9%, (was 7.6%), -9% down

    ● C/C++, 6.8%, (was 7.1%), 3% down

    ● Scala, 5.9%, (was 8.3%), 29% down

    ● Perl, 1.0% (was 1.9%), 46% down

    ● Julia, 0.7% (was 1.2%), 45% down

    ● Lisp, 0.3% (was 0.4%), -25% down

    ● Clojure, 0.2% (was 0.3%), -38% down

    ● F, # 0.1% (was 0.5%), -73% down

    残缺结果和 3 年来的趋向

    以下表格展现了调查结果的细节(此处仅列出排名前 20 的工具):

    2018年数据迷信和机器学习调查:Python完胜R言语,Hadoop被丢弃!

    【编辑引荐】

    欧盟数据新规失效:Facebook和谷歌最先被“开刀”

    Python 扩展抢先优势, PyTorch 仅占 6.4%

    冷艳大数据: 100个帝都人是如何生活的

    黑科技!当会爬虫的Python遇上会画图的FineBI……

    Python 新功用:或将允许安全工具查看运转时操作

    (责任编辑:admin)