用三维Demo看懂各种优化算法，还有C++顺序员福音

首页

当前位置：首页 > 开发 > WEB开发 >

时间：2019-04-01 12:14 来源：网络整理作者：网络浏览：次收藏挑错推荐打印

机器学习里的优化算法很多，比如SGD、Adam、AdaGrad、AdaDelta等等，光是它们的迭代公式就曾经够让人头疼。

用三维Demo看懂各种优化算法，还有C++顺序员福音

好在TensorFlow、Keras、PyTorch中都集成了这些优化工具，但它们是如何在一步步迭代中“滑落”到最小值的，你真的清楚吗？

如今有一个机器学习优化算法的Demo，能帮你从图像中直观感遭到调参对算法结果的影响，以及各自的优缺陷。

它就是ensmallen！它的开发者不只提供了Demo，还给顺序员们打包了一份C++数据库，那我们先来试玩一下吧。

试玩Demo

试玩办法很复杂，甚至不需求安装任何软件，进入ensmallen网站，选择Demo标签，就能看到一组优化算法的3D表示图。

页面默许是常见的Adam算法，我们会看到参数沿着白色的路途，最终落入损失函数的最低点：

左侧是参数初始值所在位置，也就是图片中的红点，可以用鼠标随意拖动。

中间和右侧的图都是损失函数的“等高线”。中间以不同颜色标记不同高度，右侧直接给出了损失函数的梯度场，以箭头指向表示梯度方向、长度表示梯度大小。可以看出等高线越密集的中央，梯度也越大。

假设觉得下面的损失函数图不够明晰直观，还有高清3D大图：

随着迭代步数的添加，损失函数的数值不断减小：

Adam算法可以调理的超参数有：步长、迭代次数、允许误差、β1、β2、模糊因子ϵ、Batch Size。

用三维Demo看懂各种优化算法，还有C++顺序员福音

拖动滑动条调理超参数，“红线”的外形和终点也会随之变化。我们不妨调理一下步长，看看这个参数会对结果形成什么样的影响。

添加步长会让学习曲线震荡幅度变大，步长太小会让损失函数收敛过慢：

用三维Demo看懂各种优化算法，还有C++顺序员福音

△ 步长辨别是0.3、0.03和0.003的三种状况

以上只是最复杂的状况，Demo界面还提供其他奇形怪状的损失函数：

用三维Demo看懂各种优化算法，还有C++顺序员福音

以及近乎一切常见的优化算法：

在不同外形的损失函数里，这些优化算法各有优缺陷。

假设损失函数的“等高线”是椭圆，Adam收敛速度很快，仅迭代100步左右就曾经收敛，而AdaGrad迭代了近300步才收敛。

但Adam并非就有相对优势。在有多个鞍点和部分最小值的图形中，Adam虽然在末尾阶段下降速度很快，但是在最后阶段震荡较严重，收敛速度反而不及AdaGrad。

下面的“玩法”只是Demo很小的一部分，想尝试更多请参见文末的链接地址。

C++顺序员福音

千万不要以为ensmallen只是一个好玩的Demo，实践上它还是一个高效的C++优化库。关于用C++来给AI编程的顺序员来说，它能对恣意函数停止数学优化，处置了C++机器学习工具匮乏的痛点。

ensmallen除了打包基本优化算法之外，用户还可以运用复杂的API轻松添加新的优化器。完成新的优化器只需求有一种办法和一个新的目的函数，通常用一到两个C++函数就能搞定。

安装ensmallen需求满足以下要求：

支持C++ 11的编译器

C++线性代数与迷信计算库Armadillo

数学函数库OpenBLAS或Intel MKL或LAPACK

ensmallen中的一切内容都在ens命名空间中，因此在代码中放置一个using指令通常很有用：

using namespace ens;

以运用Adam为例，其代码如下：

RosenbrockFunction f;

arma::mat coordinates = f.GetInitialPoint();

Adam optimizer(0.001, 32, 0.9, 0.999, 1e-8, 100000, 1e-5, true);

optimizer.Optimize(f, coordinates);

其中，Adam优化器中参数的顺序依次是：步长、Batch Size、β1、β2、ϵ、最大迭代次数、允许误差、能否以随机方式拜访每个函数。

至于其他优化算法，可以去网站查看详细的阐明文档。

最后附上一切资源：

ensmallen紧缩包下载地址：

https://ensmallen.org/files/ensmallen-1.14.2.tar.gz

Demo地址：

https://vis.ensmallen.org/

【编辑引荐】

顺序员删库跑路网站只剩一张图？真相来了

中国顺序员仅仰仗一段休息规律霸榜GitHub，每团体都值得反思

大胆，究竟是哪些顺序员在向996开炮？

顺序员才懂的搞笑图！保准你笑出猪叫......

人工智能不为人知的历史：那些隐形的女顺序员们

(责任编辑：admin)

标签：12图资源库程序员开发者技能

从零末尾了解Docker

甲骨文谷歌版权之战，你最常用的软件或许被

微软发布 Visual Studio 开展路途图，少量

科技行业薪酬最高的15种职位看看你在哪一

StackOverflow 调查：富有国度盛行 Python

WebAssembly 再添一员猛将：将支持运用 Go

Java案虽已尘埃落定，但软件界的连锁反响才

倾听顺序员的心声真的很重要

Git 12岁了，为你送上12个Git 的运用技巧！

扎克伯格13年前写的Facebook网站代码，你见

颜值、才华和教育很重要，顺序员择偶不在乎

优秀的开发习气，我有几点小建议

猜你也喜欢看这些 ······: [WEB开发] 微软 GitHub 发布 Android Beta; [WEB开发] Kotlin 1.4 和未来值得等候的中; [WEB开发] 2019年这些美国公司为软件工程师; [WEB开发] 290家公司都在用的义务调度系统; [WEB开发] Paxos算法为什么说是Raft,Zab协; [WEB开发] JetBrains推出编程字体Mono：更; [WEB开发] SQL优化技巧总结，及案例剖析; [WEB开发] 很可怕！NSA、GitHub 被恶搞：Wi; [WEB开发] 少儿编程，编不动了？; [WEB开发] 清华博士一作，165页论文破解困; [WEB开发] GraphQL vs REST API 架构，谁更; [WEB开发] 内存用量1/20，速度加快80倍，QQ

其他类型的网站教程 ······: [SEO教程] 斗鱼tv阿怡直播代打视频再爆铁证; [HTML教程] Get Informed About Hvac By Usi; [PHP教程] Ostatni przekaz dzisiaj panie; [JSON教程] Fakt nazwa skrupulatnego prze&; [JS教程] “6;wie&0;e notki po pierw; [JSON教程] Garden The Organic and natural; [FLASH教程] oryginalna viagra cena; [SEO教程] Helpful Advice For That Soccer; [JS教程] Protecting Your State Of Healt; [dede教程] Co ustosunkowana pope&#322; [FLASH教程] Adore Hockey But Will need Tip; [网页设计] Bezstronni rysunek na ciele pr

关键词标签查找 ······: 站长之家网站优化网站源码网页特效下载矢量图片素材 dedecms 全国地图热点字体矢量素材地方门户网站地图生成器蚂蚁分类系统齐博3.5 安卓网站源码红旗安乐业房产源码齐博分类1.51 栏目嵌套顶部公告特效导航竖列菜单 128x128png图标 dede插件汽车源码站长工具箱