最近,有一份很片面的算法资源在GitHub上火了,不只要相应的原理引见和实现代码,还提供了Demo,目前GitHub上标星曾经打破2900星。
这份资源中,一共有5个算法,辨别是:线性回归、逻辑回归、K均值算法、基于高斯散布的异常检测、多层感知器(MLP)。
每一个算法,都会有数学原了解释、Python完成的示例和交互式的Jupyter Notebook Demo。大少数状况下,这些算法的解释,都是基于吴恩达的机器学习课程。
基于这些资源,你可以停止相应的数据训练、算法配置,并立刻在阅读器中查看结果、图表和预测。
资源里都有什么?5个算法, 一共分为了监视学习、无监视学习和神经网络3个类别。每个大的类别,都有相应的引见,并给出了相应的运用范围。然后就是相应算法的资源。
以神经网络为例,这个类别之下的算法是多层感知器,一共有4个资源。
第一个资源是文档,引见了神经网络和多层感知器背后的原理与完成逻辑,并提供了相应的参考材料,可以进一步学习。
第二个资源是代码,出现了如何用Python完成多层感知器。基本上每一块代码前,都有相应的注释,标明了代码的功用和留意事项。
后两个资源是基于Jupyter Notebook的Demo,用算法和数据集训练模型,来进一步的熟习多层感知器算法的运用。
一个运用MNIST数据集训练一个辨认手写数字(0-9)的分类器。另一个运用是Fashion-MNIST数据集,训练一个衣服分类器。
需求什么先决条件?资源的上手门槛不高,最基本的要求就是安装Python。由于项目中的一切Demo都可以在阅读器中运转,所以不需求在本地安装Jupyter。
一切用于Jupyter Notebook的数据集都可以在data文件夹中找到。
谁干的坏事?制造这份资源的,是一位名叫Oleksii Trekhleb的乌克兰工程师,目前正在一家软件技术咨询公司EPAM Systems担任首席软件工程师。
他说,树立这个存储库的目的,不是经过运用第三方库的“一行顺序”来完成机器学习算法,而是从头末尾实际这些算法,从而让大家可以更好地了解每个算法背后的原理。
传送门https://github.com/trekhleb/homemade-machine-learning
【编辑引荐】
@顺序员,写代码真的比女冤家重要吗?
Linux Kernel 去年净增 87 万行代码
(责任编辑:admin)