作家
登录

数据科学家必备的10种机器学习算法

作者: 来源: 2018-03-27 12:03:51 阅读 我要评论

http://scikitlearn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassiJer.html

http://scikitlearn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingClassiJer.html

http://xgboost.readthedocs.io/en/latest/

https://catboost.yandex/

最小二乘法可能会与异常值(outliers)、假字段(spurious fields)和数据中的噪声相混淆。是以,我们须要束缚以削减数据集上所进行拟合的线的方差。精确的办法是应用一个线性回归模型,以确保权重不会掉足。模许可以有L1范数(LASSO)或L2(岭回归,Ridge Regression)或兼具两者(弹性回归)。均方损掉获得优化。

入门教程:

http://xgboost.readthedocs.io/en/latest/model.html

https://arxiv.org/abs/1511.05741

http://education.parrotprediction.teachable.com/p/practical-xgboost-in-python

TD算法

你不必思虑上述哪种算法可以或许像DeepMind那样击包抄棋世界冠军,因为它们都不克不及做到这一点。我们之前谈及的10种算法都是模式辨认,而非策略进修者。为了进修可以或许解决多步调问题的策略,比如博得一盘棋或玩Atari游戏机,我们须要让一个空白的智能体在这世界上根据其自身面对的奖惩进行进修。这种类型的机械进修被称为强化进修。近期,在这个范畴内所取得的很多(并非全部)结不雅都是经由过程将convnet或LSTM的感知才能与一组名为时光差分进修算法(Temporal Difference Learning)的算法组合而得来的。这个中包含Q-Learning、SARSA及其他算法。这些算法是对贝尔曼方程的奇妙应用,大年夜而获得一个可以应用智能体大年夜情况中获得的嘉奖来练习的损掉函数。

这些算法重要用于主动运行游戏中,并在其他说话生成和目标检测项目中予以应用。

库:

https://github.com/keras-rl/keras-rl

https://github.com/tensorqow/minigo

入门教程:

Sutton与Barto的免费书本:https://web2.qatar.cmu.edu/~gdicaro/15381/additional/SuttonBarto-RL-5Nov17.pdf

不雅看David Silver的课程: https://www.youtube.com/watch?v=2pWv7GOvuf0

我们介绍了可以助你成为数据科学家的10中机械进修算法。

你可以在这里浏览机械进修库:https://blog.paralleldots.com/data-science/lesser-known-machine-learning-libraries-part-ii/

【编辑推荐】

  1. 2018年大年夜数据,机械进修和人工智能猜测!
  2. 为什么说机械进修是我们预防收集威逼的最佳兵器
  3. 机械进修崭露头角 九大年夜认知误区早知道
  4. 机械进修研究重现难,难于上彼苍
  5. LinkedIn:数据科学和机械进修成为美国增长最快的岗亭
【义务编辑:庞桂玉 TEL:(010)68476606】

  推荐阅读

  2018区块链发展趋势及展望未来

沙龙晃荡 | 3月31日 京东、微博、华为拭魅战专家与你合营商量容器技巧实践!趋势与瞻望关于区块链的商量和争辩,自其出生之日起就大年夜未暂停。一个是技巧范畴也存在着周期律。 这个周期今朝看是 7-8 >>>详细阅读


本文标题:数据科学家必备的10种机器学习算法

地址:http://www.17bianji.com/lsqh/40943.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)