用 Python 集成机器学习 : 随机森林、 AdaBoost

集成方法 ( Ensemble Methods ):用 Python 做数据科学的 Boosting、Bagging、Bootstrap 和统计机器学习。

繁體中文課程介紹

从这 5 小时的课程,你会学到

  • 理解并导出偏差 – 变异 ( Bias – Variance ) 分解
  • 理解 bootstrap 方法及其在 bagging 的应用
  • 理解为什么 bagging 可以提高分类和回归性能
  • 理解并实施随机森林( Random Forest )
  • 理解并实施 AdaBoost

要求

  • 微分学
  • Numpy、Matplotlib、Sci-Kit 学习
  • K-Nearest Neighbors、决策树
  • 机率和统计(大学程度)
  • 线性回归、逻辑回归

课程说明

近年来,我们看到人工智能 ( AI  ) 和机器学习的兴起。

机器学习导致了一些惊人的结果,比如能够分析医学图像并做出不输给人类专家的疾病辨识。

Google 的 AlphaGo 计划已通过深度强化学习在战略游戏中击败世界冠军。

机器学习甚至被用于程序化汽车的自动驾驶,这将永远改变汽车行业。 设想一个汽车事故急剧减少的世界,只需消除人为错误的因素。

Google 有名的宣布,他们现在是“机器学习第一”,NVIDIA 和 Amazon 等公司也纷纷效仿,这将是未来几年将推动创新。

机器学习嵌入到各种不同的产品中,并被广泛应用于金融、网络广告、医药、机器人等行业。

这是一个广泛应用的工具,无论你在哪个行业,都将使你受益匪浅,而且一旦你擅长这方面,也将为你创造大量的就业机会。

机器学习也引发了一些哲学问题。 我们在建造一台可以思考的机器吗? 意识到什么? 有一天电脑会占领世界吗?

📣这个课程是关于集成方法 (Ensemble Methods)

我们已经学习了一些经典的机器学习模型,如 k-nearest neighbor 决策树。 我们已经研究了他们的局限和缺点。

但是,如果我们可以结合这些模型来消除这些限制,并产生更强大的分类器或回归器呢?

在本课程中,你将学习如何将决策树和逻辑回归等模型相结合,以创建可以达到比基础模型更高的精度的模型。

具体来说,我们将详细研究随机森林和 AdaBoost 算法

为了激励我们的讨论,我们将学习统计学习中一个重要的话题 – 偏差 – 变异权衡 ( bias-variance trade-off )。然后,我们将研究 bootstrap 技术和 bagging 作为同时减少偏差和变异的方法。

我们将做大量的实验,并在真实的数据集上使用这些算法,这样你就可以亲眼看到它们是多么的强大。

由于深度学习如此受欢迎,我们将研究随机森林、AdaBoost 和深度学习神经网络之间的一些有趣的共同点。

所有这个课程的材料都是免费的。你可以使用 Windows、Linux 或 Mac 上的简单命令下载并安装 Python、Numpy 和 Scipy

本课程著重于 “如何创建和理解”,而不仅仅是 “如何使用”。 读完一些文档后,任何人都可以在 15 分钟内学会使用 API。 这不是 “记住事实”,而是经由实验 “亲眼看见”。 它会教你如何可视化模型内部发生的事情。 如果你想要更多超越表面的机器学习模型,这个课程是为你设计的。

📣 注意:

  • 本课程的所有代码可以从我的 github下载:/ lazyprogrammer / machine_learning_examples
  • 在目录:supervised_class2
  • 确保你总是用 “git pull” 取出,这样才能拿到最新版本!

📣 学习本课程的必要先决条件/知识:

  • 微积分
  • 机率
  • 面向对象编程
  • Python 编程 : if/else, loops, lists, dicts, sets
  • Numpy 编程: 矩阵和矢量运算
  • 线性回归、逻辑回归、决策树、kNN

📣 如何从本课程受益的提示:

  • 以2倍速度观看。
  • 手写笔记。 这将大大增加你记住信息的能力。
  • 写下方程序。 如果你不这样做,我保证它会看起来像胡言乱语。
  • 在讨论板上提出许多问题。 越多越好!
  • 意识到大多数练习将花费你几天或几周的时间来完成。
  • 自己写代码,不要坐在那里看我写。

📣如果觉得知识不足,可考虑先修以下课程:

目标受众

  • 想了解赢得机器学习竞赛 ( Netflix奖、Kaggle ) 各类型楷模的人
  • 学习机器学习的学生
  • 希望将数据科学和机器学习应用于工作的专业人员
  • 希望应用数据科学和机器学习来优化业务的企业家
  • 想了解更多关于数据科学和机器学习的计算机科学学生
  • 知道一些基本的机器学习模型,但想知道如何创建当今最强大的模型(随机森林、AdaBoost 和其他集成方法)的人

讲师简介

Lazy Programmer Inc 数据科学家和大数据工程师

我是一名数据科学家、大数据工程师和全端软件工程师。

我有电脑工程的硕士,专长为机器学习和模式辨识。

我曾在网络广告和数字媒体企业担任过数据科学家和大数据工程师,围绕所谓的数据建构各种高流量的 web 服务。我曾经使用 Hadoop / Pig / MapReduce 创建新的大数据管道,也曾创建机器学习模型来预测点击率,使用线性回归、Bayesian Bandits 和协同过滤 ( collaborative filtering )创建新闻推荐系统,并使用A / B测试验证结果。

我曾在大学部与研究所教授数据科学、统计学、机器学习、算法、微积分、电脑图学和物理学,任职的学校如哥伦比亚大学、纽约大学、Hunter 学院和 The New School。

有多家企业已从我的 Web 编程专业知识中受益。我做所有的后端(服务器)、前端(HTML / JS / CSS)和运营/布署工作。 我使用的技术包含:Python、Ruby / Rails、PHP、Bootstrap、jQuery(Javascript)、Backbone 和  Angular。至于保存/数据库,我采用 MySQL、Postgres、Redis、MongoDB等。

英文字幕:有

  • 想要了解如何将英文字幕自动翻译成中文? 请参考这篇 How-To

课程网址  ♥找优惠折扣码?

Sponsored by Udemy

 欢迎使用e-mail订阅 Soft & Share 

发表评论

Powered by WordPress.com.

Up ↑

%d 博主赞过: