数据科学: 使用 Python 实作深度学习

数据科学,大数据,机器学习是近几年非常热门的技术,人工智能越来越进步,这些时髦的科技背后的原理是? 这堂课很棒的是有教你理论与实作,实作的专案教你如何预测用户在网站的操作,是否还会再回来,还会教你 Google TensorFlow ,不过讲师一再强调他是要教你原理去理解这些是如何运作的,而不是教你如何使用 API 。

这堂课有点硬,而且讲师有列出上课前的条件与先修课程,这堂课不是机器学习的一般知识课程

繁體中文課程介紹

从这 6.5 小时的课程,你会学到

  • 使用 Python 和 numpy 从头开始编写类神经网络
  • 使用 Google 的 TensorFlow 编写一个类神经网络
  • 描述与类神经网络相关的各种术语,例如 “activation”,“backpropagation” 和“feedforward”
  • 描述不同类型的类神经网络和它们用于的不同类型的问题
  • 从第一原则推导反向传播规则
  • 使用softmax 创建一个具有 K> 2 阶级输出的类神经网络
  • 安装 TensorFlow

规定为何?

  • 如何取用偏微分(partial derivatives)和对数或然率(log-likelihoods)(例如找出死亡的最大可能性估计)
  • 安装Numpy和Python(截至2016年1月大约最新版本的Numpy)
  • 不要担心安装TensorFlow,我们会在课程中说明。

课程说明

本课程将让你开始使用深度学习技术构建你的第一个人工类神经网络( artifical neural network )。按照我以前的逻辑回归(logistic regression)课程,我们采用这个基本的构建块(builing block),并使用Python和Numpy 构建全开的非线性类神经网络。本课程的所有教材都是免费的

我们使用softmax函数将以前的二进制分类模型扩展为多个分类,并且我们使用第一原理导出非常重要的训练方法称之为“反向传播 (backpropagation)”。我会向你说明如何在Numpy中反向传播代码,首先是“缓慢的方式”,然后是“快速的方式”使用Numpy功能。

接下来,我们使用 Google 的新 TensorFlow 进程库实现一个类神经网络。

如果你有兴趣开始朝向成为深度学习专业人士这个目标,或者如果你对机器学习数据科学感兴趣,那么你应该参加这门课程。我们超越了基本模型,例如逻辑回归和线性回归,我向你展示一些自动学习特征的东西。

本课程为你提供了许多实用范例,以便你可以真正了解如何使用深度学习。在整个课程中,我们将实作一个课程专案,该专案将向你展示如何预测用户在网站上的操作,这些用户数据包括用户是否在移动设备上,他/她们查看的产品数量,他/她们在你的网站上停留多长时间,他/她们是否是回访用户,以及他/她们访问的时间。

课程结束时的另一个专案向你展示如何使用深度学习来进行脸部表情识别。想像一下,能够预测某人的情绪只是基于一张图片!

在让你动手做后有了基础,我提供了一些最新的类神经网络发展的简要概述-稍微修改的架构和它们用来做什么。

注意:

如果你已经知道softmax和反向传播,并且你想跳过理论的部分然后加速使用更先进的 GPU优化技术,请查看我对此主题的后续课程 – Data Science: Practical Deep Learning Concepts in Theano and TensorFlow

我有其它课程,涵盖更先进的主题,例如 Convolutional 类神经网络, Restricted Boltzmann Machines, Autoencoders 等等!但是,在进入更高端的主题之前,希望你先对本课程中的教材是有自信的。

本课程重点介绍“如何建造和理解”,而不仅仅是“如何使用”。任何人都可以在阅读一些文档后的15分钟内学会如何使用 API。这不是关于“记住事实”,而是关于透过实验“让自己理解”。它将教你如何将模型内部中发生了什么事可视化。如果你想要的不仅仅是肤浅地看机器学习模型,这个课程是为你设计的。

所有这个课程的代码可以从我的github 目录下:ann_class 下载:/ lazyprogrammer / machine_learning_examples

确定你总是使用 “git pull ”,所以你会有最新的版本!

你已经具备困难的前提条件/知识:

  • 微积分
  • 线性代数
  • 机率
  • Python 编程 : if/else, loops, lists, dicts, sets
  • Numpy 编程 : 矩阵和矢量操作,加载一个 CSV 文档

小技巧(为了完成课程):

  • 使用 2x 倍速观看
  • 采取手写笔记。这将大大提高您保留信息的能力。
  • 在讨论板上提出很多问题。越多越好!
  • 意识到大多数练习需要几天或几周才能完成。

有帮助的课程顺序链接 ( 译注: 有些课程是先修课 ):

目标受众为何?

  • 对机器学习感兴趣的学生 – 你会得到所有你需要做好的有趣的题目在一个类神经网络课程
  • 希望在他/她们的机器学习和数据科学管道中使用类神经网络的专业人员。
  • 已经知道如何获取偏微分和对数或然率的人。因为我们在我的逻辑回归课程中更详细地讨论了这一点,所以在这里没有完全涵盖。
  • 已经知道如何使用 Python和 Numpy 编程的人。你对这些需要一点熟悉,因为我们进行得很快。别担心,这不是那么难。

讲师简介

Lazy Programmer Inc 数据科学家和大数据工程师

我是一名数据科学家、大数据工程师和全端软件工程师。

我有电脑工程的硕士,专长为机器学习和模式辨识。

我曾在网络广告和数字媒体企业担任过数据科学家和大数据工程师,围绕所谓的数据建构各种高流量的 web 服务。我曾经使用 Hadoop / Pig / MapReduce 创建新的大数据管道,也曾创建机器学习模型来预测点击率,使用线性回归、Bayesian Bandits 和协同过滤 ( collaborative filtering )创建新闻推荐系统,并使用A / B测试验证结果。

我曾在大学部与研究所教授数据科学、统计学、机器学习、算法、微积分、电脑图学和物理学,任职的学校如哥伦比亚大学、纽约大学、Hunter 学院和 The New School。

有多家企业已从我的 Web 编程专业知识中受益。我做所有的后端(服务器)、前端(HTML / JS / CSS)和运营/布署工作。 我使用的技术包含:Python、Ruby / Rails、PHP、Bootstrap、jQuery(Javascript)、Backbone 和  Angular。至于保存/数据库,我采用 MySQL、Postgres、Redis、MongoDB等。

英文字幕:有

  • 想要了解如何将英文字幕自动翻译成中文? 请参考这篇 How-To

课程网址  ♥找优惠折扣码?

Sponsored by Udemy

 欢迎使用e-mail订阅 Soft & Share 

发表评论

Powered by WordPress.com.

Up ↑

%d 博主赞过: