2018机器学习工程师 bat工业实战 kaggle案例解析

作者: admin 分类: 机器学习和人工智能教程合集 发布时间: 2018-10-18 01:40

课程介绍

本课程从机器学习中的数学基础、到基本模型、特征工程、工业实战、高阶知识、深度学习,六大阶段,层层深入、逐层递进,直通机器学习本质与其应用,且解决以下十大问题,微积分与矩阵知识在机器学习中如何应用、逻辑回归如何在海量工业实战数据下应用、如何对商品销量进行高准确率预测、如何使用隐马尔可夫模型(HMM)对中文进行分词、如何使用随机森林和支持向量机(SVM)对数据进行分类、如何使用Tensorflow构建RNN模型进行分类预测、如何使用LDA等对文档进行分类、如何自己构建数据集并使用Caffe进行分类、如何使用xgboost与lightGBM在Kaggle比赛中获胜、如何使用循环神经网络抓取文本特征

课程目录
夯实数学基础

第1课 机器学习中的微积分与矩阵
知识点1:Taylor展式、梯度下降和牛顿法初步
知识点2:特征向量、对称矩阵对角化、线性方程

第2课 概率与凸优化
知识点1:矩估计、极大似然估计
知识点2:凸集、凸函数、凸优化、KKT条件

掌握基本模型 打开ML大门

第3课 回归问题与应用
知识点1:线性回归、logistic回归、梯度下降
实战项目:分布拟合与回归、用LR分类与概率预测

实战项目:实际工程海量数据下的logistic回归使用,包括样本处理、特征处理、算法调优和背后的原理

第4课 决策树、随机森林、GBDT
知识点1:决策树 随机森林、GBDT

实战项目:使用随机森林进行数据分类

第5课 SVM
知识点1:线性可分支持向量机、线性支持向量机、非线性支持向量机、SMO

实战项目:使用SVM进行数据分类

第6课 最大熵与EM算法
知识点1:熵、相对熵、信息增益、最大熵模型、IIS、GMM
重中之重 特征工程

第7课 机器学习中的特征工程处理
知识点1:数据清洗、异常点处理、特征抽取、选择与组合策略

实战项目:特征处理与特征选择工具与模板

第8课 多算法组合与模型最优化
知识点1:机器学习问题场景分析、算法选择、模型构建、模型性能分析与优化策略

实战项目:构建模型组合策略工具与模板
工业实战 在实战中掌握一切

第9课 sklearn与机器学习实战
知识点1:sklearn板块介绍,组装与建模流程搭建

实战项目:经典Titanic案例,商品销量预测案例等

第10课 高级工具xgboost/lightGBM与建模实战
知识点1:xgboost与lightGBM使用方法与高级功能

实战项目:Titanic与商品销量预测进阶,Kaggle案例实战

第11课 用户画像与推荐系统
知识点1:基于内容的推荐,协同过滤,隐语义模型,learning to rank,推荐系统评估

实战项目:实际打分数据上的推荐系统构建

第12课 聚类
知识点1:K-means/K-Medoid/层次聚类
实战项目:K-means代码实现和实际应用分析
第13课 聚类与推荐系统实战
实战项目:用户聚类结合推荐算法,构建推荐系统完整案例(送完整可运行的代码)

高阶知识 深入机器学习

第14课 贝叶斯网络
知识点1:朴素贝叶斯、有向分离、马尔科夫模型

第15课 隐马尔科夫模型HMM
知识点1:概率计算问题、参数学习问题、状态预测问题

实战项目:使用HMM进行中文分词

第16课 主题模型
知识点1:pLSA、共轭先验分布、LDA

实战项目:使用LDA进行文档分类
迈入深度学习 打开DL大门

第17课 神经网络初步
知识点1:全连接神经网络、反向传播算法与权重优化,训练注意点

实战项目:构建神经网络解决非线性切分问题

第18课 卷积神经网络与计算机视觉
知识点1:卷积神经网络结构分析、过拟合与随机失活,卷积神经网络理解

实战项目:工业界常用网络结构与搭建

第19课 循环神经网络与自然语言处理
知识点1:循环神经网络、长时依赖问题与长短时记忆网络,BPTT算法

实战项目:利用循环神经网络生成文本、学汪峰写歌词

第20课 深度学习实践
知识点1:Caffe应用要点、TensorFlow/Keras简介
实战项目:用Caffe在自己的数据集上完成分类,用Tensorflow构建RNN模型分类预测

 

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多阅读