(7人评价)
案例为王,实战为主,基于spark2.x机器学习十大案例全方位剖析

Spark MLlib机器学习入门到精通

价格 ¥ 349.50 ¥699.00 5折
活动
课程介绍
轩宇老师:
七年互联网大数据一线研发经验,大数据技术实战派,先后担任过大数据开发工程师、开发经理、项目经理、大数据架构师,有丰富的项目经验。熟悉大数据整体生态链(调研、架构、开发、运维、应用),擅长利用大数据技术进行数据分析。近年来一直专注于分布式计算与机器学习相关领域,是国内最早的Spark研究与使用者。目前专注于Spark平台的大数据处理,任国内某知名在线教育机构大数据专业首席讲师,负责公司所有大数据开发与数据分析专业的产品研发与教学和企业培训工作。

本课程主要讲解Spark MLlib,Spark MLlib是一种高效、快速、可扩展的分布式计算框架;实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark的基础知识、矩阵向量的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark源码实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。

 

了解机器学习、深度学习和人工智能区别

 

熟悉Spark Mllib中的机器学习类库

 

掌握机器学习编程开发步骤

 

理解推荐系统

 

掌握推荐系统的两类金典算法及使用

 

十大案例全方位剖析:
案例1、基于Kaggle的StumbleUpon数据集构建分类系统
案例2、基于BikeSharing数据集构建回归模型
案例3、基于NewsCorpora数据集文本处理新闻分类
案例4、基于KMeans网络流量检测模型
案例5、基于Kaggle Avazu广告数据集构建CRT预测模型
案例6、基于聚类KMeans出租车轨迹分析
案例7、基于决策树预测森林植被
案例8、基于DataFrame API ML预测森林植被
案例9、基于Audioscrobbler数据集的音乐推荐
案例10、基于MovieLens数据集的电影推荐