跳到主要内容
输入搜索条件
您正在用访客帐号访问 (
登录
)
当前访问位置:
首页
课程
大数据快速运算(共享)
大数据快速运算(共享)
共享课程
授课老师:
徐永春
课程简介:
通过学习课程使得学生掌握Spark对大规模数据的交互式分析、编写Spark应用以及使用SparkStreaming处理高速数据流的主要思想和基本步骤;同时对Spark平台的应用与开发的理论知识有所了解,如分布式数据收集、分布式数据存储、分布式数据计算、分布式数据展示。开设本学科的目的是让学生掌握如何使用大数据分析技术解决特定业务领域的问题。完成本课程学习后能够熟练的应用大数据技术解决企业中的实际生产问题。
已有
578358
人浏览此课程
新闻通告
讨论区
教师团队
课程说明
学习内容
形成性考核
实操实训
拓展资源
折叠/展开
第一章 章节:Scala语言基础
教学内容:
第一章 Scala语言基础
图书
1.1 初识scala
网页
1.2 Scala的基础语法
网页
1.3 scala数据结构
网页
1.4 Scala面向对象的特性及模式匹配
网页
教学视频
课程讨论
单元测试1
第二章 章节:Spark基础
教学内容:
2.1 spark概述
网页
2.2 spark特点
网页
2.3 spark应用场景
网页
2.4 spark与hadoop对比
网页
2.5 搭建spark开发环境
网页
2.6 spark运行架构与原理
网页
2.7 体验第一个spark程序
网页
教学视频
课程讨论
spark运行架构及原理如何
讨论区
单元测试
第三章 章节:Spark RDD弹性分布式数据集
教学内容:
3.1 RDD简介
网页
3.2 RDD创建方式
网页
3.3 RDD的处理过程_转换算子
网页
3.4 RDD的处理过程_行动算子
网页
3.5 RDD的分区
网页
3.6RDD的依赖关系
网页
3.7 RDD机制
网页
3.8 spark的DAG概念
网页
3.9 spark的任务调度及运行流程
网页
教学视频
课程讨论
RDD的任务调度流程如何实现?
讨论区
单元测试
第四章 章节:Spark SQL结构化数据文件处理
教学内容
4.1 Spark SQLl的简介
网页
4.2 Spark SQL的架构
网页
4.3 DataFrame简介
网页
4.4 DataFrame的创建
网页
4.5 DataFrame的常用操作
网页
4.6 DataSet简介
网页
4.7 DataSet对象的创建
网页
4.8 RDD转换为DataFrame
网页
4.9 Spark SQL 操作MySQL
网页
4.10 操作Hive数据集
网页
教学视频
课程讨论
HBASE读写数据流程有哪些?
讨论区
单元测试
第五章 章节:HBase分布式数据库
教学内容
5.1HBase的基础知识
网页
5.2HBase的数据模型
网页
5.3HBase的集群部署
网页
5.4HBase的Shell操作
网页
5.5 Hbase的Java AP操作
网页
5.6HBase的架构
网页
5.7 物理存储
网页
5.8 寻址机制
网页
5.9 HBase读写数据流程
网页
教学视频
课程讨论
单元测试
第六章 章节:Kafka分布式发布订阅消息系统
教学内容
6.1消息传递模式简介
网页
6.2Kafka简介
网页
6.3Kafka的核心组件介绍
网页
6.4 Kafka工作流程分析
网页
6.5安装 Kafka
网页
6.6启动 Kafka服务
网页
6.7基于命令行方式使用 Kafka
网页
6.8基于java API方式使用 Kafka
网页
6.9Kafka Streams概述
网页
6.10 Kafka Streams开发单词计数
网页
教学视频
课程讨论
kafka工作流程如何实现?
讨论区
如何利用生产和消费者实现Kafka?
讨论区
单元测试
第七章 章节:Spark Streaming实时计算框架
教学内容
7.1什么是实时计算
网页
7.2常用的实时计算框架
网页
7.3Spark Streaming简介
网页
7.4 Spark Streaming工作原理
网页
7.5 DStream简介
网页
7.6 DStream的编程模型
网页
7.7 DStream的转换操作
网页
7.8DStreaming窗口操作
网页
7.9DStreamin实例输出操作
网页
7.10KafakaUtils. createDstream方式
网页
7.11KafakaUtils. createDirectStream方式
网页
教学视频
课程讨论
单元测试
第八章 章节:Spark MLlib 机器学习算法库
教学内容
8.1什么是机器学习
网页
8.2机器学习应用
网页
8.3Spark机器学习工作流程
网页
8.5本地向量
网页
8.6标注点
网页
8.7本地矩阵
网页
8.8摘要统计
网页
8.9 相关统计
网页
8.10分层抽样
网页
8.1线性支持向量机
网页
8.12逻辑回归
网页
8.13推进模型分类
网页
教学视频
课程讨论
单元测试