跳到主要内容
输入搜索条件
您正在用访客帐号访问 (
登录
)
当前访问位置:
首页
课程
大数据快速运算(共享)
大数据快速运算(共享)
共享课程
授课老师:
徐永春
课程简介:
通过学习课程使得学生掌握Spark对大规模数据的交互式分析、编写Spark应用以及使用SparkStreaming处理高速数据流的主要思想和基本步骤;同时对Spark平台的应用与开发的理论知识有所了解,如分布式数据收集、分布式数据存储、分布式数据计算、分布式数据展示。开设本学科的目的是让学生掌握如何使用大数据分析技术解决特定业务领域的问题。完成本课程学习后能够熟练的应用大数据技术解决企业中的实际生产问题。
已有
43784
人浏览此课程
选择活动新闻通告
新闻通告
讨论区
教师团队
课程说明
学习内容
形成性考核
实操实训
拓展资源
折叠/展开
第一章 章节:Scala语言基础
教学内容:
选择活动第一章 Scala语言基础
第一章 Scala语言基础
图书
进度
学生必须
查看
选择活动1.1 初识scala
1.1 初识scala
网页
进度
学生必须
查看
选择活动1.2 Scala的基础语法
1.2 Scala的基础语法
网页
进度
学生必须
查看
选择活动1.3 scala数据结构
1.3 scala数据结构
网页
进度
学生必须
查看
选择活动1.4 Scala面向对象的特性及模式匹配
1.4 Scala面向对象的特性及模式匹配
网页
进度
学生必须
查看
教学视频
选择活动1.1初始Scala
1.1初始Scala
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动1.2scala的基础语法
1.2scala的基础语法
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动1.3scala数据结构
1.3scala数据结构
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动1.4 Scala面向对象的特性及模式匹配
1.4 Scala面向对象的特性及模式匹配
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
单元测试1
第二章 章节:Spark基础
教学内容:
选择活动2.1 spark概述
2.1 spark概述
网页
进度
学生必须
查看
选择活动2.2 spark特点
2.2 spark特点
网页
进度
学生必须
查看
选择活动2.3 spark应用场景
2.3 spark应用场景
网页
进度
学生必须
查看
选择活动2.4 spark与hadoop对比
2.4 spark与hadoop对比
网页
进度
学生必须
查看
选择活动2.5 搭建spark开发环境
2.5 搭建spark开发环境
网页
进度
学生必须
查看
选择活动2.6 spark运行架构与原理
2.6 spark运行架构与原理
网页
进度
学生必须
查看
选择活动2.7 体验第一个spark程序
2.7 体验第一个spark程序
网页
进度
学生必须
查看
教学视频
选择活动2.1spark概述
2.1spark概述
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.2spark特点
2.2spark特点
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.3spark应用场景
2.3spark应用场景
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.4Spark与Hadoop对比
2.4Spark与Hadoop对比
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.5搭建spark开发环境
2.5搭建spark开发环境
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.7体验第一个Spark程序
2.7体验第一个Spark程序
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动2.7体验第一个Spark程序
2.7体验第一个Spark程序
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
选择活动spark运行架构及原理如何
spark运行架构及原理如何
讨论区
进度
学生必须
查看
单元测试
第三章 章节:Spark RDD弹性分布式数据集
教学内容:
选择活动3.1 RDD简介
3.1 RDD简介
网页
进度
学生必须
查看
选择活动3.2 RDD创建方式
3.2 RDD创建方式
网页
进度
学生必须
查看
选择活动3.3 RDD的处理过程_转换算子
3.3 RDD的处理过程_转换算子
网页
进度
学生必须
查看
选择活动3.4 RDD的处理过程_行动算子
3.4 RDD的处理过程_行动算子
网页
进度
学生必须
查看
选择活动3.5 RDD的分区
3.5 RDD的分区
网页
进度
学生必须
查看
选择活动3.6RDD的依赖关系
3.6RDD的依赖关系
网页
进度
学生必须
查看
选择活动3.7 RDD机制
3.7 RDD机制
网页
进度
学生必须
查看
选择活动3.8 spark的DAG概念
3.8 spark的DAG概念
网页
进度
学生必须
查看
选择活动3.9 spark的任务调度及运行流程
3.9 spark的任务调度及运行流程
网页
进度
学生必须
查看
教学视频
选择活动3-1RDD简介
3-1RDD简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.2RDD的创建方式
3.2RDD的创建方式
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.3RDD处理过程_转换算子
3.3RDD处理过程_转换算子
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.4RDD处理过程_行动算子
3.4RDD处理过程_行动算子
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.5RDD的分区
3.5RDD的分区
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.6RDD的依赖关系
3.6RDD的依赖关系
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.7RDD机制
3.7RDD机制
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.8sparkDAG概念
3.8sparkDAG概念
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动3.9RDD在spark中的运行流程
3.9RDD在spark中的运行流程
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
选择活动RDD的任务调度流程如何实现?
RDD的任务调度流程如何实现?
讨论区
进度
学生必须
查看
单元测试
第四章 章节:Spark SQL结构化数据文件处理
教学内容
选择活动4.1 Spark SQLl的简介
4.1 Spark SQLl的简介
网页
进度
学生必须
查看
选择活动4.2 Spark SQL的架构
4.2 Spark SQL的架构
网页
进度
学生必须
查看
选择活动4.3 DataFrame简介
4.3 DataFrame简介
网页
进度
学生必须
查看
选择活动4.4 DataFrame的创建
4.4 DataFrame的创建
网页
进度
学生必须
查看
选择活动4.5 DataFrame的常用操作
4.5 DataFrame的常用操作
网页
进度
学生必须
查看
选择活动4.6 DataSet简介
4.6 DataSet简介
网页
进度
学生必须
查看
选择活动4.7 DataSet对象的创建
4.7 DataSet对象的创建
网页
进度
学生必须
查看
选择活动4.8 RDD转换为DataFrame
4.8 RDD转换为DataFrame
网页
进度
学生必须
查看
选择活动4.9 Spark SQL 操作MySQL
4.9 Spark SQL 操作MySQL
网页
进度
学生必须
查看
选择活动4.10 操作Hive数据集
4.10 操作Hive数据集
网页
进度
学生必须
查看
教学视频
选择活动4.1Spark SQL的简介
4.1Spark SQL的简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.2Spark SQL的架构
4.2Spark SQL的架构
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.3DataFrame简介
4.3DataFrame简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.4DataFrame的创建
4.4DataFrame的创建
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.5DataFrame的常用操作
4.5DataFrame的常用操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.6DataSet简介
4.6DataSet简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.7Dataset对象的创建
4.7Dataset对象的创建
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.8RDD转换DataFrame
4.8RDD转换DataFrame
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.9Spark SQL操作MySQL
4.9Spark SQL操作MySQL
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动4.10 操作Hive数据库
4.10 操作Hive数据库
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
选择活动HBASE读写数据流程有哪些?
HBASE读写数据流程有哪些?
讨论区
进度
学生必须
查看
单元测试
第五章 章节:HBase分布式数据库
教学内容
选择活动5.1HBase的基础知识
5.1HBase的基础知识
网页
进度
学生必须
查看
选择活动5.2HBase的数据模型
5.2HBase的数据模型
网页
进度
学生必须
查看
选择活动5.3HBase的集群部署
5.3HBase的集群部署
网页
进度
学生必须
查看
选择活动5.4HBase的Shell操作
5.4HBase的Shell操作
网页
进度
学生必须
查看
选择活动5.5 Hbase的Java AP操作
5.5 Hbase的Java AP操作
网页
进度
学生必须
查看
选择活动5.6HBase的架构
5.6HBase的架构
网页
进度
学生必须
查看
选择活动5.7 物理存储
5.7 物理存储
网页
进度
学生必须
查看
选择活动5.8 寻址机制
5.8 寻址机制
网页
进度
学生必须
查看
选择活动5.9 HBase读写数据流程
5.9 HBase读写数据流程
网页
进度
学生必须
查看
教学视频
选择活动5.1HBase简介
5.1HBase简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.2Hbase的数据模型
5.2Hbase的数据模型
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.3Hbase的集群部署
5.3Hbase的集群部署
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.4Hbase的shell操作
5.4Hbase的shell操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.5Hbase的Java API操作
5.5Hbase的Java API操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.6Hbase的架构
5.6Hbase的架构
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.7物理存储
5.7物理存储
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.8寻址机制
5.8寻址机制
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动5.9Hbase读写数据流程
5.9Hbase读写数据流程
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
单元测试
第六章 章节:Kafka分布式发布订阅消息系统
教学内容
选择活动6.1消息传递模式简介
6.1消息传递模式简介
网页
进度
学生必须
查看
选择活动6.2Kafka简介
6.2Kafka简介
网页
进度
学生必须
查看
选择活动6.3Kafka的核心组件介绍
6.3Kafka的核心组件介绍
网页
进度
学生必须
查看
选择活动6.4 Kafka工作流程分析
6.4 Kafka工作流程分析
网页
进度
学生必须
查看
选择活动6.5安装 Kafka
6.5安装 Kafka
网页
进度
学生必须
查看
选择活动6.6启动 Kafka服务
6.6启动 Kafka服务
网页
进度
学生必须
查看
选择活动6.7基于命令行方式使用 Kafka
6.7基于命令行方式使用 Kafka
网页
进度
学生必须
查看
选择活动6.8基于java API方式使用 Kafka
6.8基于java API方式使用 Kafka
网页
进度
学生必须
查看
选择活动6.9Kafka Streams概述
6.9Kafka Streams概述
网页
进度
学生必须
查看
选择活动6.10 Kafka Streams开发单词计数
6.10 Kafka Streams开发单词计数
网页
进度
学生必须
查看
教学视频
选择活动6.1消息传递模式简介
6.1消息传递模式简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.2Kafka简介
6.2Kafka简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.3Kafka核心组件介绍
6.3Kafka核心组件介绍
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.4Kafka工作流程分析
6.4Kafka工作流程分析
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.5安装Kafka
6.5安装Kafka
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.6启动Kafka服务
6.6启动Kafka服务
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.7基于命令行方式使用Kafka
6.7基于命令行方式使用Kafka
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.8基于java API方式使用Kafka'
6.8基于java API方式使用Kafka'
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.9Kafka Streams概述
6.9Kafka Streams概述
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动6.10Kafka Streams开发单词计数
6.10Kafka Streams开发单词计数
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
选择活动kafka工作流程如何实现?
kafka工作流程如何实现?
讨论区
进度
学生必须
查看
选择活动如何利用生产和消费者实现Kafka?
如何利用生产和消费者实现Kafka?
讨论区
进度
学生必须
查看
单元测试
第七章 章节:Spark Streaming实时计算框架
教学内容
选择活动7.1什么是实时计算
7.1什么是实时计算
网页
进度
学生必须
查看
选择活动7.2常用的实时计算框架
7.2常用的实时计算框架
网页
进度
学生必须
查看
选择活动7.3Spark Streaming简介
7.3Spark Streaming简介
网页
进度
学生必须
查看
选择活动7.4 Spark Streaming工作原理
7.4 Spark Streaming工作原理
网页
进度
学生必须
查看
选择活动7.5 DStream简介
7.5 DStream简介
网页
进度
学生必须
查看
选择活动7.6 DStream的编程模型
7.6 DStream的编程模型
网页
进度
学生必须
查看
选择活动7.7 DStream的转换操作
7.7 DStream的转换操作
网页
进度
学生必须
查看
选择活动7.8DStreaming窗口操作
7.8DStreaming窗口操作
网页
进度
学生必须
查看
选择活动7.9DStreamin实例输出操作
7.9DStreamin实例输出操作
网页
进度
学生必须
查看
选择活动7.10KafakaUtils. createDstream方式
7.10KafakaUtils. createDstream方式
网页
进度
学生必须
查看
选择活动7.11KafakaUtils. createDirectStream方式
7.11KafakaUtils. createDirectStream方式
网页
进度
学生必须
查看
教学视频
选择活动7.1什么是实时计算
7.1什么是实时计算
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.2常用的实时计算框架
7.2常用的实时计算框架
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.3Spark Streaming工作原理
7.3Spark Streaming工作原理
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.4Spark Streaming工作原理
7.4Spark Streaming工作原理
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.5Dstream简介
7.5Dstream简介
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.6Dstream编程模型
7.6Dstream编程模型
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.7Dstream转换操作
7.7Dstream转换操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.8Dstream窗口操作
7.8Dstream窗口操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.9Dstream案例输出操作
7.9Dstream案例输出操作
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.10KafakaUtils. createDstream方式
7.10KafakaUtils. createDstream方式
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动7.11KafakaUtils. createDirectStream方式
7.11KafakaUtils. createDirectStream方式
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
单元测试
第八章 章节:Spark MLlib 机器学习算法库
教学内容
选择活动8.1什么是机器学习
8.1什么是机器学习
网页
选择活动8.2机器学习应用
8.2机器学习应用
网页
选择活动8.3Spark机器学习工作流程
8.3Spark机器学习工作流程
网页
选择活动8.5本地向量
8.5本地向量
网页
选择活动8.6标注点
8.6标注点
网页
选择活动8.7本地矩阵
8.7本地矩阵
网页
选择活动8.8摘要统计
8.8摘要统计
网页
选择活动8.9 相关统计
8.9 相关统计
网页
选择活动8.10分层抽样
8.10分层抽样
网页
选择活动8.1线性支持向量机
8.1线性支持向量机
网页
选择活动8.12逻辑回归
8.12逻辑回归
网页
选择活动8.13推进模型分类
8.13推进模型分类
网页
教学视频
选择活动8.1什么是机器学习
8.1什么是机器学习
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.2机器学习的应用
8.2机器学习的应用
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.3Spark机器学习工作流程
8.3Spark机器学习工作流程
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.5本地向量
8.5本地向量
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.6标注点
8.6标注点
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.7本地矩阵
8.7本地矩阵
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.8摘要统计
8.8摘要统计
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.9相关统计
8.9相关统计
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.10分层抽样
8.10分层抽样
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.11线性支持向量机
8.11线性支持向量机
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.12逻辑回归
8.12逻辑回归
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
选择活动8.13推荐模型分类
8.13推荐模型分类
云视频资源
进度
学生必须
学生必须观看视频达到该视频总时长的 70 时才能完成此活动
课程讨论
单元测试