课程介绍
Spark基础课程二,是大数据学院Spark教程的第二部分,本课将对Spark基础部分的定义做进一步延伸。内容涵盖了Spark的基础构架;大数据分布的进一步探索;以及任务的并发执行。通过学习本课,您可以进一步了解Spark在做连接时是如何优化数据的,Spark的内存缓存机制,以及如何使用Spark高级API引擎。
本课由MetiStream公司于IBM Analytics 合作开发。
课程大纲
学习要求
前提条件
完成大数据学院的Hadoop基础课程- 第三版
完成大数据学院的Spark基础课程一
在学习本科之前,推荐掌握的基本知识
理解Apache Hadoop以及大数据的基本知识
Linux操作系统的基础知识
具备Scala,Python 或者Java编程语言基础
考核标准
课件浏览100%,客观练习0%,主观练习0%,课内讨论0%。
课程内容不断迭代,成绩以当时的课程内容为准,一旦合格,可以申请证书。申请证书后,以结课处理,成绩不再改动