六六文档
首页
PHP
Python
Java
Javascript
Web
所有电子书
六六文档
开源电子书
Spark 编程指南简体中文版
Spark 编程指南简体中文版
[作]
Apache Spark
更新时间:2015
本文翻译自Spark 官方文档 1.2.1
spark
/
2015
/
简体中文
开始阅读
目录
Introduction
1.
快速上手
1.1.
Spark Shell
1.2.
独立应用程序
1.3.
开始翻滚吧!
2.
编程指南
2.1.
引入 Spark
2.2.
初始化 Spark
2.3.
Spark RDDs
2.3.1.
并行集合
2.3.2.
外部数据集
2.3.3.
RDD 操作
2.3.3.1.
传递函数到 Spark
2.3.3.2.
使用键值对
2.3.3.3.
Transformations
2.3.3.4.
Actions
2.3.4.
RDD持久化
2.4.
共享变量
2.5.
从这里开始
3.
Spark Streaming
3.1.
一个快速的例子
3.2.
基本概念
3.2.1.
关联
3.2.2.
初始化StreamingContext
3.2.3.
离散流
3.2.4.
输入DStreams
3.2.5.
DStream中的转换
3.2.6.
DStream的输出操作
3.2.7.
缓存或持久化
3.2.8.
Checkpointing
3.2.9.
部署应用程序
3.2.10.
监控应用程序
3.3.
性能调优
3.3.1.
减少批数据的执行时间
3.3.2.
设置正确的批容量
3.3.3.
内存调优
3.4.
容错语义
4.
Spark SQL
4.1.
开始
4.2.
数据源
4.2.1.
RDDs
4.2.2.
parquet文件
4.2.3.
JSON数据集
4.2.4.
Hive表
4.3.
性能调优
4.4.
其它SQL接口
4.5.
编写语言集成(Language-Integrated)的相关查询
4.6.
Spark SQL数据类型
5.
GraphX编程指南
5.1.
开始
5.2.
属性图
5.3.
图操作符
5.4.
Pregel API
5.5.
图构造者
5.6.
顶点和边RDDs
5.7.
图算法
5.8.
例子
6.
部署
6.1.
独立运行Spark
6.2.
在yarn上运行Spark
7.
更多文档
最近更新
Uncurled - everything I know and learned about running and maintaining Open Source projects for three decades
Spark 编程指南简体中文版
编程之法
Serverless架构应用开发指南
Web安全学习笔记
HTTP下午茶
前端代码规范及最佳实践
HTTP 接口设计指北
JSON风格指南
前端工程师的日记
正则表达式30分钟入门教程
gulp入门指南
gulp中文文档
Go编程时光
从零到一的 Python 学习路线
Python中文指南(iswbm出品)
PyCharm 中文指南
Python黑魔法手册
浏览器开发工具的秘密
Design Pattern 包教不包会
热门标签
开源
spark
编程
算法
serverless
web
web安全
http
前端
代码规范
api
json
javascript
编程人生
前端工程师
正则表达式
入门教程
gulp
golang
python
pycharm
编辑器
浏览器
开发工具
设计模式
java
saas
软件架构
编码规范
css
less
html
mysql
数据库
postgresql
redis
nosql
mongodb
emacs
git
github
svn
版本控制
参考手册
入门
物联网
linux
操作系统
freebsd
mac
mac开发
docker
unix
react
js
面试
计算机基础
程序员文化
程序员
vim
游戏编程
python2
go语言
leetcode
数学
英语学习
语言学习
flask
framework
nginx
↑