MARC状态:审校 文献类型:中文图书 浏览次数:4
- 题名/责任者:
- Python大数据处理库PySpark实战/汪明著
- 出版发行项:
- 北京:清华大学出版社,2021
- ISBN及定价:
- 978-7-302-57508-5/CNY79.00
- 载体形态项:
- 310页:图;21cm
- 个人责任者:
- 汪明 著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书分为7章, 第1章介绍大数据的基本概念、常用的大数据分析工具; 第2章介绍Spark作为大数据处理的特点和算法; 第3章介绍Spark实战环境的搭建, 涉及Windows和Linux操作系统; 第4章介绍如何灵活应用PySpark对数据进行操作; 第5章介绍PySpark ETL处理, 涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容; 第6章介绍PySpark如何利用MLib库进行分布式机器学习 (Titanic 幸存者预测); 第7章介绍一个PySpark和Kafka结合的实时项目。
全部MARC细节信息>>