机读格式显示(MARC)
- 000 01034nam0 2200229 450
- 010 __ |a 978-7-302-57508-5 |d CNY79.00
- 100 __ |a 20210318d2021 em y0chiy50 ea
- 200 1_ |a Python大数据处理库PySpark实战 |A python da shu ju chu li ku pyspark shi zhan |f 汪明著
- 210 __ |a 北京 |c 清华大学出版社 |d 2021
- 215 __ |a 310页 |c 图 |d 21cm
- 330 __ |a 本书分为7章, 第1章介绍大数据的基本概念、常用的大数据分析工具; 第2章介绍Spark作为大数据处理的特点和算法; 第3章介绍Spark实战环境的搭建, 涉及Windows和Linux操作系统; 第4章介绍如何灵活应用PySpark对数据进行操作; 第5章介绍PySpark ETL处理, 涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容; 第6章介绍PySpark如何利用MLib库进行分布式机器学习 (Titanic 幸存者预测); 第7章介绍一个PySpark和Kafka结合的实时项目。
- 606 0_ |a 数据处理 |A Shu Ju Chu Li
- 701 _0 |a 汪明 |A Wang Ming |4 著
- 801 _0 |a CN |b ZPHC |c 20210613
- 905 __ |a ZPHC |d TP274/296