机读格式显示(MARC)
- 000 01456nam0 2200277 450
- 010 __ |a 978-7-307-21514-6 |d CNY38.00
- 100 __ |a 20200920d2020 em y0chiy50 ea
- 200 1_ |a 大数据处理 |A Da Shu Ju Chu Li |e 从采集到可视化 |f 余肖生,陈鹏,姜艳静编著
- 210 __ |a 武汉 |c 武汉大学出版社 |d 2020
- 215 __ |a 215页 |c 图 |d 24cm
- 300 __ |a 高等学校信息管理学专业系列教材
- 330 __ |a 本书共分为9章,第一章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
- 606 0_ |a 数据处理 |x 高等学校 |j 教材
- 701 _0 |a 余肖生 |A Yu Xiao Sheng |4 编著
- 701 _0 |a 陈鹏 |A Chen Peng |4 编著
- 701 _0 |a 姜艳静 |A Jiang Yan Jing |4 编著
- 801 _0 |a CN |b ZPHC |c 20201107
- 905 __ |a ZPHC |d TP274/245