MARC状态:审校 文献类型:中文图书 浏览次数:10
- 题名/责任者:
- 大数据处理:从采集到可视化/余肖生,陈鹏,姜艳静编著
- 出版发行项:
- 武汉:武汉大学出版社,2020
- ISBN及定价:
- 978-7-307-21514-6/CNY38.00
- 载体形态项:
- 215页:图;24cm
- 其它题名:
- 从采集到可视化
- 个人责任者:
- 余肖生 编著
- 个人责任者:
- 陈鹏 编著
- 个人责任者:
- 姜艳静 编著
- 学科主题:
- 数据处理-高等学校-教材
- 中图法分类号:
- TP274
- 一般附注:
- 高等学校信息管理学专业系列教材
- 提要文摘附注:
- 本书共分为9章,第一章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
全部MARC细节信息>>