MARC状态:审校 文献类型:中文图书 浏览次数:7
- 题名/责任者:
- 互联网数据采集技术与应用/周林娥主编
- 出版发行项:
- 北京:清华大学出版社,2022
- ISBN及定价:
- 978-7-302-61910-9/CNY49.00
- 载体形态项:
- 130页:图;26cm
- 丛编项:
- 大数据技术与人工智能应用系列
- 个人责任者:
- 周林娥 主编
- 学科主题:
- 互联网络-数据采集
- 中图法分类号:
- TP274
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书基于“基础知识”+“代码示例”+“应用案例”的模式编写,共包括7个项目。项目1主要介绍互联网数据采集的入门知识;项目2通过一个案例,介绍互联网数据采集的基本流程;项目3通过一个进阶案例,介绍在没有给出官方开放API的情况下,如何通过抓包工具获取XHR请求地址;项目4主要介绍HTML文档数据的采集,对HTML进行解析,以及如何提取数据的属性与文本;项目5主要讲解批量获取数据的整理与合并技巧;项目6重点讲解如何通过Python的pymysql库对MySQL进行读写;项目7给出了对半结构化数据进行处理的最佳实践。
全部MARC细节信息>>