出版社:电子工业出版社
年代:2018
定价:69.0
本书从作者的多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,让读者看到从一个想法出发,如何进行数据源选择、采集数据、存储、分析数据,覆盖端到端的所有步骤。其中爱飞狗旅行的例子,将让读者看到采集长达两年之久、大约20TB的数据,最终形成一个大数据产品的点点滴滴。案例包括:共享单车、共享汽车、自由职业信息、天眼查工商信息、快递员信息、公交数据、航空数据。这些案例难度由简入深,以自己写代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的一些思维模式,实现以低成本的方式得到想要的数据。
书籍详细信息 | |||
书名 | 草根爬虫站内查询相似图书 | ||
9787121355080 如需购买下载《草根爬虫》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 电子工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 69.0 | 语种 | 简体中文 |
尺寸 | 24 × 19 | 装帧 | 平装 |
页数 | 印数 |
段竹, 田宏, 主编
(英) 洛伦佐·菲奥拉蒙蒂, 著
(美) 弗兰克斯 (Franks,B.) , 著
杨群, 编著
(美) 威廉.H·英蒙 (W.H. Inmon) , (美) 丹尼尔·林斯泰特 (Daniel Linstedt) , 著
(比) 沃特·韦贝克, (比) 巴特·贝森斯, (意) 克里斯蒂安·布拉沃, 著
(日) 石川博, 编著
(美) 托马兹·卓巴斯 (Tomasz Drabas) , (美) 丹尼·李 (Denny Lee) , 著
(美) 恩门 (Bill Inmon) , 著