精通Python网络爬虫:核心技术、框架与项目实战在线阅读
会员

精通Python网络爬虫:核心技术、框架与项目实战

韦玮
开会员,本书免费读 >

计算机网络软件工程及软件方法学13.4万字

更新时间:2019-01-05 03:23:26 最新章节:20.5 小结

立即阅读
加书架
下载
听书

书籍简介

随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫。在大数据时代,聚焦网络爬虫的应用需求越来越大。本书从系统化的视角,为那些想学习Python网络爬虫或者正在研究Python网络爬虫的朋友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并掌握了本书的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python网络爬虫工程师相关岗位的工作。
品牌:机械工业出版社
上架时间:2017-03-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

韦玮
主页
  • 会员
    本书较为全面地介绍了Python编程相关的知识。全书共14章,包括Python开发环境搭建与入门、语法基础、运算符与表达式、控制流、函数、模块、数据结构、常见算法实例、面向对象程序设计、异常处理、文件操作、标准库与其他应用、远程操控计算机项目、腾讯动漫爬虫项目等内容。
    韦玮程序设计13.5万字

同类热门书

最新上架

  • 会员
    本书详细介绍了可用于数据处理的表格格式、云产品、框架、存储层,以及如何将这些内容组合在一起,以获得适合自己需求的高性能解决方案。作者在书中提供的决策框架将帮助你明智地决定选择哪种数据湖。本书是大数据领域每个人的必读书。阅读本书后,你将了解构建云数据湖所需的所有基础知识,并能够以多种方式应用这些知识。本书主要面向数据架构师、数据开发人员和数据运维专业人员,他们希望广泛地了解设置和运营云数据湖的各个方
    (美)鲁克米尼·戈帕兰计算机10.7万字
  • 本书为想要设计、构建和维护实时分析应用程序的人员(包括数据工程师、架构师和技术领导者)提供了结构合理的基础知识。第1章和第2章简要介绍实时分析,并概述可以构建的实时分析应用程序的类型。第3章介绍一家虚构的比萨公司,该公司已经建立了流处理基础设施,但尚未实现任何实时分析功能。第4~10章展示如何为这家比萨公司实现不同类型的实时分析应用程序。第11~13章介绍将应用程序投入生产时的注意事项、实时分析的
    (英)马克·尼达姆计算机6万字
  • 会员
    本书基于软件测试过程模型,构建软件测试价值模型、能力模型及基于能力战略的软件测试策略框架,讨论软件测试终止、测试预言、测试生成问题。基于图结构、图元素及软件失效行为,介绍逻辑驱动、数据驱动、剖面驱动的基础理论、基础技术及实践者方法。基于技术创新及软件测试发展需求,构建面向服务、大数据及应用、软硬件一体化测试的技术框架,讨论基于服务模型的形式化描述及求解、服务实体及基于时间波动的服务实时性测试、大数
    孙志安等编著计算机43.9万字