精通Python网络爬虫:核心技术、框架与项目实战在线阅读
会员

精通Python网络爬虫:核心技术、框架与项目实战

韦玮
开会员,本书免费读 >

计算机网络软件工程及软件方法学13.4万字

更新时间:2019-01-05 03:23:26 最新章节:20.5 小结

立即阅读
加书架
下载
听书

书籍简介

随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫。在大数据时代,聚焦网络爬虫的应用需求越来越大。本书从系统化的视角,为那些想学习Python网络爬虫或者正在研究Python网络爬虫的朋友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并掌握了本书的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python网络爬虫工程师相关岗位的工作。
品牌:机械工业出版社
上架时间:2017-03-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

韦玮
主页
  • 会员
    本书较为全面地介绍了Python编程相关的知识。全书共14章,包括Python开发环境搭建与入门、语法基础、运算符与表达式、控制流、函数、模块、数据结构、常见算法实例、面向对象程序设计、异常处理、文件操作、标准库与其他应用、远程操控计算机项目、腾讯动漫爬虫项目等内容。
    韦玮程序设计13.5万字

同类热门书

最新上架

  • 会员
    本书介绍了建筑运维智慧管控平台的方案设计、管控内容、数据结构、软件设计与界面实现,顺应了云计算、物联网、大数据等新兴技术快速发展并被应用的形势,是建筑运维管控的一种全新设计和尝试。内容包括建筑智慧运维管控方案设计、环境监控、建筑设备监控、能源资源管理、住区管控等。
    汪明 谢浩田 逯广浩 孙鸿昌计算机8.7万字
  • 会员
    本书共7章,其中第1章讲解电子竞技市场现状;第2章讲解制作游戏的选题立意;第3章讲解游戏核心机制设计;第4章讲解技能设计法则;第5章讲解地图设计原理;第6章分析如何设计游戏系统;第7章阐述游戏交互设计相关知识。
    程弢编著计算机11.8万字
  • 会员
    开源软件供应链是指开源软件在开发和运行过程中涉及的所有开源软件的上游社区、源码包、二进制包、第三方组件分发市场、应用软件分发市场,以及开发者和维护者、社区、基金会等,按照依赖、组合等形成的供应关系网络。相较于传统软件供应链,开源软件供应链随着供应层级不断加深,其规模不断扩大,导致针对上游的攻击将更难被发现、影响范围更广。本书从开源软件供应链的定义开始,逐步讲解开源供应链模型、开源供应链评估体系、关
    武延军 梁冠宇 吴敬征 屈晟 赵琛编著计算机14.5万字
  • 会员
    本书通过10位杰出实践者的贡献,分享了关键的软件架构指标,帮助你设定正确的关键绩效指标并衡量结果。软件架构指标是软件项目的可维护性和架构质量的关键,它们可以在项目早期向你发出警告,提醒你注意架构和技术债务的积累。本书不是一本关于理论的书。它更多的是关于实践,关于已经尝试过并行之有效的方法。本书面向渴望探索成功案例的软件架构师和软件开发人员,旨在帮助读者进一步了解决策和测量的有效性。
    (意)克里斯蒂安·西塞里 (英)戴夫·法利 (美)尼尔·福特 (英)安德鲁·哈默尔-劳 (美)迈克尔·基林 (德)卡罗拉·利林塔尔 (葡)若昂·罗萨 (德)亚历山大·冯·齐泽维茨 (奥)雷内· 韦斯 (英)约恩·伍兹计算机11万字
  • 会员
    本书共分为10章,第1章是总体介绍;第2至5章主要介绍边缘计算涉及的基础设施层面的知识和技术,包括硬件、存储、通信和安全几个方面;第6至9章主要介绍边缘计算架构和应用层面的知识和技术,包括微服务、数据处理、工业物联网和机器学习几个方面;第10章介绍了三个典型的边缘计算开源框架。
    杨剑 李长乐计算机22.5万字
  • 会员
    本书共分十六章,包括:SPSS基本操作部分,介绍了SPSS概述、数据文件的建立与操作。SPSS统计分析部分,介绍了基本统计分析功能、均值比较与检验、方差分析、相关分析、回归分析、非参数检验、聚类分析与判别分析、因子分析与主成分分析、生存分析、信度分析等统计分析过程;SPSS图形功能部分,不仅介绍了基本统计图和交互图相关内容,还介绍了SPSS的主题图功能;SPSS实例部分,设计了场景式教学。
    高晶 章昊 曹福凯编著计算机25.3万字
  • 会员
    这是一本从实践角度深入探讨如何利用大语言模型提升软件交付全生命周期效率与效能的实战性著作。全面细致地讲解了研发和运维人员需要掌握的大语言模型及其相关技术的原理,重点讲解了如何借助大模型实现DevOps、SRE、平台工程三大领域的智能化实践,覆盖开发、测试、运维、监控、安全、项目管理等软件开发全流程和全场景,通过丰富的实例展示了其在实际工作场景中的具体应用。本书的独特之处在于它不仅涵盖了基础理论知识
    顾黄亮 郑清正 牛晓玲 车昕计算机16.6万字
  • 会员
    作者凭借在全球不同国家和行业内的多年实践经验,从战略规划、技术选型、架构设计到人力资源管理、团队建设和流程优化等多个维度,为企业的现代化改造提供了全面的指导。本书讨论了通过引入沃德利地图、事件风暴、产品分类、领域划分、团队拓扑、松耦合软件架构、内部开发者平台、数据网格、现代化战略、学习与提升技能来加快企业的产品创新和服务优化,同时有效地管理变革,减少风险。本书适合技术领导者、技术人员、产品负责人等
    (美)尼克·图恩 (法)让-乔治斯·佩兰计算机30.2万字
  • 会员
    本书将以一款开放世界类游戏的实践过程为主线,为读者呈现从零开始上线一款游戏的实践路线、游戏引擎Unity的开发模式,以及游戏开发的核心框架。本书共分为3篇,第1篇是场景搭建篇,第2篇是脚本开发篇,第3篇是发布上线篇。第1篇包含第1章和第2章,主要介绍在Unity中如何创建一个游戏项目,如何搭建一款游戏的场景和界面。第2篇包含第3章到第5章,主要介绍一款游戏的核心模块,即游戏控制、角色动画和核心玩法
    王杰编著计算机8.2万字

同类书籍最近更新

  • 会员
    本书将带你了解成为一名成功的解决方案架构师所需要了解的基本概念、设计原则和模式、架构考量以及相关的新技术。本书是一部深度解读并实践解决方案架构师这一角色的综合性指南。书中不仅详细介绍了设计支柱、高级设计模式、反模式以及现代软件设计的云原生方面的知识,还阐述了解决方案架构师在不同层次的任务和责任——从技术架构设计的基本原则到实际项目中的难点突破,再到面对新兴技术挑战时的应对手段,都有着详尽而实用的解
    (印)所罗伯·斯里瓦斯塔瓦 (印)内拉贾利·斯里瓦斯塔夫软件工程29.3万字
  • 会员
    开源软件供应链是指开源软件在开发和运行过程中涉及的所有开源软件的上游社区、源码包、二进制包、第三方组件分发市场、应用软件分发市场,以及开发者和维护者、社区、基金会等,按照依赖、组合等形成的供应关系网络。相较于传统软件供应链,开源软件供应链随着供应层级不断加深,其规模不断扩大,导致针对上游的攻击将更难被发现、影响范围更广。本书从开源软件供应链的定义开始,逐步讲解开源供应链模型、开源供应链评估体系、关
    武延军 梁冠宇 吴敬征 屈晟 赵琛编著软件工程14.5万字