Python网络爬虫:从入门到精通在线阅读

Python网络爬虫:从入门到精通

吕云翔主编
开会员,本书8折购 >

教材教辅研究生/本科/专科教材11.2万字

更新时间:2023-10-25 19:34:57 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

吕云翔主编
主页

同类热门书

最新上架

  • 全套教材共包括五个系列:科研公共学科主要围绕研究生科研中所需要的基本理论知识,以及从最初的科研设计到最终的论文发表的各个环节可能遇到的问题展开;实验技术与统计软件系列介绍了SAS统计软件、SPSS统计软件、分子生物学实验技术、免疫学实验技术等常用的统计软件以及实验技术;基础前沿与进展系列主要包括了基础学科中进展相对活跃的学科;临床基础与辅助学科系列包括了临床型研究生所需要进一步加强的相关学科内容;
    刘玉琴主编教材教辅34.3万字
  • 本书严格遵循高等教育出版社出版的全国统编教材《中国近现代史纲要(2023版)》的基本观点,并努力借鉴、学习、包容、吸收了学术界最新观点和前人的研究成果。在体例上以专题内容呈现。每个专题由理论知识模块、实践教学模块、自主学习模块、训练考查模块构成。在内容上,本书以教材为依据,适当增加历史资料,并借鉴了历史学界的最新研究成果。希望本书能对进一步推动思想政治理论课的针对性、实效性起到积极作用,有助于学生
    陈园园 张岩竹 迟青峰主编教材教辅22.1万字
  • 本书系统介绍了儿童作业治疗的基础理论、评估方法、干预技术和临床应用,旨在为康复治疗学专业学生、康复治疗师尤其是儿童作业治疗师提供全面、系统的指导。
    姜志梅主编教材教辅22.8万字
  • 会员
    本教材主要介绍了现代教育技术的基本概念和科学理论,以及其在数字化学习环境的制作过程中必需的处理与加工方法。全书共分为四章,第一章为教育技术的基本理论,主要包括教育技术的形成与发展、基本概念、教育技术的应用;第二章为教学媒体及环境,主要包括常规教学媒体和线上信息工具的使用;第三章为信息化教学设计及案例,主要包括教学设计的基本概念、应用以及典型的教学设计模式和案例;第四章为计算机辅助教育,主要包括计算
    田密娟主编教材教辅10.3万字
  • 会员
    如今的组织管理中,四个最基本的关系:个人与目标的关系、个人与组织的关系、组织与环境的关系以及组织与变化的关系,都完全改变了。随之而来的新范式必然也将逐渐融入组织行为学的经典框架,本教材不仅强调对基本概念和理论的准确把握,更突出对环境的分析,以及新环境影响下的组织行为、组织学习、组织网络的创新和价值。组织管理的核心价值,需要回归到组织赋能与激活人,以响应“现实”组织的特征。本教材不仅融入了大量实际案
    陈春花 曹洲涛 宋一晓 苏涛编著教材教辅38.3万字
  • 本教材的编写旨在满足免疫学实验课教学及一般科学研究的需要。免疫学实验课程是各级医学院校需要开设的基础实验内容。但目前市面上的相关书籍主要针对高级科研工作者使用,实验内容或复杂,或昂贵,与临床联系不紧密,不适合初级学习者及大面积的本科生教学使用。因此,我们结合自身的教学实践,编写了本教程,所选实验难度适中,既可作为教学使用,也能够满足一般研究需求。在内容的组织上,与理论课紧密契合,与临床实践联系紧密
    周晓勃 史霖主编教材教辅5.7万字
  • 会员
    本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL
    王雪松 张良均主编教材教辅8.1万字
  • 本书依据教育部《高校“形势与政策”课教学要点》的有关精神,采用专题式的编写方法,把具有相对稳定性、基础性的知识框架与当前不断变化的形势结合起来编写了9个专题,全面介绍了党的二十大以来我国在经济、政治、社会等领域取得的辉煌成就。每个专题各有侧重,列举事实,阐述道理,辩证、发展地看待前进路上遇到的各种风险挑战,努力体现前沿性,在相关问题的解读和分析上下工夫,在写作风格上尽可能生动通俗,便于大学生阅读把
    王可 汪晓莺主编教材教辅25.1万字
  • 本书全面介绍新媒体运营技术与应用的内容。第1章为新媒体运营技术与应用概述,包括新媒体运营的价值、新媒体运营中的工具、新媒体运营岗位与工具学习建议等;第2章重点介绍新媒体文字处理技术,通过对快速输入、抓取文字及多人同步文字处理工具的介绍,引导读者全面了解文字处理工具的价值及用法;第3章重点介绍新媒体图片设计技术与应用,包括找到高质量的图片、快速制作封面、快速设计创意九宫格图及动图、借助AI技术制作图
    刘绍君 勾俊伟主编教材教辅6.3万字