
会员
Python网络爬虫与数据分析从入门到实践
更新时间:2024-12-28 12:00:59 最新章节:13.4 动手练习
书籍简介
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理、文本向量化技术,以及机器学习算法在数据分析中的应用。书中还给出了大量案例和项目,可以帮助读者快速上手,提高实用技能。《Python网络爬虫与数据分析从入门到实践》内容丰富,注重实操,适用于网络爬虫岗位、数据分析岗位的初级工程师和各类工程技术人员,还可作为高校经济、管理、人文社科、大数据等专业的教学用书。
品牌:清华大学
上架时间:2023-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
马国俊
最新上架
- 会员本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编计算机10.6万字
- 会员本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。计算机11.2万字
- 会员本书详细讲解JavaEE中Spring、SpringMVC和MyBatis三大框架(以下简称SSM)的基本知识和应用。本书在对知识点进行描述时采用了大量案例,以便读者理解SSM的核心技术。本书共15章,第1~5章主要讲解MyBatis的相关知识,包括初识MyBatis框架、MyBatis的核心配置、动态SQL、MyBatis的关联映射和缓存机制,以及MyBatis的注解开发;第6~9章主要讲解计算机15.8万字
- 会员本书在《C语言程序设计案例式教程》的基础上进行了完善、补充和修订,内容更加丰富、翔实,结构层次更加清晰、合理。本书共11章,第1章主要介绍C语言概述、C语言开发环境的搭建和C语言程序的编译机制等;第2章和第3章主要介绍C语言的基础知识,包括关键字、标识符、常量、变量、数据类型、类型转换、运算符与表达式等;第4~9章主要介绍C语言的核心知识,包括结构化程序设计、数组、函数、指针、字符串、结构体等;第计算机16.3万字
- 会员本书分为9篇,共35章。第1篇主要介绍基本配置;第2篇主要介绍用户及权限管理;第3篇主要介绍网络相关配置;第4篇主要介绍存储管理;第5篇主要介绍系统管理;第6篇主要介绍软件管理;第7篇主要介绍安全管理;第8篇主要介绍容器管理;第9篇主要介绍自动化管理工具ansible的使用。计算机12.4万字
- 会员本书是网页特效设计任务驱动式教材。本书将网页特效分为9类,分别是基本网页特效、日期时间类网页特效、文字类网页特效、图片类网页特效、表单控件类网页特效、导航菜单类网页特效、选项卡类网页特效、内容展开与折叠类网页特效和页面类网页特效,同时相应地将全书分为9个教学单元,每个教学单元分析和设计一种类型的网页特效,将JavaScript和jQuery的相关知识合理地安排到各个教学单元中。计算机7.4万字
- 会员本书从分布式系统的基础概念讲起,随后介绍分布式系统中间件SpringCloudAlibaba进阶实战,重点介绍了使用SpringCloudAlibaba框架整合各种分布式组件的完整过程。计算机3.1万字
同类书籍最近更新
- 会员本书的程序案例采用广泛流行的PHP、MySQL、XML、CSS、JS、HTML5等程序开发语言及数据库实现。将案例和相关知识点融合,所有案例均在书中给出了核心实现代码并进行了讲解。初学者可以在了解PHP和MySQL语法之后,从头至尾地学习,对于其中难以理解的部分可以查阅相关资料,部分功能的开发还需要读者具有一定的JS、CSS等知识。有经验的微信公众平台开发人员可以根据自己的需要,直接切入相应章节程序设计16.5万字
- 会员本书采用常用技术与真实案例相结合的讲解方式,深入浅出地介绍了Python机器学习应用的主要内容。全书共8章,内容包括Python概述、NumPy数值计算、pandas基础、pandas进阶、Matplotlib绘图、scikit-learn、餐饮企业综合分析与预测、通信运营商客户流失分析与预测。前6章设置了选择题、填空题和操作题,后两章设置了操作题,希望通过练习和操作实践,读者可以巩固所学的内容。程序设计7.4万字
- 会员本书从初学者的角度出发,详细介绍了JavaWeb开发需要掌握的相关技术。全书分4个部分,共17章,由浅入深地介绍了HTTP、Tomcat、Servlet、Maven、数据库基础知识、JDBC、MyBatis、JSP、框架原理、如何设计自己的框架,以及在线购书商城、个人云文件系统、论坛、个人博客项目开发的完整过程。本书理论联系实际,不但能让读者全面掌握JavaWeb开发基本技术,而且能让读者开发程序设计8.5万字
- 会员本书作者李骏作为多点生活的资深前端架构师,曾就职于阿里、腾讯等知名互联网公司,具有顶尖的前端技术能力和丰富的实战经验,在第一时间便投入到微信小程序的实践中。本书可分为3部分,第一部分作为基础章节,介绍了第一个小程序的搭建流程,让大家能快速上手;同时对小程序框架原理进行了详细介绍,为后面学习组件、API打下基础。第二部分对小程序组件、API进行介绍,对组件、API的使用、注意事项进行详细讲解,并给出程序设计10.7万字
- 会员《运维前线:一线运维专家的运维方法、技巧与实践》(以下简称《运维前线》)是前线系列的一个子集,前线系列图书的出版理念是邀请多位业界专家,总结所在行业的最新理念或深度实践经验。前线系列图书不同于市面上的很多图书,这类书并不系统,有的只是一线专家的实战经验,人们常称之为“干货”。一篇文章、一家公司、一个案例、一个场景,独立成篇,在满足碎片化阅读的同时,也能让读者进行横向比较和深入思考。本系列图书不强调程序设计19.3万字