
Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔主编
- 会员本书结合了Python3.6的新特性,完全为零基础的初学者量身定做。书中例举大量实例,介绍了Python的基本语法、编码规范和一些编程思想。本书第1~8章为Python语言基础,主要介绍Python的基本用法;第9章为一个实战,帮助读者理解前8章的知识;第10~17章为Python的进阶使用,包含面向对象编程、函数式编程入门、文件读写、异常处理、模块和包几个部分;第18章为第2个实战,帮助读者融高教教材8.4万字
同类热门书
最新上架
- 会员本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言教材教辅6.2万字
- 会员本书对人体的运动系统、内脏学、脉管学、感官系统、神经系统和内分泌系统等多个系统展开讲解,阐述各系统的组成,器官的位置、形态和结构,以及各系统之间的联系,简述各器官和系统的主要功能。本书强调基本理论、基本知识和基本技能的学习,确保理论体系完整、知识点阐述完备。本书正文为英文,在其基础上以中文标注解剖学用语。与一般同类教材相比,本书全书字数较为精简,使用更为真实形象的标本图等彩色图片而不是线条图或上色教材教辅4.4万字
- 会员Spark?SQL是Spark用于处理结构化数据的一个模块。本书共8章内容,由浅入深地讲解Spark?SQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。通过本书的学习,读者能够掌握Spark?SQL核心技术。本书每章安排了习题和总结,以便使读者能更好地学习和更牢固地掌握Spark?SQL编程方法。此外,本书还提供了PPT教学课件、源代码等配套资源,供使用本书的读教材教辅7.1万字
- 会员本书以中华传统文化在商业实践中的影响、传承、融合与光大为主线,系统阐述了伴随商业活动成长起来的中华商业文化的内涵和外延,分析了其对经济发展和社会进步的影响和推动作用。在数智化时代背景下,本书力求将传统与现代商业文化兼收并蓄,取中外商业思想之精华,将以人为本的商业情怀融入其中,倡导合作共赢、和谐发展,并展现新时代社会主义奋斗者的精神风貌。本书共8章,包括商业文化概论、中华商业文化的演变与觉醒、中华传教材教辅13.1万字
- 会员乡土是永远的文化母题,中国的20世纪则更是土地问题的世纪。作为学术专题,本书以“20世纪中国乡土文学”为研究对象,纵横结合,点面兼顾,较为系统地梳理、探究了“乡土文学”自身本质特征问题,乡土小说、乡土诗、乡土散文、乡土戏剧与影视等本体问题,20世纪中国乡土文学的精神脉络、典型实证、文本风格、地域文化影响、艺术表现成就等实际创作问题。作为课程教材,本书是中国现代文学史必修课程的有效拓展与合理延伸,是教材教辅22.9万字