Python 3 爬虫、数据清洗与可视化实战(第2版)在线阅读
会员

Python 3 爬虫、数据清洗与可视化实战(第2版)

零一
开会员,本书免费读 >

教材教辅研究生/本科/专科教材4.3万字

更新时间:2020-08-06 15:42:22 最新章节:专业服务

立即阅读
加书架
下载
听书

书籍简介

本书是一本通过实战教初学者学习爬取数据、清洗和组织数据进行分析和可视化的Python读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。本书共13章,包括6个核心主题,其一是Python基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、爬虫效率优化、无线端的数据采集、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识,以及pandas数据的读写、分组、变形,缺失值、异常值和重复值处理,时序数据处理和正则表达式的使用等;其五是综合应用实例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括matplotlib和pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图等图形,帮助读者进入可视化的殿堂。本书以实战为主,适合Python初学者及高等院校相关专业的学生阅读,也适合Python培训机构作为实验教材。
上架时间:2020-07-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

零一
主页

同类热门书

最新上架

  • 会员
    本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
    肖睿 兰伟 廖春琼主编教材教辅8万字
  • 本书立足于财务管理领域的最新发展,结合当下新的财务管理环境,系统介绍了财务管理的基本原理。本书共分为13章,重点介绍了概论、财务管理的环境、财务管理基本观念、证券投资原理、财务分析原理、项目分析原理、筹资原理、营运资本管理原理、长期筹资、利润分配、财务预测与预算、财务控制与业绩评价和财务管理其他专题基本原理等核心内容。本书坚持经典和与时俱进相结合;既有经典案例,又更新了近三年的新案例,内容丰富翔实
    王明虎 章铁生主编教材教辅30.5万字
  • 大学生拥有丰富的专业知识和敢于拼搏的勇气,只是苦于没有合理的职业规划,对自我认识不清晰,对职业世界一知半解,缺乏求职的技巧,因此不知道如何合理选择职业。本书为满足高校职业生涯规划课程的需要而编写,主要内容包括职业与职业生涯规划、知己知彼、生涯决策、制定职业生涯规划书、行动管理、心态调适、职业信息搜集、求职材料、求职面试、职业能力、职场礼仪、职业道德12个方面的内容。本书不仅可以作为大学生职业生涯规
    毋彩虹 岳军平 寇小妮主编教材教辅14.2万字
  • 本教材的编写旨在满足免疫学实验课教学及一般科学研究的需要。免疫学实验课程是各级医学院校需要开设的基础实验内容。但目前市面上的相关书籍主要针对高级科研工作者使用,实验内容或复杂,或昂贵,与临床联系不紧密,不适合初级学习者及大面积的本科生教学使用。因此,我们结合自身的教学实践,编写了本教程,所选实验难度适中,既可作为教学使用,也能够满足一般研究需求。在内容的组织上,与理论课紧密契合,与临床实践联系紧密
    周晓勃 史霖主编教材教辅5.7万字
  • 本书系统地阐述了融媒体图片制作实战、融媒体视频制作实战、融媒体可视化交互作品制作实战、融媒体聚合与发布实战四大模块内容,包括公众号图片、电商图片制、短视频制作、片头动画制作、交互游戏制作、交互宣传片制作等基本技能,同时融入AI人工智能绘图、视频处理等新技术,全面讲解融媒体内容制作、平台发布实用技能,紧跟行业发展,充分满足院校教学需求。本书不仅可以作为高等职业院校新闻传播大类中融媒体技术与运营、网络
    曾晨曦 陈静主编教材教辅8.5万字
  • 会员
    本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言
    米洪 张鸰主编教材教辅6.2万字
  • 会员
    本书共分为三篇八章,每一篇章都涵盖了商业伦理与企业社会责任的不同方面,旨在为读者提供全面的理论和实践指导。第一篇是商业伦理与企业社会责任概述,其中,第1章主要是引领读者进入商业伦理与社会责任的世界,介绍了相关的概念和重要性,帮助读者建立一个全面的认知框架。第2章探讨相关理论和基础知识,为读者提供了深入了解商业伦理与企业社会责任的基础。第二篇聚焦于社会责任战略与伦理型组织变革,其中,第3章主要讨论社
    徐月华编著教材教辅10.6万字
  • 全套教材共包括五个系列:科研公共学科主要围绕研究生科研中所需要的基本理论知识,以及从最初的科研设计到最终的论文发表的各个环节可能遇到的问题展开;实验技术与统计软件系列介绍了SAS统计软件、SPSS统计软件、分子生物学实验技术、免疫学实验技术等常用的统计软件以及实验技术;基础前沿与进展系列主要包括了基础学科中进展相对活跃的学科;临床基础与辅助学科系列包括了临床型研究生所需要进一步加强的相关学科内容;
    刘玉琴主编教材教辅34.3万字
  • 会员
    本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、
    曾国荪 曹洁编著教材教辅9.7万字

同类书籍最近更新

  • 会员
    本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言
    米洪 张鸰主编高教教材6.2万字
  • 会员
    本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
    肖睿 兰伟 廖春琼主编高教教材8万字