PySpark大数据分析与应用最新章节全文无弹窗在线阅读-QQ阅读男频都市网

QQ阅读男生玄幻网

男生玄幻网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书以Python作为开发语言，系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出，理论叙述循序渐进、由浅入深。本书共7章，第1？5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库，内容介绍注重理论与实践相结合，通过典型示例强化PySpark在大数据分析中的实际应用；第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款风险分析两个完整的案例实战，结合前5章的PySpark编程知识，实现完整的大数据分析过程。本书大部分章包含实训和课后习题，读者通过练习和操作实践，能够巩固所学的内容。本书可作为高校数据科学或大数据相关专业的教材，也可作为机器学习爱好者的自学用书。

品牌：人邮图书

上架时间：2024-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

会员
商业分析思维与实践：用数据分析解决商业问题
本书本书基于业务问题，就如何搭建分析框架，厘清分析思路，按照标准分析步骤对数据进行怡当的预处理，选择合适的分析方法和分析模型，使用恰当的分析工具对数据进行分析，以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解，帮助业务专家做出合适的业务判断，制定准确的业务策略。
傅一行计算机13万字
会员
云数据中心基础
本教材共介绍7个项目，项目1为云数据中心认知，主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计，主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型，主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云
戴经国何丰王国滨郭炳宇姜善永计算机12.1万字
会员
Python数据分析与挖掘实战
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式，深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章，分为基础篇（第1～5章）和实战篇（第6～11章），基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识；实战篇包括6个案例，分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
翟世臣张良均主编计算机13.6万字
会员
网络科学与网络大数据结构挖掘
《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块：第一模块是基础理论，包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容，旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块，包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导，而是更为关注网络科学的思维习惯和研究方式，兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
刘伟计算机0字
会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求，在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础，内容包含：数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验，所编排的各个实验与第一篇中的各章（除第10、11章外）内容相对应，
赵明渊唐明伟主编计算机12万字
会员
大数据SQL优化：原理与实践
这是一本站在一线开发人员的视角，从SQL的本质出发，采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式，深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员，期望帮大家深度理解大数据SQL优化原理，掌握SQL优化的落地实践方法，从而真正“玩转”大数据SQL优化技术，根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
陈鹤杨国栋计算机14万字
会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇，第1篇是基础入门篇，主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础；第2篇是数据分析篇，主要介绍常用的数据分析方法；第3篇是数据挖掘篇，主要介绍常用的数据挖掘方法；第4篇是实战应用篇，介绍两个完整的数据分析与挖掘案例。
熊熙张雪莲编著计算机10.9万字
会员
数据要素五论：信息、权属、价值、安全、交易
本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发，汇聚不同学科背景的既有文献，整合现有观点，对数据要素的多维特性进行探讨，以丰富人们对数据要素的认知，凝聚共识，澄清数字时代的发展与治理迷思，为未来的相关创新提供起点。
张平文邱泽奇编著计算机14.5万字
会员
云计算服务保障体系
云计算是一种商业计算模型，它将计算任务分布在大量计算机构成的资源池上，使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同，云计算环境下，信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构，安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型；服务
林果园计算机9.5万字

同类书籍最近更新

会员
数据可视化分析：分析原理和Tableau、SQL实践（第2版）
本书以敏捷分析工具Tableau为基础，部分章节辅以SQL讲解，系统介绍了数据可视化分析的体系和方法，内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。本书以TableauDesktop的应用为中心，借工具讲解原理，以原理深化工具应用，并由点及面地介绍了业务分析的思考和原理，特别是提出了实践性的“业务—数据—分析”层次
喜乐君数据库32万字
会员
科研统计思维与方法：SPSS实战
本书以实际案例和具体应用为驱动，以培养科研统计思维为目标，借助SPSS，系统地讲授了差异显著性检验、方差分析、相关性分析、回归分析、聚类分析、主成分分析，以及结构方程模型的概念、原理和具体使用。全书共8章。第1章系统地讨论了科研统计思维及统计分析的相关概念，并以量化类典型论文为例抛出统计思维的核心问题。第2章介绍了数据的规范化及预处理，重点讲解了基于数据做论证所必需的前置操作。第3章介绍了统计描述
马秀麟数据库24.2万字
会员
数据湖仓
数据湖仓是一个现代化的开放式架构，拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发，通过对数据湖仓重要概念的剖析，对数据湖仓的相关知识进行深入浅出的讲解。全书共18章，对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨，同时展望数据架构的演化趋势，使读者能够领会数据湖仓的精髓，最终轻松、全面地管理数据湖仓项目。本书适合数据架构师、业务人员和系统开发人员，以及对数据
(美)比尔·恩门等数据库4.6万字
会员
推荐系统全链路设计：原理解读与业务实践
这是一本指导中高级从业者高质量落地现代推荐系统，围绕现代推荐系统核心技术展开深度解读的专业工具书，又是一套完整的推荐系统高质量落地解决方案。本书基于推荐算法工程师实际工作场景规划内容，融合了作者在阿里巴巴、58同城等多家大厂做推荐系统设计和优化的经验，是一本方法和实践兼具的好书。本书不针对零基础从业者，而是以帮助初级算法工程师向中高级进阶为目标。书中从底层剖析推荐系统在实际业务场景中可能出现的各种
唐楠烊数据库13.8万字
会员
信息学竞赛宝典：数据结构基础
数据结构是计算机存储、组织数据的方式，往往同高效的检索算法和索引技术有关。学习和掌握数据结构的相关知识，使我们能够更好地运用计算机来解决实际问题。为了提高读者的学习效率，本书直接从各类竞赛真题入手，以精练而准确的语言、全面细致地介绍了信息学竞赛中经常用到的数据结构类型，包括链表、堆栈、队列、树、图等。本书精挑细选、由浅入深地安排了相关习题。考虑读者接受水平的差异，一般在引入新知识点的题目时，本书会
张新华梁靖韵刘树明编著数据库9.7万字
会员
Kubernetes云原生数据管理
本书围绕Kubernetes云原生数据基础设施，介绍了如何通过Kubernetes管理数据存储，如何通过Helm和Operator在Kubernetes上自动部署和管理数据库，阐述了数据流式传输和数据分析的过程，探讨了在机器学习及其他新兴用例中如何使用Kubernetes云原生数据等。本书不仅深入阐述了云原生基础设施的发展历程和处理方式，而且分门别类地为每个场景提供了可以直接运行的示例代码，以便读
(美)Jeff Carpenter（杰夫·卡彭特）等数据库16.3万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 novel.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015