本书以Spark大数据分析的常用技术与真实项目相结合的方式,深入浅出地介绍Spark大数据分析的重要内容。全书共8个项目,内容包括广告流量检测违规识别流程分析、Spark大数据环境安装搭建、基于Hive实现广告流量检测数据存储、基于SparkSQL实现广告流量检测数据探索分析、基于SparkSQL实现广告流量检测数据预
本书按照大数据分析流程,以电商产品数据为例,由浅入深地讲解大数据分析的核心开发技术,以及大数据分析工具及其组件的作用和使用方法。本书内容系统、全面,可帮助读者快速掌握大数据分析技术。本书介绍了大数据分析的概念、应用场景、分析指标、分析工具、分析组件、分布式存储、分布式处理、数据离线分析、数据实时分析、数据挖掘,以及数据
本书按照大数据采集与预处理的实现流程,由浅入深地讲解大数据采集与预处理的相关技术,以及如何使用不同方式对大数据进行采集与预处理。本书内容系统、全面,可帮助开发人员快速实现大量数据的采集。本书主要内容包括大数据采集与预处理简介、PyCharm的安装与使用、Urllib库数据采集、Requests库数据采集、XPath和B
本书围绕数据分析的基本概念与常用方法,提供一套适用于初学者快速入门的实践教材。本书中以医学数据为例,围绕实际应用场景中最常见的五种数据形式:统计数据、文本数据、时序数据、图像数据以及健康数据,从基本概念、初步探索到综合应用的全流程系统示范教学。本书共计五个章节,分别为:统计数据分析、文本数据分析、时序数据分析、图像数据
本书系统介绍了大数据的相关知识,全书共13章,内容包括Hadoop大数据处理架构、HDFS分布式文件系统、YARN资源管理、MapReduce分布式计算框架、HBase分布式数据库、流数据采集、典型非关系数据库的安装与使用、分布式数据分析工具Pig、Spark大数据处理框架、基于Python的SparkRDD编程、基于
本书对第1版做了修订,紧跟传统分布式计算、云计算与大数据相关领域的新技术,以应用需求为背景讲解相关技术原理和应用方法,主要内容包括:传统分布式计算的基本原理和编程开发技术,云计算的原理和关键技术、主流云计算平台和编程开发方法,云原生技术、云计算安全技术与标准及云存储技术,大数据的分析处理关键技术、计算模式和编程技术、平
教材首先介绍Z变换以及如何采用Z变换建立广义对象的Z传递函数,然后建立计算机控制系统的开环及闭环传递函数并分析系统的控制性能指标。在分析的基础上,讲述两种控制算法的设计方法:(1)间接设计法(PID控制、史密斯预估法);(2)直接设计法(最小拍无纹波设计、大林算法)。简要介绍离散系统状态空间分析与设计方法。以工程实践的
本书介绍了大数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。最后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解
本教材是计算机类专业的专业必修课教材和教育公共必修课教材。大数据涉及知识面广,应用场景多种多样,需要培养大数据思维,继而才能运用大数据思维展开分析应用技术。这就需要学习者能够宏观构建大数据环境的认知,掌握大数据处理的流程和相关技术,继而在明确应用思路引导下融汇知识,才能进一步结合大数据应用场景展开研究和探索。但是,目前
在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统
平台介绍|荣誉资质|联系我们|出版社登陆