《数据科学面试通关》详细阐述了与数据科学面试相关的基本解决方案,主要包括探索现代数据科学领域、在数据科学领域寻找工作、Python编程、数据可视化与数据叙述、使用SQL查询数据库、Linux中的Shell和Bash脚本编写、使用Git进行版本控制、用概率和统计挖掘数据、理解特征工程和为建模准备数据、精通机器学习概念、用
本书主要向读者介绍基于互联网技术的数据分析原理与方法,帮助读者理解并掌握数据分析能力,可使用到实践中并提升工作能力。本书具体内容包括学数据分析有什么用,数据分析的基础方法,数据分析的起点,数据分析的基础,数据分析的准备;通过数据分析看清现实,通过数据分析抓住业务增长机会,通过数据分析发现异常、处理异常、防止异常,通过数
"全书共分11章,主要内容为:计算机控制系统的组成、分类、采用的技术和发展趋势;微控制器与总线技术;集散控制系统(DCS);计算机控制系统的硬件设计;计算机控制中的新兴技术及应用;常规和复杂控制技术;先进控制技术;计算机控制系统的软件设计、工业控制网络技术;计算机控制系统的电磁兼容与抗干扰设计;计算机控制系统设计实例。
"《MATLAB/Simulink控制系统仿真》介绍了MATLAB/Simulink的主要功能及其在控制理论中的应用。全书共分17章,第1~4章介绍了MATLAB的程序设计、常用功能及其相关函数,Simulink的操作方法,控制系统的基本概念与控制系统仿真的基本原理,重点叙述了仿真中常用的M函数和S函数在Simulin
本书主要内容包括数据仓库(基于Python)、关联分析、分类分析和聚类分析(基于SPSS),以及对应的应用实例,整体分为理论讲解和案例应用两部分。本书的理论讲解更加全面、通俗易懂,且配有一定体量的图形讲解,使学生更易于接受。
本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用Spark生态系统进行大数据离线分析和实时分析的方法。全书共7章,分别讲解了项目需求、项目架构、项目实现流程、大数据集群环境搭建、热门品类Top10分析、各区域热门商品Top3分析、网站转化率统计、广告点击流实时统计和使用FineBI实现数据可视化。本书附有
本书内容分七大模块:大数据概述、开发环境搭建、大数据采集(爬取)、大数据分析、数据建模与数据挖掘、数据可视化以及大数据分析挖掘综合案例。开发环境采用Python语言环境,详细讲解爬虫技术原理、python爬虫第三方库、scrapy爬虫框架等。大数据分析部分讲解Numpy和Pandas。数据建模与数据挖掘模块讲解相关性与
数据治理与认知安全在推动国家发展、保障国家安全、维护社会稳定和促进经济高质量发展等方面具有不可替代的重要作用。本书覆盖数据治理与认知安全两部分内容。数据治理包含数据治理体系、数据处理方法和数据合规审计三方面内容,主要关注数据的采集、清洗、集成、标注、增强和分析等规范化的管理过程,确保数据在整个生命周期中保持高质量、一致
本书共8章,分别讲解了Spark基础知识、Spark部署、SparkRDD、SparkSQL、SparkStreaming、Kafka、StructuredStreaming和SparkMLlib,并在最后完整开发了一个在线教育学生学习情况分析系统,帮助大家巩固前面所学的内容。
本书内容主要分为四部分,前7章为第1部分,描述如何质疑、审查证据,如何收集、分析并处理缺失数据,避免数据操控等。第2部分为第8-11章,讨论数据呈现中的问题并通过创新方法取得研究新发现。第3部分为第12-17章,聚焦教育领域,再次利用证据证明了发现似实谬误之易,第4部分为结论。
平台介绍|荣誉资质|联系我们|出版社登陆