工业和信息化人才培养规划教材:云计算与大数据技术.pdf

工业和信息化人才培养规划教材:云计算与大数据技术.pdf
 

书籍描述

内容简介
  本书全面介绍了云计算与大数据的基础知识、主要技术、基于集群技术的资源整合型云计算技术和基于虚拟化技术的资源切分型云计算技术。全书共10章,主要内容包括云计算与大数据概述、相关技术、虚拟化技术、集群系统基础、MPI、Hadoop、HPCC、Storm、数据中心技术和云计算大数据仿真技术。本书注重实用,实验丰富,将实验内容融合在课程内容中,使理论紧密联系实际。
  本书可作为高等院校云计算、大数据相关课程的教材,也可作为相关技术人员的参考用书。

编辑推荐
《工业和信息化人才培养规划教材:云计算与大数据技术》可作为高等院校云计算、大数据相关课程的教材,也可作为相关技术人员的参考用书。

目录
第1章 云计算与大数据基础
1.1 云计算技术概述
1.1.1 云计算简介
1.1.2 云计算的特点
1.1.3 云计算技术分类
1.2 大数据技术概述
1.2.1 大数据简介
1.2.2 主要的大数据处理系统
1.2.3 大数据处理的基本流程
1.3 云计算与大数据的发展
练习题
第2章 云计算与大数据的相关技术
2.1 云计算与大数据
2.2 云计算与物联网
2.3 一致性哈希算法
2.3.1 一致性哈希算法的基本原理
2.3.2 一致性哈希算法中计算和存储位置的一致性
2.4 非关系型数据库
2.4.1 从关系型数据库到非关系型数据库
2.4.2 非关系型数据库的定义
2.4.3 非关系型数据库的分类
2.5 集群高速通信标准InfiniBand
2.6 云计算大数据集群的自组织特性
练习题
第3章 虚拟化技术
3.1 虚拟化技术简介
3.1.1 虚拟化技术的发展
3.1.2 虚拟化的描述
3.1.3 虚拟化技术的优势和劣势
3.1.4 虚拟化技术的分类
3.2 常见虚拟化软件
3.2.1 VirtualBox
3.2.2 VMware Workstation
3.2.3 KVM 39
3.3 系统虚拟化
3.3.1 服务器虚拟化
3.3.2 桌面虚拟化
3.3.3 网络虚拟化
3.4 使用KVM构建虚拟机群
练习题
第4章 集群系统基础
4.1 集群系统的基本概念
4.2 集群系统的分类
4.3 单一系统映射
4.4 Beowulf集群
4.5 集群文件系统
4.5.1 集群文件系统概念
4.5.2 典型的集群文件系统Lustre
4.6 分布式系统中计算和数据的协作机制
4.6.1 基于计算切分的分布式计算
4.6.2 基于计算和数据切分的混合型分布式计算技术——网格计算
4.6.3 基于数据切分的分布式计算技术
4.6.4 三种分布式系统的分析对比
练习题
第5章 MPI——面向计算的高性能集群技术
5.1 什么是MPI
5.2 MPI的架构和特点
5.3 MPICH并行环境的建立
5.3.1 配置前的准备工作
5.3.2 挂载NFS
5.3.3 配置ssh实现MPI节点间用户的无密码访问
5.3.4 安装MPICH
5.3.5 建立并行计算环境时的注意事项
5.4 MPI分布式程序设计基础
5.4.1 最简单的并行程序
5.4.2 获取进程标志和机器名
5.4.3 有消息传递功能的并行程序
5.4.4 Monte Carlo法在并行程序设计中的应用
5.4.5 并行计算中节点间的Reduce操作
5.4.6 用MPI的6个基本函数实现Reduce函数功能
5.4.7 设计MPI并行程序时的注意事项
练习题
第6章 Hadoop——分布式大数据系统
6.1 Hadoop概述
6.2 HDFS
6.2.1 HDFS文件系统的原型GFS
6.2.2 HDFS文件的基本结构
6.2.3 HDFS的存储过程
6.3 MapReduce编程框架
6.3.1 MapReduce的发展历史
6.3.2 MapReduce的基本工作过程
6.3.3 LISP中的MapReduce
6.3.4 MapReduce的特点
6.4 实现Map/Reduce的C语言实例
6.5 建立Hadoop开发环境
6.5.1 相关准备工作
6.5.2 JDK的安装配置
6.5.3 下载、解压Hadoop,配置Hadoop环境变量
6.5.4 修改Hadoop配置文件
6.5.5 将配置好的Hadoop文件复制到其他节点
6.5.6 启动、停止Hadoop
6.5.7 在Hadoop系统上运行测试程序WordCount
练习题
第7章 HPCC——面向数据的高性能计算集群系统
7.1 HPCC简介
7.2 HPCC的系统架构
7.3 HPCC平台数据检索任务的执行过程
7.4 HPCC的安装部署
7.5 数据的加载、切分和分发
7.6 ECL语言基础知识
7.6.1 ECL语言的保留关键字
7.6.2 ECL语言的记录定义和操作
7.6.3 ECL语言集成开发环境
7.7 ECL语言编程实例
7.7.1 声明数据文件中的记录结构
7.7.2 读取数据文件生成数据集
7.7.3 统计记录条数
7.7.4 将数据集中的小写字母改为大写
7.7.5 建立索引实现对数据集的检索
7.7.6 发布数据
7.7.7 HPCC中的WordCount操作
练习题
第8章 Storm——基于拓扑的流数据实时计算系统
8.1 Storm简介
8.2 Storm原理及其体系结构
8.2.1 Storm编程模型原理
8.2.2 Storm体系结构
8.3 搭建Storm开发环境
8.3.1 Storm的安装步骤
8.3.2 Storm 的设置
8.3.3 Storm 的启动
8.4 Storm使用实例
8.4.1 使用Maven管理storm—starter
8.4.2 WordCountTopology实例分析
练习题
第9章 服务器与数据中心
9.1 数据中心的发展历史
9.2 数据中心的基本单元——服务器
9.3 数据中心选址
9.4 数据中心的能耗
练习题
第10章 云计算大数据仿真技术
10.1 用参数定义物理设备进行仿真
10.2 云计算仿真系统——CloudSim
10.2.1 CloudSim基础
10.2.2 CloudSim体系结构
10.2.3 CloudSim的使用模型场景
10.2.4 CloudSim使用实例
10.3 云计算系统相空间模型
练习题
参考文献

文摘
版权页:



我们在开发调试程序的时候经常通过打印语句的方式来呈现结果,这种方式非常灵活、方便,但只有熟悉程序的人才能很好地理解打印结果。
使用可视化技术,可以将处理的结果通过图形的方式直观地呈现给用户,标签云(T ag Cloud)、历史流(History Flow)、空间信息流(Spatial Information Flow)等是常用的可视化技术,用户可以根据自己的需求灵活地使用这些可视化技术;人机交互技术可以引导用户对数据进行逐步的分析,使用户参与到数据分析的过程中,使用户可以深刻地理解数据分析结果。
1.3云计算与大数据的发展
1.云计算与大数据发展历程
很多人认为云计算是在近些年才被提出来的,其实早在1958年,人工智能之父John McCarthy发明了函数式语言LISP,LISP语言后来成为MapReduce的思想来源。1960年John McCarthy预言“今后计算机将会作为公共设施提供给公众”,这一概念与我们现在所定义的云计算已非常相似,但当时的技术条件决定了这一设想只是一种对未来技术发展的预言。云计算在技术发展到一定阶段后才能真正出现。一般认为云计算是网络技术发展到一定阶段后必然出现的新的技术体系和产业模式。很难想象在1986年中国第一封E—mail发出去时560bps的网速条件下能出现云计算这样的技术变革。1984年SUN公司提出“网络就是计算机”这一具有云计算特征的论点,2006年Google公司CEO Eric Schmidt提出云计算概念,2008年云计算概念全面进入中国,2009年中国首届云计算大会召开,此后云计算技术和产品迅速地发展起来。

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多