云计算基础-期末复习

发布于:2024-12-07 ⋅ 阅读:(32) ⋅ 点赞:(0)

第一章:云计算概论

一、云计算的定义与特征

1. 定义:

云计算是一种通过网络以按需、可扩展的方式获取计算资源和服务的模式。它将计算资源视为一种公用事业,用户可以根据需求动态获取和释放资源,而无需了解底层基础设施的细节。

2. 特征:

超大规模(Massive Scale): 云计算平台可以支持成千上万台服务器,处理海量数据和用户请求。
虚拟化(Virtualization): 通过虚拟化技术,将物理资源抽象为逻辑资源,提高资源利用率和灵活性。
高可靠性(High Reliability): 通过冗余、数据备份和容错机制,确保服务的连续性和数据的安全性。
通用性(General Purpose): 提供通用的计算和存储资源,适用于各种应用和业务需求。
高可扩展性(Scalability): 能够根据需求动态扩展或缩减资源规模,满足负载变化。
按需服务(On-Demand Service): 用户可以根据需要即时获取或释放资源,按实际使用量付费。
廉价性(Cost Effectiveness): 通过规模效应和资源共享,降低单用户的使用成本。

二、云计算的发展与挑战

1. 计算模式的演进:

大型机时代: 集中式计算,资源昂贵且封闭。
C/S架构: 客户端/服务器模式,提高了交互性,但扩展性有限。
集群计算: 多台服务器协同工作,提高了性能和可靠性。
P2P计算: 点对点网络,资源共享,但管理复杂。
网格计算: 异构资源的共享,适用于复杂计算。
云计算: 按需提供服务,具备高度的灵活性和可扩展性。

2. 挑战:

数据安全: 数据存储在云端,涉及隐私和安全问题,需要加密和访问控制。
标准化: 缺乏统一的标准,导致不同云服务之间的互操作性差。
可靠性: 需要确保服务的持续可用,防止单点故障。
法律和合规性: 数据跨国界传输时,涉及不同的法律法规。

三、云计算的SPI服务模型

SaaS(软件即服务): 通过互联网直接提供软件应用,用户无需安装或维护。例如:Google Docs。
PaaS(平台即服务): 提供开发和部署平台,开发者可以在平台上创建应用程序。例如:Google App Engine。
IaaS(基础设施即服务): 提供基础计算资源,如虚拟机、存储和网络,用户可以部署任意软件。例如:Amazon EC2。

四、云的部署模式

公有云: 由第三方服务商提供,资源面向公众开放,具有成本效益,但安全性和控制权有限。
私有云: 由组织内部构建和维护,提供更高的安全性和控制,但成本较高。
混合云: 结合公有云和私有云的优点,敏感数据存储在私有云,其他服务利用公有云。
社区云: 由具有共同需求的组织共享,资源由多个组织共同管理和使用。

五、练习

1、什么是云计算?它有哪些特征?

云计算的定义:

云计算是一种通过网络按需、可扩展的方式获取计算资源和服务的模式。他将计算资源视为一种公共事业,用户可以根据需求动态获取和释放资源,而无需了解底层基础设施的细节。

云计算的特征:

①按需自助服务:用户可以根据需要随时访问和配置资源,无需与服务提供商进行人工交互。
②广泛网络访问:云服务通过网络(通常是互联网)提供,并且可以从各种设备访问,例如计算机、智能手机或平板电脑。
③资源池化:云服务提供商将计算资源(如处理能力、存储和网络带宽)集中在一起,通过虚拟化技术共享给多个用户。用户对这些资源的控制是间接的,资源可以动态分配和调整。
④快速弹性:资源能够根据需求进行快速扩展或缩减,用户的资源使用量可以按需自动调整,满足波动的需求。
⑤计量服务:云计算系统会自动监控和计量资源的使用情况。用户按实际使用量进行付费,通常采用计量计费的模式。

2、列表比较SaaS,PaaS,IaaS三者的关系。

3、之所以称“云计算”为“云”,是因为      ABC      (多选)
A. 它在某些方面具有现实中云的特征
B. 云计算的鼻祖之一亚玛逊公司的“弹性计算云”EC2产品
C. 互联网常以一个云状图案来表示
D. 以上都不是

4、云计算未来发展所面临的挑战主要包括      ABCD      (多选)
A. 数据安全问题
B. 网络性能问题
C. 协议与标准问题
D. 可扩展技术问题
E. 推广问题

5、下列云计算技术属于IaaS层面的是     ABD     (多选)
A. Amazon EC2
B. Eucalyptus
C. Google App Engine
D. Microsoft Azure

6、下列云计算技术属于PaaS层面的是      CD      (多选)
A. Hadoop
B. Eucalyptus
C. Google App Engine
D. Microsoft Azure

7、下列云计算技术属于SaaS层面的是      BC      (多选)
A. Hadoop
B. Salesforce CRM
C. Google Apps
D. Microsoft Azure

各产品各层面汇总

第二章:主流云平台

一、AWS云平台

1. 核心服务:

弹性计算云(EC2): 提供可扩展的计算能力,用户可以启动和管理虚拟服务器实例。
简单存储服务(S3): 面向对象的存储服务,适用于大规模数据存储和备份。
简单数据库服务(SimpleDB): 非关系型数据库服务,支持结构化数据的存储和查询。
简单队列服务(SQS): 分布式消息队列,支持组件之间的异步通信。

2. 优势:

弹性: 能够根据需求动态调整资源规模。
灵活性: 支持多种操作系统、开发平台和编程语言。
高可靠性: 提供数据备份和多区域冗余,确保服务的可用性。
安全性: 提供身份和访问管理、加密和安全组等安全特性。

二、OpenStack云平台

1. 核心组件:

Nova(计算服务): 管理和提供虚拟机实例。
Swift(对象存储服务): 提供可扩展的对象存储系统。
Glance(镜像服务): 管理虚拟机镜像,支持镜像的注册、发现和获取。
Keystone(身份服务): 提供统一的认证和授权服务。
Horizon(仪表盘服务): 基于Web的用户界面,方便用户管理云资源。

2. 架构:

逻辑层: 定义了云服务的逻辑功能,如计算、存储、网络等。
资源层: 物理资源的抽象,包括服务器、存储设备和网络设备。
管理层: 负责资源的调度、监控和管理,确保云服务的正常运行。

三、练习

1、什么是EC2?EC2的作用和几个主要优势是什么?

(1)EC2的定义

EC2(Elastic Compute Cloud)是 Amazon 提供的一种云计算服务,属于 IaaS(基础设施即服务) 层。它允许用户通过虚拟化技术在云中创建和管理虚拟服务器(实例)。

(2)EC2的作用

提供灵活的计算能力,用户可以根据需求启动、停止和管理虚拟机实例。
支持多种操作系统、硬件配置和开发语言。
适合各种场景,如 Web 应用托管、高性能计算、大数据处理等。

(3)EC2的优势

弹性(Elasticity): 用户可以根据负载动态调整实例的数量和配置,支持自动扩展。
成本效益(Cost-Effectiveness): 按实际使用量计费,无需提前购买硬件。
广泛兼容性(Compatibility): 支持多种操作系统(如 Linux、Windows)和应用程序。
高可靠性(Reliability): 通过区域冗余和备份机制,确保服务的稳定性。
安全性(Security): 提供身份与访问管理(IAM)、虚拟私有云(VPC)等安全措施。

2、什么是S3?什么是SDB?S3和SDB的主要区别是什么?

1、S3的定义

S3(Simple Storage Service)是 Amazon 提供的对象存储服务。它用于存储和检索任意数量的数据,并可以通过 REST API 访问。

2、SDB的定义

SDB(SimpleDB)是 Amazon 提供的一种分布式、非关系型数据库服务,主要用于存储和查询结构化数据。

3、S3和SDB的区别

第三章:虚拟化技术

一、虚拟化的定义与优势

1. 定义:

虚拟化是对计算机资源的抽象,将物理资源(如CPU、内存、存储和网络)映射为逻辑资源,使多个虚拟机共享同一物理资源。

2. 优势:

提高资源利用率: 通过整合资源,减少闲置,降低成本。
隔离性: 各虚拟机之间相互独立,增强了安全性和稳定性。
灵活性和可管理性: 快速部署和迁移虚拟机,简化了管理。
可靠性: 提供快照和备份功能,支持故障恢复。

二、服务器虚拟化类型

硬件仿真: 通过软件完全模拟硬件环境,允许运行未修改的操作系统,但性能开销较大。
全虚拟化: 使用虚拟机监控器(Hypervisor)提供完全的虚拟环境,支持未修改的操作系统,性能较高。
半虚拟化(准虚拟化): 需要对操作系统进行修改,以提高性能和效率。
操作系统级虚拟化: 在操作系统层面实现隔离,每个容器共享同一个操作系统内核,性能高但隔离性较弱。

三、其他虚拟化技术

桌面虚拟化: 将桌面环境从物理设备分离,用户可以通过客户端访问虚拟桌面。
网络虚拟化: 将物理网络资源抽象为逻辑网络,支持灵活的网络配置和管理。
存储虚拟化: 将多个存储设备整合为一个虚拟存储池,提高存储利用率和管理效率。 

四、练习

1、服务器虚拟化核心技术有哪些?

服务器虚拟化是通过将物理服务器抽象为多个虚拟资源(虚拟机)的技术,实现资源的高效利用、隔离性和灵活性。以下是服务器虚拟化的核心技术:
1.1 硬件辅助虚拟化
技术说明: 现代处理器(如 Intel VT-x、AMD-V)内置硬件支持,提升虚拟化性能。
作用: 简化虚拟机与主机之间的指令转换过程,提高虚拟机的运行效率。
1.2 全虚拟化
技术说明: 使用虚拟化软件(如 VMware、KVM)完全模拟硬件环境,让虚拟机运行未修改的操作系统。
作用: 提供与物理机相同的功能,支持多种操作系统。
1.3 半虚拟化(准虚拟化)
技术说明: 需要对操作系统进行修改,使其能直接调用虚拟化接口,从而减少虚拟化开销。
典型技术: Xen、Hyper-V。
作用: 提高性能,减少指令翻译的开销。
1.4 操作系统级虚拟化
技术说明: 基于共享同一个操作系统内核,多个容器运行在同一内核之上。
典型技术: Docker、LXC。
作用: 提供轻量级的虚拟化,资源占用低,启动速度快。
1.5 内存虚拟化
技术说明: 通过内存共享和动态分配技术提高内存的利用率。
典型技术: Ballooning(气球技术)、内存重定向。
作用: 提高多个虚拟机共享物理内存的能力。
1.6 网络虚拟化
技术说明: 在虚拟机之间或虚拟机与外部网络之间提供虚拟化的网络连接。
作用: 提供独立的虚拟网络,支持隔离、负载均衡和安全策略。
1.7 存储虚拟化
技术说明: 将存储资源抽象为逻辑存储池,使虚拟机可以共享存储资源。
作用: 提高存储利用率,实现数据的高效访问和管理。

2、虚拟机主要功能有哪些?

2.1 资源隔离
说明: 虚拟机之间相互独立,互不干扰。
作用: 提供高安全性,防止资源冲突或跨虚拟机的影响。
2.2 硬件资源分配
说明: 每个虚拟机都可以分配独立的 CPU、内存、存储和网络资源。
作用: 模拟物理计算机的完整硬件环境,按需分配资源。
2.3 操作系统和应用程序支持
说明: 每个虚拟机可以运行不同的操作系统(如 Windows、Linux)和应用程序。
作用: 提供跨平台支持,便于开发、测试和部署。
2.4 快照与回滚
说明: 可以保存虚拟机的当前状态(快照),并在需要时回滚到特定状态。
作用: 提供故障恢复能力,便于测试和实验。
2.5 动态迁移
说明: 支持虚拟机从一台物理服务器迁移到另一台服务器(如 vMotion)。
作用: 在不中断服务的情况下进行硬件维护或负载均衡。
2.6 资源复用
说明: 多个虚拟机共享同一物理硬件资源。
作用: 提高资源利用率,降低成本。
2.7 备份与恢复
说明: 支持虚拟机的完整备份和快速恢复。
作用: 提高数据可靠性和容灾能力。
2.8 安全性
说明: 提供虚拟化隔离,限制虚拟机之间的直接通信。
作用: 防止跨虚拟机的攻击或信息泄露。
2.9 模拟与测试环境
说明: 可以在虚拟机中模拟复杂的环境和系统行为。
作用: 便于开发者和运维人员进行软件开发和测试。

服务器虚拟化核心技术: 包括硬件辅助虚拟化、全虚拟化、半虚拟化、操作系统级虚拟化,以及内存、网络、存储等虚拟化技术。
虚拟机主要功能: 包括资源隔离、硬件资源分配、多操作系统支持、快照与回滚、动态迁移、资源复用、安全性等。

第五章:Hadoop平台

一、HDFS(分布式文件系统)

1. 特点:

高吞吐量: 适合大规模数据集的批处理,提供高数据传输速度。
容错性: 数据在多个节点上复制存储,防止单点故障。
可扩展性: 通过添加节点来扩展存储容量和计算能力。
流式数据访问: 适用于一次写入、多次读取的场景。

二、MapReduce

1. 工作原理:

Map阶段: 将输入数据分割为独立的块,映射为键值对。
Reduce阶段: 对Map输出的键值对进行汇总和处理,生成最终结果。
数据本地化: 计算尽可能在数据所在的节点进行,减少数据传输。

2. 优势:

简单编程模型: 开发者只需关注Map和Reduce函数的实现。
高容错性: 自动处理节点故障,重新调度任务。
可扩展性: 适用于从单台机器到上千节点的集群。

三、相关组件

YARN(Yet Another Resource Negotiator): 资源管理和任务调度框架,支持多种数据处理模型。
HBase: 基于HDFS的分布式列存储数据库,适用于实时读写和随机访问。
ZooKeeper: 分布式协调服务,提供一致性的配置管理、命名和同步。

四、练习

1. 并行编程模型中共享存储模型以   A   为代表。

A. OpenMP
B.MPI
C. PVM
D. MapReduce
答案:A. OpenMP
解析:
OpenMP:共享存储模型的典型代表,基于共享内存的多线程并行编程接口。
MPI 和 PVM:基于消息传递的并行编程模型,适用于分布式内存。
MapReduce:数据并行计算模型,与共享存储模型无关。

2. 下列属于Hadoop的基本结构的组成部分的有     ABC   (多选)。

A. HDFS
B.Hbase
C. Zookeeper
D. Bigtable
答案:A. HDFS、B. HBase、C. Zookeeper
解析:
HDFS:Hadoop 的核心组件之一,负责分布式文件存储。
HBase:基于 HDFS 的分布式 NoSQL 数据库,适合实时读写场景。
Zookeeper:分布式协调服务,用于管理和协调 Hadoop 集群的工作。
Bigtable:Google 的分布式存储系统,不属于 Hadoop 的组成部分。

3. 下列不属于HDFS 的三个重要角色的是     D
A. NameNode
B. DataNode
C. Client
D. master
答案:D. master
解析:
HDFS 的三个重要角色:
  - NameNode:管理文件系统的元数据。
  - DataNode:存储实际数据块。
  - Client:与 HDFS 交互,上传、下载文件。
master:虽然 NameNode 可以被称为主节点,但“master”不是 HDFS 的正式角色名称。

4. 在对HDFS配置文件进行设置时数据块的副本数量一般情况下为    B    个?
A 2
B 3
C 4
D 5

1. MapReduce是    数据流驱动(Data-Driven)     并行计算模型的典范,在云计算领域被广泛采用。
2. HDFS 在对文件存储时,首先把文件按照一定的大小分割成一个或多个的数据块,数据块默认大小为     128 MB     。 
3. 在利用MapReduce编写程序时,程序员只需要关注两个自定义函数:   Map   函数 和     Reduce     函数。

第七章:云存储

一、云存储的概念与特点

1. 概念:

云存储是基于云计算的在线存储模式,通过网络将用户的数据存储在远程的数据中心,用户可以随时随地访问和管理数据。

2. 特点:

无限存储空间: 理论上可以无限扩展存储容量,满足大数据需求。
高可用性: 通过数据冗余和备份,确保数据的安全和可用。
按需付费: 根据实际使用的存储容量和流量计费,降低成本。
无需关心底层技术细节: 用户不需要了解存储设备的配置和维护。

二、存储结构

DAS(直接连接存储): 存储设备直接连接到服务器,性能高但扩展性差。
NAS(网络附加存储): 通过网络将存储设备连接到服务器,支持文件级访问,易于共享和管理。
SAN(存储区域网络): 专用高速网络连接存储设备和服务器,支持块级数据传输,适用于高性能和大型存储环境。

三、NoSQL数据库

1. 特性:

高扩展性: 设计为分布式架构,易于横向扩展。
灵活的数据模型: 适合非结构化和半结构化数据,如键值、文档、列族和图形数据库。
高性能: 针对特定的查询和存储模式进行了优化。
弱一致性: 采用最终一致性模型,提高了性能和可用性。

2. 适用场景:

大数据处理: 需要存储和处理海量数据的应用。
实时分析: 需要快速读写和高并发的应用。
灵活的数据结构: 数据模型频繁变化或不固定的应用。

四、练习


答案:A. RAID 0
解析:
RAID 0 通过数据条带化(Striping)提高了存储性能,但没有数据冗余,一旦磁盘故障,数据将无法恢复。


答案:B. RAID 1
解析:
RAID 1 采用数据镜像(Mirroring)技术,将数据完全复制到两块或多块磁盘上,提供高可靠性。


答案:C. RAID 3
解析:
RAID 3 使用一个磁盘专门存储奇偶校验信息,并通过其他磁盘存储数据,提高了容错能力。


答案:D. RAID 5
解析:
RAID 5 将数据和奇偶校验信息分布在所有磁盘上,提供更高的性能和冗余。


答案:C. 3块
解析:
RAID 5 需要至少 3 块硬盘,因为数据和奇偶校验信息需要分布在多个磁盘上。


答案:B. 2块
解析:
RAID 1 至少需要 2 块硬盘,用于数据的镜像。


答案:Wide SCSI - B. 16 bits,Narrow SCSI - A. 8 bits
解析:
Narrow SCSI 的数据通道为 8 位(8 bits)。
Wide SCSI 的数据通道为 16 位(16 bits)。


1、云存储的结构模型包括哪四个组成部分?

云存储的四个主要组成部分:
存储资源层: 包括物理存储设备和存储介质
基础管理层: 负责存储资源的配置、调度和管理
接口层: 提供标准的API接口供上层应用访问
访问层: 为用户提供访问接口,支持不同的访问协议

2、NAS和SAN在文件级共享和数据备份方面的优缺点分别是什么?

NAS和SAN的对比:

NAS (网络附加存储):
优点:
文件级访问,便于文件共享
部署简单,成本较低
支持异构系统访问
缺点:
性能受网络带宽限制
不适合大规模数据传输
备份时可能影响网络性能

SAN (存储区域网络):
优点:
块级访问,性能更好
专用网络,带宽有保障
适合大规模数据备份
缺点:
部署成本高
管理复杂度大
扩展性相对较差

3、相比NoSQL数据库,关系数据库暴露的问题有哪些?

关系数据库相比NoSQL的主要问题:
扩展性差:难以进行水平扩展
性能瓶颈:复杂查询性能下降明显
架构僵化:表结构修改困难
高并发处理能力有限
不适合处理非结构化数据
数据一致性要求导致性能损失

第八章:云安全

一、云安全的概述

1. 云上的安全:

数据加密: 在数据传输和存储过程中对数据进行加密,防止未经授权的访问。
数据备份: 定期备份数据,防止数据丢失或损坏。
访问控制: 通过身份认证和权限管理,确保只有授权用户才能访问资源。

2. 安全云的应用:

防病毒技术: 在云端部署防病毒服务,实时监控和防御恶意软件。
入侵检测技术: 监测网络流量和系统活动,识别和响应潜在的安全威胁。

二、云安全技术

数据加密: 使用对称和非对称加密算法保护数据的机密性。
数字签名: 确保数据的完整性和来源的可信性。
灾难恢复与备份: 制定应急预案,利用冗余和备份快速恢复系统。
可信计算: 利用可信硬件和软件,建立安全的计算环境,防止篡改和非法访问。 

第九章:云标准

一、标准化的重要性

互联互通: 统一的标准使不同云服务之间能够互相连接和协作。
服务共享: 标准化促进了资源和服务的共享,提高了利用率。
安全可靠: 通过制定安全标准,增强云服务的安全性和可靠性。
绿色高效: 标准化有助于优化资源配置,降低能源消耗,实现可持续发展。

二、现有标准化组织

美国国家标准与技术研究院(NIST): 提供云计算的定义、架构和标准框架。
开放云计算联盟(OCC): 促进云计算的开放标准和互操作性。
云安全联盟(CSA): 专注于云计算的安全标准和最佳实践。

三、标准化领域的趋势

重点发展IaaS标准: 解决基础设施层的互操作性和兼容性问题。
推动互通性与合作: 通过标准化,促进不同云服务提供商之间的合作,避免厂商锁定。
关注数据和应用的可移植性: 确保用户可以方便地在不同云平台之间迁移数据和应用。

四、练习


答案:B. 云安全联盟;D. 网络存储工业协会;A. 分布式管理任务组;E. 开放网格论坛
解析:
云安全联盟(CSA): 专注于云安全标准的制定与推广。
网络存储工业协会(SNIA): 负责存储技术的标准化,包括云存储和分布式存储技术。
分布式管理任务组(DMTF): 专注于分布式管理和云管理标准化。
开放网格论坛(OGF): 推动网格计算技术及其标准化。


答案:A. IaaS
解析:
IaaS 层: 涉及基础设施(如计算、存储、网络)的互通性和兼容性,对标准化的需求最强。
PaaS 和 SaaS 层: 虽然也需要标准化,但其依赖于 IaaS 层的基础设施标准。


答案:互联互通;安全可靠
解析:
标准化确保云计算平台之间的互联互通,支持资源和服务的共享,并增强系统的安全性和效率。
答案:
云安全联盟(CSA,Cloud Security Alliance): 专注于云计算安全的标准化。
分布式管理任务组(DMTF,Distributed Management Task Force): 推动云管理标准的制定与实施。
开放网格论坛(OGF,Open Grid Forum): 关注网格计算和分布式计算标准化。
网络存储工业协会(SNIA,Storage Networking Industry Association): 专注于云存储和分布式存储标准化。
开放云计算联盟(OCC,Open Cloud Computing Interface): 推动云计算的开放性和互操作性标准。

1、为什么要建立云计算的标准?

互操作性需求:
确保不同云服务提供商之间的系统可以相互通信和协作
方便用户在不同云平台之间迁移数据和应用
避免用户被单一供应商锁定(Vendor Lock-in)

安全保障:
建立统一的安全框架和标准
规范数据保护和隐私保护要求
提供安全评估和认证的基准
增强用户对云服务的信任度

市场发展:
促进公平竞争,避免市场垄断
降低市场准入门槛
推动创新和技术进步
扩大云计算的应用范围

服务质量:
统一服务质量评估标准
明确服务级别协议(SLA)的规范
保护用户权益
提高服务可靠性和稳定性

成本效益:
降低开发和部署成本
减少重复建设
提高资源利用效率
便于规模化发展

行业管理:
便于政府监管和行业自律
规范市场秩序
促进产业健康发展
保护知识产权


网站公告

今日签到

点亮在社区的每一天
去签到