前言

最近学了王爽教授写的《汇编语言》，整理一下学习笔记。

1.1 机器语言

机器语言是机器指令的集合，是一台机器可以正确执行的命令。
电子计算机的机器指令是一列二进制数字，如1000100111011000，计算机将之转变一列高低电平，高电平是1，低电平是0，以使计算机的电子器件受到驱动，进行运算。

CPU

CPU(Central Processing Unit, 中央处理单元），是一种微处理器，是计算机系统的运算和控制核心，是信息处理、程序运行的最终执行单元。
最常见的PC机是由CPU和其他受CPU 直接或间接控制 的芯片、器件、设备组成的计算机系统。
但是每一种微处理器由于硬件设计和内部结构的不同，就需要不同的电平脉冲来控制它使它工作，因此每一种微处理器都有自己的机器指令集，也就是机器语言。

但是机器语言有一个很大的弊端，就是机器码晦涩难懂和不易查错，有时候写一个简单的程序出来都要几十行，比如下面进行的运算：

8086CPU完成运算s=768+12288-1280
几个简单的数字运算就要写这么多机器码，要是写错一个0和1真的很难辨别，而且这代码根本记不住啊！！！
早期的程序员很快发现了使用机器语言带来的麻烦，于是汇编语言产生了！

1.2 汇编语言

在介绍汇编语言之前先介绍一下寄存器的概念。

寄存器

寄存器，简单来讲是CPU中可以存放数据的器件，用来存放数据的一些小型存储区域，用来暂时存放参与运算的数据和运算结果，一个CPU中有多个寄存器。如AX,BX都是其中一个寄存器的代号。

汇编语言的核心是汇编指令，它决定了汇编语言的特性。
汇编语言和机器语言的差别在于指令的表示方法上，汇编语言的指令是机器指令便于记忆的书写格式。说白了，汇编指令就是机器指令的助记符。

对比机器语言和汇编语言
现在发现汇编指令真的比机器指令便于记忆多了
但是，问题来了
计算机只能读懂机器指令，它怎么知道我写的汇编指令是什么意思呢？

当然，办法总是有的，只要把汇编指令翻译成机器指令就好了，于是，编译器诞生了！

编译器

简单讲，编译器就是将“一种语言（通常为高级语言）”翻译为“另一种语言（通常为低级语言）”的程序。其将汇编语言翻译成机器语言的工作流程如下：

用汇编语言编写程序的工作过程
由上图可知，程序员用汇编语言写出源程序，再用汇编编译器将其编译位机器码，由计算机最终执行。
由此我们也知道
汇编语言与机器语言是一一对应的关系

汇编语言的组成

汇编语言发展至今，有3类指令组成
（1）汇编指令：机器码的助记符，有对应的机器码。
（2）伪指令：没有对应的机器码，由编译器执行，计算机并不执行。
（3）其他符号：如+、—、*、/ 等，由编译器识别，没有对应的机器码。

1.3 存储器

想要让CPU工作，就要向他提供数据和指令，而这些指令和数据在存储器中存放，也就是我们平时说的内存。

内存的重要性仅次于CPU，离开了内存，再好的CPU也无法工作，就像再聪明的大脑，没了记忆也无法进行思考。

磁盘

磁盘是指利用磁记录技术存储数据的存储器，是计算机主要的存储介质，可以存储大量的二进制数据，并且断电后也能保持数据不丢失。

早期计算机使用的磁盘是软磁盘（Floppy Disk，简称软盘），如今常用的磁盘是硬磁盘（Hard disk，简称硬盘）。

磁盘不同于内存，磁盘上的数据或程序如果读不到内存中，就无法被CPU使用

1.4 指令和数据

在内存或磁盘上，指令和数据没有任何区别，都是二进制信息。CPU在工作时，把有的信息看作指令，有的信息看作数据，同样的信息赋予了不同的意义。如下图：

但是CPU如何区分指令和数据呢？
（1）从不同的时间段区分：在取指令阶段取出的是指令，在指令执行阶段取出的是数据。
（2）从地址来源区分：由PC提供存储单元地址的取出的是指令，由指令地址码部分提供存储单元地址的取出是操作数。

1.5 存储单元

存储器被划分为若干个存储单元，每个存储单元从0开始顺序编号，例如一个存储器有128个存储单元，编号为0-127，如图所示：
0-127存储单元
一个存储单元能存储多少信息呢？
我们知道，电子计算机的最小信息单位是bit(音译为比特)
8个bit组成一个Byte,也就是通常说的一个字节。微型机存储器的存储单元可以存储一个字节Byte，即8个二进制位。一个存储器有128个存储单元，它可以存储128个Byte。

微机存储器的容量是以字节位最小单位来计算的，对于拥有128个存储单元的存储器，我们可以说，他的容量是128个字节。

对于大容量的存储器一般还用以下单位来计量容量（以下用B来代表Byte）

1KB = 1024B
1MB =1024KB
1GB = 1024MB
1TB = 1024GB

1.6 CPU对内存的读写

上面讲到，存储器被划分成多个存储单元，存储单元从0开始顺序编号。这些编号可以存储单元在存储器中的地址，就像一条街，每个房子都有门牌号码。

CPU从内存中读取数据首先要确定存储单元的地址，而且要指明是对这台微机中的哪一个器件进行操作，进行哪一种操作，是从中读取数据，还是写入数据。

因此，CPU想要进行数据的读写，必须和外部器件（标准说法是芯片）进行下面3类信息的交互。
（1）存储单元的地址（地址信息）
（2）器件的选择，读或写的命令（控制信息）
（3）读或写的数据（数据信息）

可是CPU是通过什么将地址、数据、和控制信息传到存储器芯片中的呢？

总线

电子计算机能处理、传输的信息都是电信号，电信号要用导线来传送。在计算机中有专门连接CPU和其他芯片的导线，通常称为总线。总线从物理意义上来说就是一根根导线的集合。根据传送信息的不同，总线从逻辑上又分位3类：地址总线、控制总线和数据总线。

如CPU从3号单元读取数据的过程如下：
CPU从内存中读取数据的过程
步骤如下：
（1）CPU通过地址线将地址信息3发出。
（2）CPU通过控制线发出内存读命令，选中存储器芯片，并通知它，将要从中读取数据。
（3）存储器将3号单元中的数据8通过数据线送入CPU。

知道了原理，怎么命令计算机执行指令呢？
指令如下：

机器码：10100001 00000011 00000000
对应的汇编指令：MOV AX, [3]
含义：传送3号单元的内容入AX

1.7 地址总线

现在我们知道了CPU是通过地址总线来指定存储单元的。可见地址总线上能传送多少个不同的信息，CPU就可以对多少个存储单元进行寻址。

我们知道在电子计算机中，一根导线可以传送的稳定状态只有两种，高电平（用二进制表示就是1）或低电平（用二进制表示就是0）。n根导线就可以传送n位二进制数据。一位二进制数有0，1两种表示方式，所以n位二进制数可以表示2的n次方个不同的数据。

一个CPU有N跟地址总线，则可以说这个CPU的地址总线的宽度为N。这样的CPU最多可以寻找2的N次方个内存单元。

下图展示了一个具有10根地址线的CPU向内存发出地址信息11时10根地址线上传送的二进制信息。
地址总线上发送地址信息

1.8 数据总线

CPU与内存或其他器件之间的数据传送是通过数据总线来进行的。数据总线的宽度决定了CPU和外界的数据传送速度。8根数据总线一次可以传送一个8位二进制数据（即一个字节）。16位数据总线一次可以传送两个字节。

8088CPU的数据总线宽度为8，8086CPU的数据总线宽度为16，下图将展示它们分别向内存中写入数据89D8H时，是如何通过数据总线传送数据的。

8088CPU 分两次传送89D8，第一次传送D8，第二次传送89。
8位数据总线上传送的信息
8086CPU有16根数据线，可一次性传送完毕。
16位数据总线上传送的信息

1.9 控制总线

CPU对外部器件的控制是通过控制总线来进行的。在这里控制总线只是个总称，控制总线是一些不同控制线的集合。有多少根控制总线，就意味着CPU提供了对外部器件的多少中控制。所以，控制总线的宽度决定了CPU对外部器件的控制能力。

例如：

“读信号输出”的控制线负责由CPU向外传送读信号，CPU向该控制线上输出低电平表示读取数据。
“写信号输出”的控制线则负责传送写信号。

1.10 主板

主板，也叫母板，安装在计算机主机箱内，是计算机最基本也是最重要的部件之一，主板上有一些核心器件和主要器件，这些器件通过总线（地址总线、数据总线、控制总线）相连。这些器件有CPU、存储器、外围芯片组、扩展插槽等。扩展插槽上一般插有RAM内存条和各类接口卡。计算机主机中的各个部件都是通过主板来连接的，计算机在正常运行时对系统内存、存储设备和其他I/O设备的操控都必须通过主板来完成。计算机性能是否能够充分发挥，硬件功能是否足够，以及硬件兼容性如何等，都取决于主板的设计。主板的优劣在某种程度上决定了一台计算机的整体性能、使用年限以及功能扩展能力。

1.11 接口卡

CPU对外部设备无法直接控制，如显示器，音箱，打印机等。直接控制这些设备进行工作的是接口卡。接口卡通过总线与CPU相连，CPU可以直接控制这些接口卡，从而实现CPU对外部设备的间接控制。

1.12 各类存储器芯片

一台PC机中装有多个存储芯片，从读写属性上看分为两类：随机存储器（RAM)和只读存储器（ROM)。

随机存储器可读可写，但必须带电存储，关机后存储的内容丢失；
只读存储器只能读取不能写入，关机后内容不丢失。

这些存储器从功能和连接上又可分为以下几类：

下图展示了PC系统的中各类存储器的链接情况：
PC机中各类存储器的逻辑连接

1.13 内存地址空间

什么是内存地址空间？举个例子，一个CPU的地址总线宽度为10，那么可以寻址1024个内存单元，这1024个可寻到的内存单元就构成这个CPU的内存地址空间。

上述的那些存储器，在物理上是独立器件，但是在以下两点上相同：
（1）都和CPU的总线相连。
（2）CPU对它们进行读或写的时候都通过控制线发出内存读写命令。

也就是说，CPU把它们总的看作一个由若干存储单元组成的逻辑存储器，这个逻辑存储器就是我们所说的内存地址空间。

下面展示了CPU将系统中各类存储器看作一个逻辑存储器的情况：
将各类存储器看作一个逻辑存储器

图中每个物理存储器在这个逻辑存储器中占有一个地址段，即一段地址空间。CPU在这段地址空间中读写数据，实际上就是在相应的物理存储器中读写数据。

不同的计算机系统的内存地址空间的分配情况是不同的，下面展示8086PC机内存地址空间分配的基本情况。
8086PC机内存地址空间分配
由上图可知
从地址0-9FFFF的内存单元中读取数据，实际上就是在读取主随机存储器的数据；
向地址A0000-BFFFF的内存单元中写数据，就是向显存中写数据，这些数据会被显卡输出到显示器上；
向地址C0000-FFFFF的内存单元中写入数据的操作是无效的，因为这等于改写只读存储器的内容，而只读存储器不能写入只能读取。

内存地址空间的大小受CPU地址总线宽度的限制。8086CPU的地址总线宽度为20，可以传送2的20次方个不同的地址信息。即可以定位2的20次方个内存单元，则8086CPU的内存地址空间大小为1MB。同理，80386CPU的地址总线为32，则内存地址空间最大为4GB。

总结

以上为本人学习汇编语言时的摘录总结，主要内容来源于汇编语言（第四版）王爽著，大家若是感兴趣可以看看原书，很值得推荐，以上内容如果有什么错误的话，还请大家指正！

【汇编语言】第一章基本知识

第一章

前言

1.1 机器语言

CPU

1.2 汇编语言

寄存器

编译器

汇编语言的组成

1.3 存储器

磁盘

1.4 指令和数据

1.5 存储单元

1.6 CPU对内存的读写

总线

1.7 地址总线

1.8 数据总线

1.9 控制总线

1.10 主板

1.11 接口卡

1.12 各类存储器芯片

1.13 内存地址空间

总结

网站公告

今日签到

热门文章

最新发布

【汇编语言】第一章 基本知识

第一章

前言

1.1 机器语言

CPU

1.2 汇编语言

寄存器

编译器

汇编语言的组成

1.3 存储器

磁盘

1.4 指令和数据

1.5 存储单元

1.6 CPU对内存的读写

总线

1.7 地址总线

1.8 数据总线

1.9 控制总线

1.10 主板

1.11 接口卡

1.12 各类存储器芯片

1.13 内存地址空间

总结

网站公告

今日签到

热门文章

最新发布

【汇编语言】第一章基本知识