第一章
前言
最近学了王爽教授写的《汇编语言》,整理一下学习笔记。
1.1 机器语言
机器语言是机器指令的集合,是一台机器可以正确执行的命令。
电子计算机的机器指令是一列二进制数字,如1000100111011000,计算机将之转变一列高低电平,高电平是1,低电平是0,以使计算机的电子器件受到驱动,进行运算。
CPU
CPU(Central Processing Unit, 中央处理单元),是一种微处理器,是计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。
最常见的PC机是由CPU和其他受CPU 直接或间接控制 的芯片、器件、设备组成的计算机系统。
但是每一种微处理器由于硬件设计和内部结构的不同,就需要不同的电平脉冲来控制它使它工作,因此每一种微处理器都有自己的机器指令集,也就是机器语言。
但是机器语言有一个很大的弊端,就是机器码晦涩难懂和不易查错,有时候写一个简单的程序出来都要几十行,比如下面进行的运算:
几个简单的数字运算就要写这么多机器码,要是写错一个0和1真的很难辨别,而且这代码根本记不住啊!!!
早期的程序员很快发现了使用机器语言带来的麻烦,于是汇编语言产生了!
1.2 汇编语言
在介绍汇编语言之前先介绍一下寄存器的概念。
寄存器
寄存器,简单来讲是CPU中可以存放数据的器件,用来存放数据的一些小型存储区域,用来暂时存放参与运算的数据和运算结果,一个CPU中有多个寄存器。如AX,BX都是其中一个寄存器的代号。
汇编语言的核心是汇编指令,它决定了汇编语言的特性。
汇编语言和机器语言的差别在于指令的表示方法上,汇编语言的指令是机器指令便于记忆的书写格式。说白了,汇编指令就是机器指令的助记符。
现在发现汇编指令真的比机器指令便于记忆多了
但是,问题来了
计算机只能读懂机器指令,它怎么知道我写的汇编指令是什么意思呢?
当然,办法总是有的,只要把汇编指令翻译成机器指令就好了,于是,编译器诞生了!
编译器
简单讲,编译器就是将“一种语言(通常为高级语言)”翻译为“另一种语言(通常为低级语言)”的程序。其将汇编语言翻译成机器语言的工作流程如下:
由上图可知,程序员用汇编语言写出源程序,再用汇编编译器将其编译位机器码,由计算机最终执行。
由此我们也知道
汇编语言与机器语言是一一对应的关系
汇编语言的组成
汇编语言发展至今,有3类指令组成
(1)汇编指令:机器码的助记符,有对应的机器码。
(2)伪指令:没有对应的机器码,由编译器执行,计算机并不执行。
(3)其他符号:如+、—、*、/ 等,由编译器识别,没有对应的机器码。
1.3 存储器
想要让CPU工作,就要向他提供数据和指令,而这些指令和数据在存储器中存放,也就是我们平时说的 内存。
内存的重要性仅次于CPU,离开了内存,再好的CPU也无法工作,就像再聪明的大脑,没了记忆也无法进行思考。
磁盘
磁盘 是指利用磁记录技术存储数据的存储器,是计算机主要的存储介质,可以存储大量的二进制数据,并且断电后也能保持数据不丢失。
早期计算机使用的磁盘是软磁盘(Floppy Disk,简称软盘),如今常用的磁盘是硬磁盘(Hard disk,简称硬盘)。
磁盘不同于内存,磁盘上的数据或程序如果读不到内存中,就无法被CPU使用
1.4 指令和数据
在内存或磁盘上,指令和数据没有任何区别,都是二进制信息。CPU在工作时,把有的信息看作指令,有的信息看作数据,同样的信息赋予了不同的意义。如下图:
但是CPU如何区分指令和数据呢?
(1)从不同的时间段区分:在取指令阶段取出的是指令,在指令执行阶段取出的是数据。
(2)从地址来源区分:由PC提供存储单元地址的取出的是指令,由指令地址码部分提供存储单元地址的取出是操作数。
1.5 存储单元
存储器被划分为若干个存储单元,每个存储单元从0开始顺序编号,例如一个存储器有128个存储单元,编号为0-127,如图所示:
一个存储单元能存储多少信息呢?
我们知道,电子计算机的最小信息单位是bit(音译为比特)
8个bit组成一个Byte,也就是通常说的一个字节。微型机存储器的存储单元可以存储一个字节Byte,即8个二进制位。一个存储器有128个存储单元,它可以存储128个Byte。
微机存储器的容量是以字节位最小单位来计算的,对于拥有128个存储单元的存储器,我们可以说,他的容量是128个字节。
对于大容量的存储器一般还用以下单位来计量容量(以下用B来代表Byte)
1KB = 1024B
1MB =1024KB
1GB = 1024MB
1TB = 1024GB
1.6 CPU对内存的读写
上面讲到,存储器被划分成多个存储单元,存储单元从0开始顺序编号。这些编号可以存储单元在存储器中的地址,就像一条街,每个房子都有门牌号码。
CPU从内存中读取数据首先要确定存储单元的地址,而且要指明是对这台微机中的哪一个器件进行操作,进行哪一种操作,是从中读取数据,还是写入数据。
因此,CPU想要进行数据的读写,必须和外部器件(标准说法是芯片)进行下面3类信息的交互。
(1)存储单元的地址(地址信息)
(2)器件的选择,读或写的命令(控制信息)
(3)读或写的数据(数据信息)
可是CPU是通过什么将地址、数据、和控制信息传到存储器芯片中的呢?
总线
电子计算机能处理、传输的信息都是电信号,电信号要用导线来传送。在计算机中有专门连接CPU和其他芯片的导线,通常称为总线。总线从物理意义上来说就是一根根导线的集合。根据传送信息的不同,总线从逻辑上又分位3类:地址总线、控制总线和数据总线。
如CPU从3号单元读取数据的过程如下:
步骤如下:
(1)CPU通过地址线将地址信息3发出。
(2)CPU通过控制线发出内存读命令,选中存储器芯片,并通知它,将要从中读取数据。
(3)存储器将3号单元中的数据8通过数据线送入CPU。
知道了原理,怎么命令计算机执行指令呢?
指令如下:
机器码:10100001 00000011 00000000
对应的汇编指令:MOV AX, [3]
含义:传送3号单元的内容入AX
1.7 地址总线
现在我们知道了CPU是通过地址总线来指定存储单元的。可见地址总线上能传送多少个不同的信息,CPU就可以对多少个存储单元进行寻址。
我们知道在电子计算机中,一根导线可以传送的稳定状态只有两种,高电平(用二进制表示就是1)或低电平(用二进制表示就是0)。n根导线就可以传送n位二进制数据。一位二进制数有0,1两种表示方式,所以n位二进制数可以表示2的n次方个不同的数据。
一个CPU有N跟地址总线,则可以说这个CPU的地址总线的宽度为N。这样的CPU最多可以寻找2的N次方个内存单元。
下图展示了一个具有10根地址线的CPU向内存发出地址信息11时10根地址线上传送的二进制信息。
1.8 数据总线
CPU与内存或其他器件之间的数据传送是通过数据总线来进行的。数据总线的宽度决定了CPU和外界的数据传送速度。8根数据总线一次可以传送一个8位二进制数据(即一个字节)。16位数据总线一次可以传送两个字节。
8088CPU的数据总线宽度为8,8086CPU的数据总线宽度为16,下图将展示它们分别向内存中写入数据89D8H时,是如何通过数据总线传送数据的。
8088CPU 分两次传送89D8,第一次传送D8,第二次传送89。
8086CPU有16根数据线,可一次性传送完毕。
1.9 控制总线
CPU对外部器件的控制是通过控制总线来进行的。在这里控制总线只是个总称,控制总线是一些不同控制线的集合。有多少根控制总线,就意味着CPU提供了对外部器件的多少中控制。所以,控制总线的宽度决定了CPU对外部器件的控制能力。
例如:
“读信号输出”的控制线负责由CPU向外传送读信号,CPU向该控制线上输出低电平表示读取数据。
“写信号输出”的控制线则负责传送写信号。
1.10 主板
主板,也叫母板,安装在计算机主机箱内,是计算机最基本也是最重要的部件之一,主板上有一些核心器件和主要器件,这些器件通过总线(地址总线、数据总线、控制总线)相连。这些器件有CPU、存储器、外围芯片组、扩展插槽等。扩展插槽上一般插有RAM内存条和各类接口卡。计算机主机中的各个部件都是通过主板来连接的,计算机在正常运行时对系统内存、存储设备和其他I/O设备的操控都必须通过主板来完成。计算机性能是否能够充分发挥,硬件功能是否足够,以及硬件兼容性如何等,都取决于主板的设计。主板的优劣在某种程度上决定了一台计算机的整体性能、使用年限以及功能扩展能力。
1.11 接口卡
CPU对外部设备无法直接控制,如显示器,音箱,打印机等。直接控制这些设备进行工作的是接口卡。接口卡通过总线与CPU相连,CPU可以直接控制这些接口卡,从而实现CPU对外部设备的间接控制。
1.12 各类存储器芯片
一台PC机中装有多个存储芯片,从读写属性上看分为两类:随机存储器(RAM)和只读存储器(ROM)。
随机存储器可读可写,但必须带电存储,关机后存储的内容丢失;
只读存储器只能读取不能写入,关机后内容不丢失。
这些存储器从功能和连接上又可分为以下几类:
下图展示了PC系统的中各类存储器的链接情况:
1.13 内存地址空间
什么是内存地址空间?举个例子,一个CPU的地址总线宽度为10,那么可以寻址1024个内存单元,这1024个可寻到的内存单元就构成这个CPU的内存地址空间。
上述的那些存储器,在物理上是独立器件,但是在以下两点上相同:
(1)都和CPU的总线相连。
(2)CPU对它们进行读或写的时候都通过控制线发出内存读写命令。
也就是说,CPU把它们总的看作一个由若干存储单元组成的逻辑存储器,这个逻辑存储器就是我们所说的内存地址空间。
下面展示了CPU将系统中各类存储器看作一个逻辑存储器的情况:
图中每个物理存储器在这个逻辑存储器中占有一个地址段,即一段地址空间。CPU在这段地址空间中读写数据,实际上就是在相应的物理存储器中读写数据。
不同的计算机系统的内存地址空间的分配情况是不同的,下面展示8086PC机内存地址空间分配的基本情况。
由上图可知
从地址0-9FFFF的内存单元中读取数据,实际上就是在读取主随机存储器的数据;
向地址A0000-BFFFF的内存单元中写数据,就是向显存中写数据,这些数据会被显卡输出到显示器上;
向地址C0000-FFFFF的内存单元中写入数据的操作是无效的,因为这等于改写只读存储器的内容,而只读存储器不能写入只能读取。
内存地址空间的大小受CPU地址总线宽度的限制。8086CPU的地址总线宽度为20,可以传送2的20次方个不同的地址信息。即可以定位2的20次方个内存单元,则8086CPU的内存地址空间大小为1MB。同理,80386CPU的地址总线为32,则内存地址空间最大为4GB。
总结
以上为本人学习汇编语言时的摘录总结,主要内容来源于汇编语言(第四版) 王爽 著,大家若是感兴趣可以看看原书,很值得推荐,以上内容如果有什么错误的话,还请大家指正!