微机原理_DOS环境搭建_Debug

Debug是什么

Debug是DOS、Windows都提供的实模式(8086方式)程序的调试工具。使用它,可以查看CPU各种寄存器中的内容、内存的情况和在机器码级跟踪程序的运行。

挂载磁盘

下载masm文件夹,是四个可执行文件,放在宿主系统磁盘下的某个位置。

需要在DosBox中进行挂载。

即在dos中输入以下命令:参数1为要挂载到dos系统的某个位置,参数2为要挂载的宿主系统中的内容

1
mount C D:\masm

输入后,成功时会显示:Drive C is mounted as local directory D:\masm\

可以在dos中进入C盘进行执行文件了。

调节窗口大小

  1. https://blog.51cto.com/sxhelijian/4895116
  2. https://blog.csdn.net/wxw1920/article/details/120716642

基本命令

  1. 用Debug的R命令查看、改变CPU寄存器的内容;
  2. 用Debug的D命令查看内存中的内容;
  3. 用Debug的E命令改写内存中的内容;
  4. 用Debug的U命令将内存中的机器指令翻译成汇编指令;
  5. 用Debug的T命令执行一条机器指令;
  6. 用Debug的A命令以汇编指令的格式在内存中写入一条机器指令。

R命令查看、改变CPU寄存器内容

输入r,回车。可打印若干寄存器内容。在所有寄存器的下方,Debug还列出了CS:IP所指向的内存单元处所存放的机器码,并将它翻译为汇编指令。输出的右下角还有一个信息"DS:0000=CD"。

image-20220901141954968

若要修改一个寄存器中的值,比如AX中的值,可用R命令后加寄存器名来进行,输入"r ax"后按Enter键,将出现":"作为输入提示,在后面输入要写入的数据后按Enter键,即完成了对AX中内容的修改。若想看一下修改的结果,可再用R命令查看。

D命令查看内存中的内容

d 段地址:偏移地址,可以来查看指定内存地址初的默认128个字节的内容。在使用"d 段地址:偏移地址"之后,接着再次使用D命令,可再次列出后续128字节的内容。

可以指定D命令的查看范围,此时采用"d 段地址:起始偏移地址 结尾偏移地址"的格式。比如要看1000:0~1000:9中的内容,可以用"d1000:0 9"实现,如图所示。若结尾偏移地址小于起始偏移地址将会报错。

image-20220901145106731

如果想看特定内存单元10000H中的内容,可以用图中任何一种方法看到。图中三种方式段地址:偏移地址都表示了10000H这一物理地址。(别忘了,8086下的段地址需要乘以16,相当于1000H10H=10000H1000H*10H=10000H0FFFH10H+10H=FFF0H+10H=10000H0FFFH*10H+10H=FFF0H+10H=10000H

image-20220901144739638

E命令修改内存中的内容

比如要将内存1000:0~1000:9单元中的内容分别写为0~9。可以使用e 起始地址 数据 数据 数据 ...的格式来进行。

image-20220901143311569

也可以用E命令以提问的方式来逐个地修改从某一地址开始的内存单元中的内容,以从1000:10单元开始为例,步骤如下。

  1. 输入e 1000:10,按 Enter键。
  2. Debug显示起始地址1000:0010,和第一单元(即1000:0010单元)的原始内容6D,然后光标停在"."的后面提示输入想要写入的数据,此时可以有两个选择:
    1. 输入数据,然后按空格键,即用输入的数据改写当前的内存单元
    2. 不输入数据,直接按空格键,则不对当前内存单元进行改写。
  3. 当前单元处理完成后(不论是改写或没有改写,只要按了空格键,就表示处理完成),Debug将接着显示下一个内存单元的原始内容,并提示进行修改,可以用同样的方法处理。
  4. 所有希望改写的内存单元改写完毕后,按Enter键,E命令操作结束。

image-20220901144136193

还可以用E命令向内存中写入字符,比如,用E命令从内存1000:0开始写入数值1、字符"a"、数值2、字符"b"、数值3、字符"c",可采用图中所示的方法进行。

image-20220901143932131

也可以用E命令向内存中写入字符串,比如,用E命令从内存1000:0开始写入数值1、字符串"a+b"、数值2、字符串"c++“、字符 3、字符串"IBM”。

image-20220901144327149

E命令写入机器码,用U命令查看机器码含义,T命令执行

可以用E命令向内存中写入机器码,用U命令查看内存中机器码的含义,用T命令执行内存中的机器码。

机器码也是数据,当然可以用E命令将机器码写入内存。比如我们要从内存1000:0单元开始写入这样一段机器码:

机器码 对应的汇编指令
b80100 mov ax, 0001
b90200 mov cx, 0002
01c8 add ax, cx

可以用E命令这样输入:

1
e 1000:0 b8 01 00 b9 02 00 01 c8

可以使用U命令查看写入的或内存中原有的机器码所对应的汇编指令。比如可以用U命令将从1000:0开始的内存单元中的内容翻译为汇编指令,并显示出来。

下图:首先用E命令向从1000:0开始的内存单元中写入了8个字节的机器码;然后用D命令查看内存1000:0~1000:1f中的数据(从数据的角度看一下写入的内容);最后用U命令查看从1000:0开始的内存单元中的机器指令和它们所对应的汇编指令。

image-20220901145701343

U命令的显示输出分为3部分,每一条机器指令的地址、机器指令、机器指令所对应的汇编指令。

内存中的数据和代码没有任何区别,关键在于如何解释。

使用T命令执行写入的机器指令可以执行一条或多条指令。

简单地使用T命令,可以执行CS:IP指向的指令。

image-20220901150147031

先修改cs、ip,使下一条命令对准1000:0,即mov ax, 1t命令执行后,发现,ax变为了1;ip改变为3(指向下一条)。

A命令以汇编指令的形式在内存中写入机器指令

A命令使能直接以汇编指令的形式写入指令。

首先用A命令,以汇编语言向从1000:0开始的内存单元中写入了几条指令,然后用D命令查看A命令的执行结果。可以看到,在使用A命令写入指令时,我们输入的是汇编指令,Debug将这些汇编指令翻译为对应的机器指令,将它们的机器码写入内存。

不再继续写入时,直接按Enter键表示操作结束。

image-20220901150535967

image-20220901150726949

微机原理_寄存器_物理地址_段

CPU

一个典型的CPU(此处讨论的不是某一具体的CPU)由运算器、控制器、寄存器等构成,这些器件靠内部总线相连。内部总线实现CPU内部各个器件之间的联系;外部总线实现CPU和主板上其他器件的联系。简单地说,在CPU中:

  • 运算器进行信息处理;
  • 寄存器进行信息存储;
  • 控制器控制各种器件进行工作;
  • 内部总线连接各种器件,在它们之间进行数据的传送。

对于一个汇编程序员来说,CPU中的主要部件是寄存器。寄存器是CPU中程序员可以用指令读写的部件。程序员通过改变各种寄存器中的内容来实现对CPU的控制。不同的CPU,寄存器的个数、结构是不相同的。8086有14个寄存器,每个寄存器有一个名称。这些寄存器是:AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW。

通用寄存器–AX/BX/CX/DX

8086的所有寄存器都是16位的,可以存放两个字节。AX、BX、CX、DX这4个寄存器通常用来存放一般性的数据,被称为通用寄存器。

8086的上一代CPU中的寄存器都是8位的,为了保证兼容,使原来基于上代CPU编写的程序稍加修改就可以运行在8086之上,8086的AX、BX、CX、DX这4个寄存器都可分为两个可独立使用的8位寄存器来用:

  1. AX可分为AH和AL
  2. BX可分为BH和BL
  3. CX可分为CH和CL
  4. DX可分为DH和DL

image-20220831145025668

字在寄存器中的存储

出于对兼容性的考虑,8086可以一次性处理以下两种尺寸的数据。

  1. 字节:记为byte,一个字节由8个bit组成,可以存在8位寄存器中。
  2. 字:记为word,一个字由两个字节组成,这两个字节分别称为这个字的高位字
    节和低位字节

image-20220831145223342

一个字可以存在一个16位寄存器中,这个字的高位字节和低位字节自然就存在这个寄存器的高8位寄存器和低8位寄存器中。如上图所示,一个字型数据20000,存在AX寄存器中,在AH中存储了它的高8位,在AL中存储了它的低8位。AH和AL中的数据,既可以看成是一个字型数据的高8位和低8位,这个字型数据的大小是20000;又可以看成是两个独立的字节型数据,它们的大小分别是78和32。

几条汇编指令

汇编指令 控制CPU完成的操作 用高级语言的语法描述
mov ax, 18 将18送入寄存器AX AX=18
mov ah, 78 将78送入寄存器AH AH=78
add ax, 8 将寄存器AX中的数值加上8 AH=AX+8
mov ax, bx 将寄存器BX中的数据送入寄存器AX AX=BX
add ax, bx 将AX和BX中的数值相加,结果存在AX中 AX=AX+BX

在写一条汇编指令或一个寄存器的名称时不区分大小写。如mov ax, 18和MOV AX, 18的含义相同。

越位的问题

汇编指令 AX中的数据 BX中的数据
{start} 00C5H 4026H
add al, 93H ? 4026H

指令执行后AX中的数据为多少?

分析:

程序段中的最后一条指令add al, 93H,在执行前,al中的数据为C5H,相加后所得的值为158H,但是al为8位寄存器,只能存放两位十六进制的数据,所以最高位的1丢失,ax中的数据为0058H。(这里的丢失,指的是进位值不能在8位寄存器中保存,但是CPU并不是真的丢弃这个进位值)

注意,此时al是作为一个独立的8位寄存器来使用的,和ah没有关系,CPU在执行这条指令时认为ah和al是两个不相关的寄存器。不要错误地认为add al, 93H的指令产生的进位会存储在ah中,add al, 93H进行的是8位运算。

如果执行add ax, 93H,低8位的进位会存储在ah中,CPU在执行这条指令时认为只有一个16位寄存器ax,进行的是16 位运算。指令add ax, 93H执行后,ax中的值为:0158H。此时,使用的寄存器是16位寄存器ax,add ax, 93H相当于将ax中的16位数据00C5H和另一个16位数据0093H相加,结果是16位的0158H。

操作对象的位数应当是一致的

在进行数据传送或运算时,要注意指令的两个操作对象的位数应当是一致的,例如:

1
2
3
4
5
6
mov ax, bx
mov bx, cx
mov ax, 18H
mov al, 18H
add ax, bx
add ax, 20000

等都是正确的指令,而:

1
2
3
4
mov ax, bl    ; 在8位寄存器和16位寄存器之间传送数据
mov bh, ax ; 在16位寄存器和8位寄存器之间传送数据
mov al, 20000 ; 8位寄存器最大可存放值为255的数据
add al, 100H ; 将一个高于8位的数据加到一个8位寄存器中

等都是错误的指令,错误的原因都是指令的两个操作对象的位数不一致。

物理地址

CPU访问内存单元时,要给出内存单元的地址。即,CPU通过地址总线送入存储器的,必须是一个内存单元的物理地址。

所有的内存单元构成的存储空间是一个一维的线性空间,每一个内存单元在这个空间中都有唯一的地址,我们将这个唯一的地址称为物理地址。

在CPU向地址总线上发出物理地址之前,必须要在内部先形成这个物理地址。不同的CPU可以有不同的形成物理地址的方式。

下面分析8086是如何在内部形成内存单元的物理地址的。

16位CPU

什么是16位结构(16位机、字长为16位等常见说法,与16位结构的含义相同)的CPU?概括地讲,16位结构描述了一个CPU具有下面几方面的结构特性。

  • 运算器一次最多可以处理16位的数据;
  • 寄存器的最大宽度为16位;
  • 寄存器和运算器之间的通路为16位。

8086是16位结构的CPU,这也就是说,在8086内部,能够一次性处理、传输、暂时存储的信息的最大长度是16位的。内存单元的地址在送上地址总线之前,必须在CPU中处理、传输、暂时存放,对于16位CPU,能一次性处理、传输、暂时存储16位的“单位”地址。

8086CPU给出物理地址的方法

8086是16位结构,在内部一次性处理、传输、暂时存储的地址为16位。但是8086有20位地址总线,可以传送20位地址,达到1MB寻址能力。从8086CPU的内部结构来看,如果将地址从内部简单地发出,那么它只能送出16位的地址,表现出的寻址能力只有64K“单位”个地址。

8086CPU采用一种在内部用两个16位地址合成的方法来形成一个20位的物理地址。

当8086CPU要读写内存时:

  1. CPU中的相关部件提供两个16位的地址,一个称为段地址,另一个称为偏移地址;
  2. 段地址和偏移地址通过内部总线送入一个称为地址加法器的部件;
  3. 地址加法器将两个16位地址合成为一个20位的物理地址;
  4. 地址加法器通过内部总线将20位物理地址送入输入/输出控制电路(可以看到,地址加法器到输入/输出控制电路之间的内部总线需要有20位);
  5. 输入/输出控制电路将20位物理地址送上其与内存之间的地址总线;
  6. 20位物理地址被地址总线传送到存储器。

地址加法器采用物理地址=段地址×16(左移4)+偏移地址物理地址=段地址×16(左移4位)+偏移地址的方法用段地址和偏移地址合成物理地址。

其实,内存并没有分段,段的划分来自于CPU,由于8086CPU用“基础地址+偏移地址=物理地址”的方式给出内存单元的物理地址,使得我们在逻辑上可以用分段的方式来管理内存。可以根据需要,将地址连续、起始地址为16的倍数的一组内存单元定义为一个段。

在8086机中,存储单元的地址用两个元素来描述,即段地址和偏移地址。"数据在21F60H内存单元中。“这句话对于8086机一般不这样讲,取而代之的是两种类似的说法:1、数据存在内存2000:1F60单元中;2、数据存在内存的2000H段中的1F60H单元中。这两种描述都表示"数据在内存21F60H单元中”。

段寄存器–CS为例

我们前面讲到,8086在访问内存时要由相关部件提供内存单元的段地址和偏移地址,送入地址加法器合成物理地址。这里,需要看一下,是什么部件提供段地址。段地址在8086的段寄存器中存放。8086有4个段寄存器CS、DS、SS、ES。当8086要访问内存时由这4个段寄存器提供内存单元的段地址。看一下CS(CS,全拼为Code Segment)。

CS和IP是8086中两个最关键的寄存器,它们指示了CPU当前要读取指令的地址。CS为代码段寄存器,IP为指令指针寄存器,从名称上可以看出它们和指令的关系。

在8086PC机中,任意时刻,设CS中的内容为M,IP中的内容为N,8086将从内存M×16+N单元开始,读取一条指令并执行。

也可以这样表述:8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。

在内存中,指令和数据没有任何区别,都是二进制信息,CPU在工作的时候把有的信息看作指令,有的信息看作数据。现在,如果提出一个问题:CPU根据什么将内存中的信息看作指令?可以说,CPU将CS:IP指向的内存单元中的内容看作指令,因为,在任何时候,CPU将CS、IP中的内容当作指令的段地址和偏移地址,用它们合成指令的物理地址,到内存中读取指令码,执行。如果说,内存中的一段信息曾被CPU执行过的话,那么,它所在的内存单元必然被CS:IP指向过。

修改CS、IP的指令–转移指令

CPU从何处执行指令是由CS、IP中的内容决定的,在CPU中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现控制CPU的执行目标指令。

如何改变CS、IP的值呢?显然,8086必须提供相应的指令。我们如何修改AX中的值?可以用mov指令,如mov ax, 123将ax中的值设为123。显然,我们也可以用同样的方法设置其他寄存器的值,如mov bx, 123mov cx, 123mov dx, 123等。

其实,8086大部分寄存器的值,都可以用mov指令来改变,mov指令被称为传送指令

但是,mov指令不能用于设置CS、IP的值,原因很简单,因为8086没有赋予mov这样的权限。8086为CS、IP提供了另外的指令来改变它们的值。能够改变CS、IP的内容的指令被统称为转移指令。看一个最简单的可以修改CS、IP的指令:jmp指令。

jmp 段地址:偏移地址

若想同时修改CS、IP的内容,可用形如"jmp 段地址:偏移地址"的指令完成,如jmp 2AE3:3,执行后:CS=2AE3HIP=0003H,CPU将从2AE33H处读取指令。jmp 3:0B16,执行后:CS=0003HIP=0B16H,CPU将从00B46H处读取指令。

"jmp 段地址:偏移地址"指令的功能为:用指令中给出的段地址修改CS,偏移地址修改IP。

jmp 某一合法寄存器

若想仅修改IP的内容,可用形如"jmp 某一合法寄存器"的指令完成,如jmp ax,指令执行前:ax=1000HCS=2000HIP=0003H;指令执行后:ax=1000HCS=2000HIP=1000Hjmp bx,指令执行前:bx=0B16HCS=2000HIP=0003H。指令执行后:bx=0B16HCS=2000HIP=0B16H

"jmp 某一合法寄存器"指令的功能为:用寄存器中的值修改IP。

jmp ax,在含义上好似:mov IP, ax

用汇编解释汇编

"用汇编解释汇编"能更好地理解汇编指令的功能,要强调的是,是用"已知的汇编指令的语法"进行描述,并不是用"已知的汇编指令"来描述,比如,我们用mov IP, ax来描述jmp ax,并不是说真有mov IP, ax这样的指令,而是用mov指令的语法来说明jmp指令的功能。我们可以用同样的方法描述jmp 3:01B6的功能:jmp 3:01B6在含义上好似mov CS, 3, mov IP, 01B6

总结

  1. 段地址在8086的段寄存器中存放。当8086要访问内存时,由段寄存器提供内存单元的段地址。8086有4个段寄存器,其中CS用来存放指令的段地址。
  2. CS存放指令的段地址,IP存放指令的偏移地址。8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
  3. 8086的工作过程
    1. 从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;
    2. IP指向下一条指令;
    3. 执行指令。(转到步骤1,重复这个过程。)
  4. 8086提供转移指令修改CS、IP的内容

访问内存的角度