Contents

64位操作系统——(四)处理器体系结构

讲解CPU结构,深化硬件理解

64位操作系统——(四)处理器体系结构


作者: 王赛宇

说明: 本章中存在对书《一个64位操作系统的设计与实现》(作者田雨)的大段引用,引用部分使用暗灰色背景标出


在前三个章节中,我们实现了一个简单的操作系统。这个操作系统有最最简单的内存管理、进程切换的方法,当然这些方法非常简陋。在后面的章节中,我们会跟随作者的书,继续去完善我们的系统。在这一节中,我们先学习一些有关当前的intel体系结构的东西。

这些知识都是我从作者那里接受过来的知识,然后再输出到文档里面,如果你看我写的文档,那大概属于二手知识了。所以我还是建议你直接去看作者的书,如果有理解不了的地方,来看看这个文档作为辅助理解是最好的。当然,我也不会把所有的内容都写上来,而是将一些我认为遇到过、有用的知识写上来。

基础功能与新特性

这一节主要讲的是Intel Pentium 4以及后续的处理器的特性

运行模式

我们先来回想一下,在bootloader中我们在几个模式之间进行了切换?

image-20201112015426679

那么在此基础上,我们来了解一下intel cpu为我们提供了哪些运行模式:

  • 实模式:这个就是我们完成Bios自检后留存的模式,在该模式下,cpu处于16位宽状态,同时只有20工作的根地址线,所以只能访问1MB内存,当然,我们也可以打开Big Real Mode模式来操作4GB内存范围内的数据,至于Big Real Mode如何运行,我们后面再做讲解。
  • 保护模式:这个是三十二位处理器运行的主要模式,特征是可以访问4GB的数据,及4GB的代码(Big Real Mode只能跑1MB代码,所以才叫Real Modd
  • 系统管理模式 :这个没有接触过,相当于是处理器提供给操作系统的接口,这个接口可以用于电源管理等,当调用这一系列接口的时候,CPU就会陷入系统管理模式(这和系统调用很相似,不同的是服务的提供者)
  • 虚拟8086模式:处理器为保护模式提供的一种运行模式,允许处理器在保护模式下执行8086软件和多任务环境。(猜测是)
  • IA-32e模式:64为处理器的主要运行模式,包含兼容模式和64位模式两种主要模式。

作者给出了一张图,这张图描述了不同模式之间的转移方法:

image-20201112021247046

我们用到了标红的两种转移。同时,如果想要检测计算机是否在IA-32e模式,只需要检测IA32_EFER寄存器的LME位是否为1即可。

通用寄存器

对于一个32位CPU,一共有八个通用寄存器:

EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP

我们最熟悉的是ESP,他负责记录当前执行程序的栈指针,我们不能随便改他,除此之外,这些寄存器还有一些特殊用途:

名称特殊功能描述
EAX用于累加操作或保存计算结果
EBX作为DS数据段寄存器的段内偏移指针
ECX字符串和循环操作的计数器
EDXI/O地址指针
ESI作为DS数据段寄存器的段内偏移指针(源地址指针)
EDI作为ES数据段寄存器的段内偏移指针(目标地址指针)
ESP栈指针
EBP栈帧(段内偏移指针)

对于64位CPU而言,Intel多给了8个寄存器:

RAX, RBX, RCX, RDX, RDI, RSI, RBP, RSP

可以看到,这八个寄存器和上面的是对应的,引用博客RAX,eax,ax,ah,al 关系中的一个图,他们的关系非常好说明:

|63..32|31..16|15-8|7-0|
               |AH.|AL.|
               |AX.....|
       |EAX............|
|RAX...................|

CPUID指令

检测是否支持CPUID指令

通过EFLAGS标志寄存器的ID标志位(位于EFLAGS寄存器的第21位)可检测出处理器是否支持CPUID指令。

CPUID查询指令

首先看这张图:

img

cpuid 指令由 eax 寄存器获得输入,执行 cpuid 指令前,将功能号传给 eax 寄存器:

输入:

  • eax:主功能号,支持的最大主功能号是14h
  • ecx:扩展信息的主功能号, 从80000000h到80000008h

输出:

  • eax
  • ebx
  • ecx
  • edx

我们在检测是否支持CPUID指令的时候用到了EFLAGS标志寄存器,我们来了解下:

EFLAGS标志寄存器

img

我们刚才检测是否支持CPUID的时候,检测的是EFLAGS寄存器的第21位:ID位,它的作用就是标记CPU是否支持CPUID指令。

EFLAGS标志寄存器的值可以通过特殊的汇编指令进行更改。当程序通过调用门执行任务切换时,处理器会把EFLAGS标志寄存器值保存到任务状态段TSS内,并将目标任务状态段TSS内的值更新到EFLAGS标志寄存器中。可以根据标志位功能将他们分为:状态标志、方向标志、系统标志和IOPL区域等几部分

状态标志

状态标识用于反应运算结果的特征,如下,(表来源于作者书):

image-20201112031633947

破案了,我们之前用的各种判断CF、ZF的条件跳转就是判断EFLAGS标志寄存器相应位的值,其中有一些技巧:

  • CF标志位可反映出有符号整型数计算结果的溢出状态
  • AF标志位可反映出BCD整型数计算结果的溢出状态
  • SF标志位可反映出有符号整型数计算结果的正负值
  • ZF标志位可反映出整型数(有符号和无符号)的计算结果

在上面的标识中,只有CF标志位可通过STCCLCCMC汇编指令更改位值,它也可借助位操作指令将指定位值复制到CF标志位。

方向标志

DF就是方向标识,它控制着字符串指令的操作方向。DF == 1可使字符串指令按从高至低的地址方向,反之则反。汇编指令STDCLD可用于置位和复位DF方向标志位。(我们之前用过这个)

系统标志和IOPL区域

这些位负责控制I/O端口地址访问权限、屏蔽硬件中断请求、使能单步调试、任务嵌套以及使能虚拟8086模式等,其功能如下:

缩写全称位置功能描述
TFTrap8使能单步调试功能
IFInterruptEnable9使能中断(响应可屏蔽中断)
IOPLI/O Privilege Level Field12,13访问I/O端口地址的最低特权级
NTNested Task14允许任务嵌套调用
RFResume16允许调试异常
VMVirtual-8086 Mode17使能Virtual-8086模式
ACAlignment Check or Access Control18数据对齐检测
VIFVirtual Interrupt19IF中断使能标志位的虚拟镜像
VIPVirtual interrupt pending20中断挂起
IDIdentification21检测CPUID指令

需要注意的是:如果希望修改上述系统标志位或IOPL区域,则必须拥有足够的执行权限(0特权级)。

控制寄存器

目前,Intel处理器共拥有6个控制寄存器(CR0、CR1、CR2、CR3、CR4和CR8),在前面的过程中我们主要用到了CR3寄存器。他们都是由一些标志位组成的,通过操作这些标识位可以控制处理器的运行模式,作者给出了一个表来描述这些寄存器:

寄存器功能描述
CR0控制处理器的状态和运行模式
CR1保留
CR2引起#PF异常的线性地址
CR3记录页目录的物理基地址和属性
CR4体系结构扩展功能的使能标志位
CR8读写访问的任务优先级寄存器

我们之前用到的CR3主要适用于内存管理的。

下面是这些寄存器的结构,在IA-32模式下,这些寄存器都是32位的,在IA-32e模式下,这些寄存器是64位的,但是除了地址类的寄存器外,其它的结构依然没有变化,多出来的位均作为拓展使用:

img

这些保留位必须被置为0,否则会触发异常;CR2、CR3不会对输入的地址进行检测;CR8仅在64位模式下有;

作者还给出了各个控制位的功能描述,我也将这些信息全都拷贝下来:

缩写全称功能描述
PGPaging使能分页管理机制
CDCache Disable控制系统内存的缓存机制
NWNot Write-through控制系统内存的写穿机制
AMAlignment Mask数据对齐检测
WPWrite Protect开启只读页的写保护
NENumeric Error选择x87FPU的错误通知机制
ETExtension Type检测Intel 387 DX协处理器
TSTask Switched延迟保存浮点处理器的数据
EMEmulation检测x87 FPU协处理器
MPMonitor Coprocessor使能WAIT指令监控
PEProtection Enable开启保护模式
PCDPage-level Cache Disable页级禁止缓存标志位
PWTPage-level Write-Through页级写穿标志位
SMAPSMAP-Enable Bit限制超级权限对用户数据的访问
SMEPSMEP-Enable Bit限制超级权限对用户程序的执行
OSXSAVEXSAVE and Processor Extended States-Enable Bit开启XSAVEXRSTORXGETBVXSETBV等指令的增强功能
PCIDEPCID-Enable Bit开启PCID功能
FSGSBASEFSGSBASE-Enable Bit使能RDFSBASEWRFSBASE以及RDGSBASEWRGSBASE指令
SMXESMX-Enable Bit开启SMX功能
VMXEVMX-Enable Bit开启VMX功能
OSXMMEXCPTOperating System Support for Unmasked SIMD Floating-Point Exceptions允许处理器执行SIMD浮点异常(#XM)
OSFXSROperating System Support for FXSAVE and FXRSTOR instructions限制FXSAVEFXRSTOR指令的功能
PCEPerformance-Monitoring Counter Enable限制RDPMC指令的执行权限
PGEPage Global Enable开启全局页表功能
MCEMachine-Check Enable开启机器检测异常
PAEPhysical Address Extension开启页管理机制的物理地址寻址扩展
PSEPage Size Extensions允许32位分页模式使用4 MB物理页
DEDebugging Extensions使能DR4、DR5调试寄存器
TSDTime Stamp Disable限制RDTSCRDTSCP指令的执行权限
PVIProtected-Mode Virtual Interrupts使能EFLAGS.VIF标志位
VMEVirtual-8086 Mode Extensions使能Virtual-8086模式的中断/异常
TPLTask Priority Level阻塞中断的最高特权级阈值

CR0.PE == 0时如果CR0.PG == 1,那么会触发异常;CR0.CD与CR0.NW标志位联合控制着处理器的缓存和读写策略(来自作者):

CDNW缓存和读写策略
00标准缓冲模式,提供最高效的缓存策略
01无效设置,触发错误码为0的#GP异常
10处理器无法缓存数据,但需要保持内存的一致性
11处理器无需保持内存与缓存的一致性

除CRn控制寄存器和XCR0扩展控制寄存器(用于控制浮点计算功能)外,EFER寄存器也用于控制系统功能。它是MSR寄存器组的IA32_EFER寄存器,它提供了控制IA-32e运行模式开启的标志位,以及关于页表访问限制的控制区域。下图是IA32_EFER寄存器的位功能说明。

https://goleveldb-1301596189.cos.ap-guangzhou.myqcloud.com/07.d06z.005.png

IA32_EFER寄存器的各标志位功能,其中的LME标志位最为重要,它用于开启IA-32e模式,而第0位则是SYSCALL/SYSRET指令的使能位。这对指令由AMD公司引入,Intel处理器对它们仅提供了有限的支持。

缩写读写功能描述
0SCER/WSYSCALL/SYSRET指令的使能标志位(64位模式有效)
1:7保留
8LMER/W使能IA-32e模式
9保留
10LMARIA32_EFER_LMA=1表明IA-32e模式已开启
11NXER/W开启页访问限制功能(PAE模式可用)
12:63保留

MSR寄存器

MSR(Model-Specific Register)寄存器组可提供性能监测、运行轨迹跟踪与调试以及其他处理器功能。我们在编写系统调用指令的时候也使用了MSR寄存器,我们使用的是该寄存器针对SYSENTER和SYSEXIT设计的六个区。

地址空间

地址空间可以被分为虚拟地址空间物理地址空间两大类,不同地址类型之间是可以相互转化的。

虚拟地址

大多数虚拟地址并不能独立的转化为物理地址,下面我们开始了解:

  • **逻辑地址:**形如下面这样的就是逻辑地址:SelectorCode : Offset,可以看到,这样的一个逻辑地址由段基址和段内偏移地址两部分组成,这里的偏移地址也被称为有效地址,逻辑地址最终会被转化为线性地址。
  • 线性地址:正如前面所说,线性地址由逻辑地址中的基址和偏移量组合而成,这就导致程序无法直接访问线性地址。平坦地址是一种特殊的线性地址,将段基地址和段长度覆盖了整个线性地址空间,而非线性地址空间中的某一部分区域;当段 基地址为0时,段内偏移地址(有效地址)与线性地址在数值上相等。

物理地址

物理地址就是用于访问硬件设备的地址,在开启分页机制时,线性地址会经过页表映射后变为物理地址,否则就将直接变为物理地址,物理地址也可以根据访问物理设备的不同进行分类:

  • **IO地址:**IO地址和内存地址相互隔离,必须借助特殊的IN, OUT语句才能够进行访问,我们在书写键盘中断的时候就使用了IO操作,由此推测,IO地址主要用于控制一些外部可拓展的设备。
  • 内存地址:内存地址不仅包括内存条的可用空间,还包括了其他外部硬件设备的地址空间,这些设备和物理内存共享一片地址空间。我们在探测可用的内存地址的时候,使用了INT 15h指令来获取内存地址空间的相关信息

实模式

我们在刚刚上电的时候,进入的就是实模式,当然由于使用需要,我们也只有在刚上电的时候才会用实模式了。

实模式寻址

实模式是不存在分页机制的,仅支持逻辑地址的:Base : Offset的寻址方式,该地址到线性地址的转化如下: $$ Linar Address = Base « 4 + Offset $$ 在实模式下,所有的寄存器都是16位的,也正是基于这种寻址方式,CPU的寻址能力从原来的$2^{16}$增强为了$2^{20}$即1MB,当然,我们也可以进入Big Real Mode来对4GB范围内的数据进行修改,我们后面会仔细讲解。

实模式的中断向量表

实模式下也有一个中断向量表,叫做IVT,他的方法依然是用中断向量号进行索引,在表中找到相应表项后进行跳转,每个表项由Base & Offset两部分构成,每个表项占4Byte空间,整个表占1KB空间,支持处理256个中断,其结构如下图:

img

在计算机启动后,BIOS会在物理地址0处创建中断向量表IVT。如果希望在程序运行过程中修改或保存中断向量表,我们可借助LIDTSIDT指令实现。

实模式的知识点就结束了,我们可以看到实模式的中断向量表与保护模式下的中断向量表差距极大,这就导致其安全策略非常有限,接下来我们来了解保护模式:

保护模式

在学习保护模式前,先来解释何为保护:这里的保护是相对实模式而言的,那么我们先来看实模式哪里不保护了?

  • 实模式对地址的访问没有做任何限制,应用程序想要访问、更改任何内存都没有任何限制(甚至可以通过直接更改前1KB的内存来更改异常处理函数入口)

那么接下来,我们就来看看,Intel的工程师是怎么解决这个问题的

保护模式特征

保护模式寻址

首先,保护模式引入了分段管理和分页管理机制,其总体布局如下(这个图我们在上一章节中已经有讲了):

img
  • 在保护模式中,我们仍然沿用逻辑地址的形式,但是,我们的逻辑地址的基地址变为了段选择子,并且逻辑地址向线性地址的转化从原来的左移相加转变为了通过段选择子获取段基地址后与段偏移量相加。
  • 在获取线性地址后,加入了页表(可选项),通过页表映射后即可获得最后的物理地址。

保护模式特权级

是的,这里在上一章中还是讲过:

img

保护模式将特权分为0~3四个特权级,其中0特权级用来跑操作系统内核,3特权级用来跑应用程序,中间的两个特权级我们没有用上,但是可以用来跑一些系统服务(如一些系统调用)。某些特殊的指令只能在0特权级下运行,如果在其他特权级下跑了相应的指令,就会触发异常。为了描述特权级,操作系统引入了三个特权级类型:

  • CPL当前特权级:描述的是当前执行的程序的特权级,当处理器执行特权级不同的代码的时候,才会修改CPL。
  • **DPL描述符特权级:**就是用来描述描述符描述的目标的特权级的,比如我们system_call的目标就是系统的内核态,那么其相对应的门级描述符的DPL就是0,这里需要注意的是,DPL是嵌在描述子中的,这里说的描述子就是GDT\IDT等描述子,这些描述子的共同特点就是导向一个目标,也就是说这里的DPL是用来描述:想要访问相应的目标,需要多少的特权级
  • **RPL请求特权级:**他表示这个请求的特权级,他嵌入在段选择子中

在进行访问的时候,实质上判断的是:max(RPL, CPL) <= DPL,如果满足这个的话,那么就能够访问

段选择子及其选择过程

这是一个段选择子:

img
缩写全称功能描述
Index用于索引目标段描述符
TITable Indicator指示目标段描述符所在描述符表类型
RPLRequested Privilege Level请求特权级

段选择子是如何找到相应的内存段的呢?如下图所示:

img

使用index进行索引,在GDT或LDT表中找到相应的描述符,找到描述符后,对CPL,DPL,RPL进行检测,如果检测无误,那么就将相应的描述符加载到段寄存器中,进行缓存。加载到段寄存器中的段对于用户来说就是一个”可用的段“,这和Cache非常相似。

在检索描述符的过程中,未必一定要从GDT中进行搜索:

img

刚才讲述段选择子时,我们还有一个TI位,这个TI位用于指示是从GDT还是从LDT中进行搜索;作者对GDT和LDT的描述如下:

  • 全局描述符表(Global Descriptor Table,GDT)。它本身不是一个段描述符,而是一个线性地址空间中的数据结构。在使用GDT前,必须使用LGDT汇编指令将其线性基地址和长度加载到GDTR寄存器中。由于段描述符的长度为8 B,那么GDT的线性基地址按8 B边界对齐可使处理器的运行效果最佳,GDT的长度为$8N - 1$($N$是段描述符项数)。
  • 局部描述符表(Local Descriptor Table,LDT)。它是一个LDT段描述符类型的系统数据段,因此处理器必须使用GDT的一个段描述符来管理它。处理器使用LLDT汇编指令可将GDT表内的LDT段描述符加载到LDTR寄存器,随后处理器会自动完成加载伪描述符结构体的工作。LDT段描述符可以保存在GDT的任何地方,如果系统支持多个LDT表,那么系统必须在GDT表中为每个LDT表创建独立的段描述符和段存储空间。为了避免地址转换,LDTR寄存器同样会保存LDT段描述符的段选择子、线性基地址以及长度。

如果想让操作系统在保护模式下运行,那么我们至少要建立一个GDT表,并将操作系统运行所必须的程序和数据保存在表中,事实上我们以后也不会去建LDT表了,只用GDT表也够了。当然,如果我们想要创建LDT也可以,可以创建一个或多个。

保护模式段管理机制

这一部分我们在上一章以及上一节中都已经有过简单的讲解,接下来我们对其进行全面的了解:

img

每个段描述子,由8Byte组成,我们可以通过段选择子来找到上面这样的一个段描述子,他大致可以被分为:

  • 段基地址:被分为了很多段,合体之后就是完整的段基址了

  • DPL:目标段的特权级

  • G&段长度:这两个是配合使用的,先用一句C语言来表示一下真实的段长度:

    ground_truth_limit = limit * G ? 4KB : 1Byte;

    也就是说,在G是0的时候段长度的单位是1Byte,反之则为4KB

  • D/B:这个有点复杂,作者是这样解释的:

    此位用于标识代码段的操作数位宽,或者栈段的操作数位宽以及上边界(32位代码/数据段应该为1,16位代码/数据段应该为0)

    • 可执行代码段,此位指定有效地址和操作数的默认宽度。置位时默认使用32位地址、32位或8位操作数;复位时默认使用16位地址、16位或8位操作数。前缀66h可调整默认操作数,而前缀67h可调整有效地址宽度
    • 栈段(SS寄存器中的数据段),此位指定栈指针的默认操作数。置位时默认使用32位栈指针(ESP),复位时默认使用16位栈指针(SP)。如果栈段是向下扩展的数据段,此位指定栈段的上边界
    • 向下扩展的数据段,此位指定上边界位宽。置位时上边界是FFFFFFFFh(4 GB),复位时上边界是FFFFh(64 KB)

除此之外,其他部分内容如下:

缩写功能描述
L在保护模式下,此位保留使用,设置为0即可
AVL此位被系统软件使用,通常情况下设置为0
P表示段已在内存中,如果段寄存器加载一个不在内存中的段描述符(P=0)将会触发#NP异常。在复位此标志位的情况下,操作系统可自由使用其他可用的段描述符区域
S指定段描述符的类型,置位为代码/数据段,复位为系统段
Type指定段/门描述符的类型,此位对S标志位作进一步解释

Type标志位区域可指定多种描述符类型,我们一个一个来看:

代码段描述符

Type区域功能
43424140
1CRA
1000非一致性、不可读、未访问
1001非一致性、不可读、已访问
1010非一致性、可读、未访问
1011非一致性、可读、已访问
1100一致性、不可读、未访问
1101一致性、不可读、已访问
1110一致性、可读、未访问
1111一致性、可读、已访问
  • A标志位(Accessed,已访问)。它记录代码段是否已被访问过,当A=1时表示代码段已被访问过,当A=0时表示代码段未被访问过。处理器只负责置位此标志位,并不负责复位,从而只能借助程序手动将其复位。(建议在修改A和和P标志位时使用LOCK前缀锁总线。)
  • R标志位(Readable,可读)。可执行程序虽然可以被处理器运行,但如果想读取程序段中的数据就必须置位此标志位。当然,可执行程序段始终不能写入数据。在操作特权级允许的前提下,我们可以将CS段寄存器作为操作前缀,或将代码段描述符载入到数据段寄存器,来读取代码段中的数据。
  • C标志位(Conforming,一致性)。代码段可分为一致性代码段和非一致性代码段,处理器通过此标志位可以进行标识。一个低特权级的程序(代码段)可执行或跳转至一个高特权级(或相同特权级)的一致性代码段,并在执行高特权级代码段的过程中保持低特权级的CPL不变,即不会因为代码段进入高特权级而更新CPL值。如果程序想要跳转至一个不同特权级的非一致性代码段,除非使用调用门或者任务门,否则将会触发#GP异常。所有的数据段都是非一致性的,这意味着它们不能被低特权级的程序访问。

我们来回忆一下当时是怎么初始化我们的GDT的:

[SECTION gdt]

LABEL_GDT:            dd    0,0
LABEL_DESC_CODE32:    dd    0x0000FFFF,0x00CF9A00
LABEL_DESC_DATA32:    dd    0x0000FFFF,0x00CF9200

GdtLen    equ    $ - LABEL_GDT
GdtPtr    dw     GdtLen - 1
          dd     LABEL_GDT

SelectorCode32    equ        LABEL_DESC_CODE32 - LABEL_GDT
SelectorData32    equ        LABEL_DESC_DATA32 - LABEL_GDT

这里代码段描述符是:0x00CF9A000000FFFF,其数值与功能对应如下:

位图范围功能数值(HEX)数值解释
0~15段长度(15:00)FFFF段长度4 GB
16~31段基地址(15:00)0000段基地址位于线性地址0处
32~39段基地址(23:16)00段基地址位于线性地址0处
40~43Type区域A非一致性、可读、未访问
44S1代码段
45~46DPL000特权级
47P1已在内存中
48~51段长度(19:16)F段长度4 GB
52AVL0软件可用位
53L0忽略
54D/B132位数据段
55G1段限长的颗粒度为4 KB
56~63段基地址(31:24)00段基地址位于线性地址0处

数据段描述符

Type区域功能
43424140
0EWA
0000向上扩展、只读、未访问
0001向上扩展、只读、已访问
0010向上扩展、可读写、未访问
0011向上扩展、可读写、已访问
0100向下扩展、只读、未访问
0101向下扩展、只读、已访问
0110向下扩展、可读写、未访问
0111向下扩展、可读写、已访问
  • E标志位(Expansion-direction,扩展方向)。此标志位指示数据段的扩展方向,当E=1时表示向下扩展,当E=0时表示向上扩展,通常情况下数据段向上扩展。
  • W标志位(Write-enbale,可读写)。它记录着数据段的读写权限,当W=1时可进行读写访问,当W=0时只能进行读访问。
  • A标志位(Accessed,已访问)。它的功能与代码段描述符中的已访问标志位A功能相同,即记录数据段是否被访问过。

同理,数据段描述符是:0x0000FFFF,0x00CF9200即为0x0000FFFF00CF9200,信息如下:

位图范围功能数值(HEX)数值解释
0~15段长度(15:00)FFFF段长度4 GB
16~31段基地址(15:00)0000段基地址位于线性地址0处
32~39段基地址(23:16)00段基地址位于线性地址0处
40~43Type区域2向上扩展、可读写、未访问
44S1数据段
45~46DPL000特权级
47P1已在内存中
48~51段长度(19:16)F段长度4 GB
52AVL0软件可用位
53L0忽略
54D/B1默认操作数和默认地址宽度
55G1段限长的颗粒度为4 KB
56~63段基地址(31:24)00段基地址位于线性地址0处

系统段描述符

Type区域功能
43424140
0000保留
000116位TSS段描述符(有效的)
0010LDT段描述符
001116位TSS段描述符(使用中)
010016位调用门描述符
0101任务门描述符
011016位中断门描述符
011116位陷阱门描述符
1000保留
100132位TSS段描述符(有效的)
1010保留
101132位TSS段描述符(使用中)
110032位调用门描述符
1101保留
111032位中断门描述符
111132位陷阱门描述符

(1) LDT段描述符

它的段描述符用于记录LDT表的位置、长度和访问权限等信息,其位功能与TSS描述符的位功能相同。这里再补充一点:LDT可在各程序或任务间起到隔离作用。操作系统使用其他方法同样可以起到程序间的隔离作用,例如为每个任务创建独立的页表结构等。但是我们不用他

(2) TSS描述符

TSS用于保存任务的处理器状态信息。和其他的段一样,处理器必须借助TSS描述符才能对任务状态段进行访问和管理。图6-13描绘了TSS描述符的位功能。

img

保护模式的TSS

TSS是负责在任务切换过程中记录寄存器信息、切换栈的,总的来说就是:

  • 提权时栈切换用到了 TSS
  • 切换一堆寄存器

当然,我们也需要知道,我们的程序只能从内核往应用中去跳转,而不能直接从应用向内核跳转,想要完成这一目标,就只能通过系统调用实现

img

保护模式的门描述符

IDT与GDT是相似的,他们都是描述表,只不过描述的信息不同,GDT是在描述全局段信息,而IDT在描述的是interrupt即中断信息,想要在IDT表中找到对应的表项,也需要使用索引,而这里的索引就是中断向量号,找到的表项则是一个个的门描述符,如下:

img

其中,门又被分为中断门、陷阱门、等等,但是我们只用了上面这两种,他们的区别在于:

  • Type位上不同
  • 在使用中断门时,系统会自动屏蔽掉其他中断

可以看到:每个门描述符都记录着一些关键信息:

  • 段选择子+段内偏移:指向一个地址,表示处理该中断例程的入口
  • DPL: 描述符特权级

当然,还有一种叫做调用门:

img

他比中断门多了一个参数个数。

保护模式的中断/异常处理机制

异常处理的总体流程如下:

img

总体来说就是:当中断发生时,通过IDTR寄存器找到IDT表的地址,然后再根据中断向量的大小,找到对应的IDT表项,IDT表项中对应着一个段选择子和一个偏移量,然后我们拿着这个段选择子去GDT或是LDT去找段基地址,拿到的段基地址和偏移量求和就是最终中断处理程序的线性地址了。

保护模式的页管理机制

在之前的学习中,我们了解了处理器的段管理机制,我们输入的逻辑地址会经过段管理机制后被转化为线性地址。接下来我们学习页管理机制,看看线性地址是如何被转变为物理地址的。

首先先来思考一下,分段模式有哪些局限性

  • 分段机制没有办法突破物理内存大小的限制的,一个32位的机器的寻址范围就只有4GB
  • 在多进程运行的时候,需要动态分配连续内存,没法在编译链接的时候确定各个进程的起始地址

引入页管理机制就解决了这一问题,可通过MOV CR0指令置位PG标志位来使能页管理机制;保护模式共支持32位分页模式、PSE模式和PAE模式三种页管理模式。

32位分页模式

img

这个就是我们在计算机组成原理课程中学习过的分页模式,总体流程如下:

  • 线性地址被切分为: **页目录项索引, 页表项索引, 页内偏移**三个部分
  • 先使用页目录项索引,在PDT中找到相应的页目录
  • 在找到的页目录中,使用页表项索引,找到相应的页表
  • 在找到的页表中,使用相应的偏移找到对应的物理地址

其中,页目录项索引, 页表项索引, 页内偏移的位宽与人为划分相关,同时,想要找到PDT,需要CR3控制寄存器作为索引,无论是PDT或是PT抑或是内存页,除了存储索引、数据的部份外,还有部分描述区:

img

其功能如下:

image-20201113163844674

同时,在MSR寄存器中,有一个IA32_PAT寄存器,它用于设置页属性PAT的内存类型,其结构如下:

img

由8个部分组成,每个部分都包含三个有效位和五个保留位,保留位必须被置为0,其中有效位的含义如下:

PATPCDPWTPAT项内存类型
000PAT0WB
001PAT1WT
010PAT2UC-
011PAT3UC
100PAT4WB
101PAT5WT
110PAT6UC-
111PAT7UC

关于其中的WB等内存类型,描述如下:

PAT值缩写内存类型功能描述
00hUCUncacheable内存不可缓存,对设备内存I/O映射非常有用,使用在物理内存中将导致执行效率降低
01hWCWriteCombining内存不可缓存,也不用强制遵循处理器总线的一致性协议。写操作可能会延迟执行,以减少内存访问次数
02h保留
03h保留
04hWTWriteThrough读写均被缓存,读操作先访问缓存行;写操作将同时写入到缓存行和内存
05hWPWriteProtected读操作先访问缓存行;写操作将会扩散到总线上的所有处理器,使处理器的对应缓存行失效
06hWBWriteBack整个读写操作皆在缓存行中进行。写操作将延迟更新到内存,从而减少内存访问次数
07hUC-Uncache与UC功能相同,但可在MTRR寄存器中使用WC覆盖
08~FFh保留

PSE模式

PSE模式是32位分页模式的扩展,它允许处理器在保护模式下使用4 MB的物理页。其寻址过程如下:

img

保护模式地址转换的过程

其实在前面的讲解中,我们已经把这个问题讲得很透彻了,这里就当作是一个小的总结吧,先看图

img

从抽象的模块来说,整个寻址通过了两个大的模块: 段管理页管理。段管理将地址从逻辑地址转化为了线性地址,而页管理机制接收线性地址,将线性地址映射为物理地址。从具体的转化、映射来说:

  • 从逻辑地址到线性地址的转化是通过GDT、LDT中的描述符或是通过IDT中的门级描述符实现的
  • 从线性地址到物理地址的转化是通过页表的索引实现的

IA-32e模式

IA-32e模式又被称为长模式(long mode),在段管理部分,IA-32e模式进行了部分精简,在页管理机制中,IA-32e模式加入了更多层次的页表:

https://goleveldb-1301596189.cos.ap-guangzhou.myqcloud.com/07.d06z.038.png