|
| 1 | +## ARM 的概念 |
| 2 | + |
| 3 | +ARM(Advanced RISC Machine),既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。 |
| 4 | +ARM 公司并不生产芯片也不销售芯片,它只出售芯片技术授权。其合作公司针对不同需求搭配各类硬件部件,比如 UART、SDI、I2C 等,从而设计出不同的 SoC 芯片。 |
| 5 | + |
| 6 | +## ARM 的应用场景 |
| 7 | + |
| 8 | +基于 ARM 的处理器具有高速度、低功耗、价格低等优点被广泛应用于以下领域: |
| 9 | + |
| 10 | +- 为通信、消费电子、成像设备等产品,提供可运行复杂操作系统的开放应用平台; |
| 11 | +- 在海量存储、汽车电子、工业控制和网络应用等领域,提供实时嵌入式应用; |
| 12 | +- 安全系统,比如信用卡、SIM 卡等。 |
| 13 | + |
| 14 | +## ARM的技术特征 |
| 15 | + |
| 16 | +ARM 架构支持 32 位的 **ARM 指令集**和 16 位的 **Thumb 指令集**(大大减小了代码的存储空间)。 |
| 17 | + |
| 18 | +这里先以一个例子解释一下架构、核、处理器和芯片之间的特征:S3C2440,这是一款SoC芯片,注意,它不是cpu。 |
| 19 | +2440和我们熟知的51单片机有点类似,都属于嵌入式,嵌入式的发展到目前经历了三个阶段,分别是SCM、MCU、SoC。 |
| 20 | +51属于SCM或MCU,而2440就属于SoC了,先来看看51单片机的内部结构。 |
| 21 | + |
| 22 | + |
| 23 | + |
| 24 | +其内部结构可以简单的分成两部分:cpu和外设。 |
| 25 | + |
| 26 | +**我们再看一下再来看2440的内部结构:** |
| 27 | + |
| 28 | + |
| 29 | + |
| 30 | +arm920t就是它的处理器,处理器和核在我看来在这里是一个概念,只不过一个是硬概念,一个是软概念。这里的920t就既是处理器又是核。而三星做的就是除了这个cpu外其他的东西。 |
| 31 | + |
| 32 | +## RM版本系列 |
| 33 | + |
| 34 | +**ARM版本Ⅰ:V1版架构。** |
| 35 | + |
| 36 | +该版架构只在原型机ARM1出现过,只有26位的寻址空间,没有用于商业产品。 |
| 37 | + |
| 38 | +**其基本性能有:** |
| 39 | + |
| 40 | +- 基本的数据处理指令(无乘法); |
| 41 | +- 基于字节、半字和字的Load/Store指令; |
| 42 | +- 转移指令,包括子程序调用及链接指令; |
| 43 | +- 供操作系统使用的软件中断指令SWI; 寻址空间:64MB(226)。 |
| 44 | + |
| 45 | +**ARM版本Ⅱ: V2版架构** |
| 46 | + |
| 47 | +该版架构对V1版进行了扩展,例如ARM2和ARM3(V2a)架构。包含了对32位乘法指令和协处理器指令的支持。 版本2a是版本2的变种,ARM3芯片采用了版本2a,是第一片采用片上Cache的ARM处理器。同样为26位寻址空间,现在已经废弃不再使用。 |
| 48 | + |
| 49 | +**V2版架构与版本V1相比,增加了以下功能:** |
| 50 | + |
| 51 | +- 乘法和乘加指令; |
| 52 | +- 支持协处理器操作指令; |
| 53 | +- 快速中断模式; |
| 54 | +- SWP/SWPB的最基本存储器与寄存器交换指令; |
| 55 | +- 寻址空间:64MB。 |
| 56 | + |
| 57 | +**ARM版本Ⅲ : V3版架构** |
| 58 | + |
| 59 | +ARM作为独立的公司,在1990年设计的第一个微处理器采用的是版本3的ARM6。它作为IP核、独立的处理器、具有片上高速缓存、MMU和写缓冲的集成CPU。 变种版本有3G和3M。版本3G是不与版本2a向前兼容的版本3,版本3M引入了有符号和无符号数乘法和乘加指令,这些指令产生全部64位结果。 |
| 60 | + |
| 61 | +**V3版架构( 目前已废弃 )对ARM体系结构作了较大的改动:** |
| 62 | + |
| 63 | +- 寻址空间增至32位(4GB); |
| 64 | +- 当前程序状态信息从原来的R15寄存器移到当前程序状态寄存器CPSR(Current Program Status Register)中; |
| 65 | +- 增加了程序状态保存寄存器SPSR(Saved Program Status Register); |
| 66 | +- 增加了两种异常模式,使操作系统代码可方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常; |
| 67 | +- 增加了MRS/MSR指令,以访问新增的CPSR/SPSR寄存器; |
| 68 | +- 增加了从异常处理返回的指令功能。 |
| 69 | + |
| 70 | +**ARM版本Ⅳ : V4版架构** |
| 71 | + |
| 72 | +V4版架构在V3版上作了进一步扩充,V4版架构是目前应用最广的ARM体系结构,ARM7、ARM8、ARM9和StrongARM都采用该架构。 V4不再强制要求与26位地址空间兼容,而且还明确了哪些指令会引起未定义指令异常。 |
| 73 | + |
| 74 | +**指令集中增加了以下功能:** |
| 75 | + |
| 76 | +- 符号化和非符号化半字及符号化字节的存/取指令; |
| 77 | +- 增加了T变种,处理器可工作在Thumb状态,增加了16位Thumb指令集; |
| 78 | +- 完善了软件中断SWI指令的功能; |
| 79 | +- 处理器系统模式引进特权方式时使用用户寄存器操作; |
| 80 | +- 把一些未使用的指令空间捕获为未定义指令 |
| 81 | + |
| 82 | +**ARM版本Ⅴ : V5版架构** |
| 83 | + |
| 84 | +V5版架构是在V4版基础上增加了一些新的指令,ARM10和Xscale都采用该版架构。 |
| 85 | + |
| 86 | +**这些新增命令有:** |
| 87 | + |
| 88 | +- 带有链接和交换的转移BLX指令; |
| 89 | +- 计数前导零CLZ指令; |
| 90 | +- BRK中断指令; |
| 91 | +- 增加了数字信号处理指令(V5TE版); |
| 92 | +- 为协处理器增加更多可选择的指令; |
| 93 | +- 改进了ARM/Thumb状态之间的切换效率; |
| 94 | +- E—增强型DSP指令集,包括全部算法操作和16位乘法操作; |
| 95 | +- J----支持新的JAVA,提供字节代码执行的硬件和优化软件加速功能。 |
| 96 | + |
| 97 | +**ARM版本Ⅵ : V6版架构** |
| 98 | + |
| 99 | +V6版架构是2001年发布的,首先在2002年春季发布的ARM11处理器中使用。在降低耗电量地同时,还强化了图形处理性能。通过追加有效进行多媒体处理的SIMD(Single Instruction, Multiple Data,单指令多数据 )功能,将语音及图像的处理功能提高到了原型机的4倍。 |
| 100 | + |
| 101 | +**此架构在V5版基础上增加了以下功能:** |
| 102 | + |
| 103 | +- THUMBTM:35%代码压缩; |
| 104 | +- DSP扩充:高性能定点DSP功能; |
| 105 | +- JazelleTM:Java性能优化,可提高8倍; |
| 106 | +- Media扩充:音/视频性能优化,可提高4倍 |
| 107 | + |
| 108 | +**ARM版本ⅤⅡ:V7版架构** |
| 109 | + |
| 110 | +V7架构是在ARMv6架构的基础上诞生的。该架构采用了Thumb-2技术,它是在ARM的Thumb代码压缩技术的基础上发展起来的, 并且保持了对现存ARM解决方案的完整的代码兼容性。 |
| 111 | + |
| 112 | +Thumb-2技术比纯32位代码少使用31%的内存,减小了系统开销。同时能够提供比已有的基于Thumb技术的解决方案高出38%的性能。 |
| 113 | + |
| 114 | +ARMv7架构还采用了NEON技术,将DSP和媒体处理能力提高了近4倍 , 并支持改良的浮点运算, 满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。此外,ARMv7还支持改良的运行环境,以迎合不断增加的JIT(Just In Time)和DAC(DynamicAdaptive Compilation)技术的使用。 |
| 115 | + |
| 116 | +**ARM版本ⅤⅢ:V8版架构** |
| 117 | + |
| 118 | +这是一个新的IP核,针对高性能的嵌入式信号处理应用而设计的,v8架构是在32位ARM架构上进行开发的,将被首先用于对扩展虚拟地址和64位数据处理技术有更高要求的产品领域,如企业应用、高档消费电子产品。 |
| 119 | + |
| 120 | +ARMv8架构包含两个执行状态:AArch64和AArch32。AArch64执行状态针对64位处理技术,引入了一个全新指令集A64;而AArch32执行状态将支持现有的ARM指令集。 |
| 121 | + |
| 122 | +目前的ARMv7架构的主要特性都将在ARMv8架构中得以保留或进一步拓展,如:TrustZone技术、虚拟化技术及NEON advanced SIMD技术,等。 |
| 123 | + |
| 124 | + |
| 125 | + |
| 126 | +其中左侧的就是架构,右侧的是处理器,也可以叫核。arm首个最成功的cpu是ARM7TDMI,是基于ARMv4的。ARM架构包含了下述RISC特性: |
| 127 | + |
| 128 | +- 读取/储存 架构 |
| 129 | +- 不支援地址不对齐内存存取(ARMv6内核现已支援) |
| 130 | +- 正交指令集(任意存取指令可以任意的寻址方式存取数据Orthogonal instruction set) |
| 131 | +- 大量的16 × 32-bit 寄存器阵列(register file) |
| 132 | +- 固定的32 bits 操作码(opcode)长度,降低编码数量所产生的耗费,减轻解码和流水线化的负担。 |
| 133 | +- 大多均为一个CPU周期执行。不同版本的架构会有所调整。 |
| 134 | + |
| 135 | +和三星相同的其他和arm合作的各大厂商通常会把它的CPU和各类外围IP都放到一起,然后自己拿着图纸去流片,生产出来的也是一个正方形,下面有很多引脚,这个东西不仅包含了CPU,还包含了其他的控制器,这个东西就叫做SOC(system on chip)。从英文来看,所谓的四核SOC什么的,本意就不是单指CPU,而是四核系统。 |
| 136 | + |
| 137 | +所以目前各大厂商所做的事情,就是买来ARM的授权,得到ARM处理器的源代码,而后自己搞一些外围IP(或者买或者自己设计),组成一个SOC后,去流片。不同的SOC,架构不同(就是CPU如何和IP联系起来,有的以总线为核心,有的以DDR为核心),所以,海思是拥有自主产权的SOC架构。可是,无论任何厂商,再怎么折腾,都没有怎么动过CPU,ARM核心就好好的呆在那里,那就是中央处理器。 |
| 138 | + |
| 139 | + |
| 140 | + |
| 141 | +**理器** |
| 142 | + |
| 143 | +- ARM Cortex-A :为传统的、基于虚拟存储的操作系统和应用程序而设计,支持 ARM、Thumb 和 Thumb-2 指令集; |
| 144 | +- ARM Cortex-R:针对实时系统设计,支持 ARM、Thumb 和 Thumb-2 指令集; |
| 145 | +- ARM Cortex-M:为对 价格敏感的产品设计,只支持 Thumb-2 指令集。 |
| 146 | + |
| 147 | +## ARM命名规则 |
| 148 | + |
| 149 | +第一个数字:系列名称:eg.ARM7、ARM9 |
| 150 | + |
| 151 | +第二个数字:Memory system |
| 152 | + |
| 153 | +```text |
| 154 | +2:带有MMU |
| 155 | +
|
| 156 | +4:带有MPU |
| 157 | +
|
| 158 | +6:无MMU与MPU |
| 159 | +12345 |
| 160 | +``` |
| 161 | + |
| 162 | +第三个数字:Memory size |
| 163 | + |
| 164 | +```text |
| 165 | +0:标准Cache(4-128k) |
| 166 | +
|
| 167 | +2:减小的Cache |
| 168 | +
|
| 169 | +6:可变的Cache |
| 170 | +12345 |
| 171 | +``` |
| 172 | + |
| 173 | +第四个字符: |
| 174 | + |
| 175 | +```text |
| 176 | +T:表示支持Thumb指令集 |
| 177 | +
|
| 178 | +D:表示支持片上调试(Debug) |
| 179 | +
|
| 180 | +M:表示内嵌硬件乘法器(Multiplier) |
| 181 | +
|
| 182 | +I :支持片上断点和调试点 |
| 183 | +
|
| 184 | +E:表示支持增强型DSP功能 |
| 185 | +
|
| 186 | +J :表示支持Jazelle技术,即Java加速器 |
| 187 | +
|
| 188 | +S:表示全合成式 |
| 189 | +``` |
| 190 | + |
| 191 | +---- |
| 192 | + |
| 193 | +版权声明:本文为知乎博主「玩转Linux内核」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 |
| 194 | +原文链接:https://zhuanlan.zhihu.com/p/449582466 |
0 commit comments