168
备注:
|
3883
|
删除的内容标记成这样。 | 加入的内容标记成这样。 |
行号 1: | 行号 1: |
Amdahl定律: 总加速时间=原来执行时间/新的执行时间=1/( (1-增强比例)+增强比例/增强加速比 ) |
基本原理 体系结构的发展 |
行号 4: | 行号 4: |
CPU时间=IC*CPI*时钟周期的长度 | 成本、价格 集成电路成本 评价性能 量化准则 加快经常性事件的速度 Amdahl定律: 总加速比 = 原来执行时间/新的执行时间 = 1/( (1-增强部分比例) 增强部分比例/增强部分加速比 ) CPU性能公式 CPI:每条指令执行所需要的时钟周期数。CPI = 一个程序的CPU时钟周期数 / 该程序的指令数IC CPU时间 = 一个程序的CPU时钟周期数 * 时钟周期长度 = 指令数IC * 每指令时钟周期数CPI * 时钟周期的长度 MIPS = 指令数 / (指令的执行时间 * 1M) = 时钟频率 / (CPI * 1M) 局部性原理 程序经常会重复使用它最近使用过的指令和数据。经验规律指出程序有90%的执行时间执行的是其10%的代码。 利用并行性 性价比 功耗与效率 谬误和易犯错误 指令集原理 指令集系统结构分类 堆栈系统结构 累加器系统结构 通用寄存器系统结构 寄存器-寄存器结构:简单、定长的指令编码,简单的代码生成模式,每条指令运行所需的时钟周期相近。一个程序的指令数量比可以直接访问存储器的系统结构多;指令多、指令密度低使程序变大 ---- /!\ '''Edit conflict - other version:''' ---- 寄存器-存储器结构:数据不需要专门的载入指令就可以直接访问;指令格式更易于程序员编码;代码密度高。操作数位置不同使每条指令的执行时钟周期不同;同一条指令内对内存地址和寄存器编码,限制了寄存器的数量;源操作数在二元操作中被破坏,操作数不是等价的。 存储器存储器结构:最紧凑;不浪费寄存器来做临时交换空间。指令长短各不相同;每条指令的操作各不相同;内存访问带来存储器瓶颈。 内存寻址 操作数的大小与类型 指令集的操作 控制流指令 指令集编码 MIPS系统结构 Trimedia TM32结构 谬误和易犯的错误 ---- /!\ '''Edit conflict - your version:''' ---- 寄存器-存储器结构:数据不需要专门的载入指令就可以直接访问;指令格式更易于程序员编码;代码密度高。操作数位置不同使每条指令的执行时钟周期不同;同一条指令内对内存地址和寄存器编码,限制了寄存器的数量;源操作数在二元操作中被破坏,操作数不是等价的。 存储器存储器结构:最紧凑;不浪费寄存器来做临时交换空间。指令长短各不相同;每条指令的操作各不相同;内存访问带来存储器瓶颈。 内存寻址 操作数的大小与类型 指令集的操作 控制流指令 指令集编码 MIPS系统结构 Trimedia TM32结构 谬误和易犯的错误 ---- /!\ '''End of edit conflict''' ---- 指令级并行 反相关(Antidependence):由名字重复使用造成的相关,它与先读后写(WAR)冲突对应。 * 记分板调度 * 寄存器重命名 * Tomasulo调度 软件方法 * 循环展开 * 软件流水 * 路径调度 * 超级块调度 存储器层次结构设计 降低cache缺失率 增加块大小 增加cache容量 增加相联度 路预测和伪相联cache 编译优化 多处理器和线程级并行 存储系统 互联网络和集群 集群 缺点 优势 可靠性和可扩展性 价格 google集群实例 参考资料 John Hennessy, David Patterson, Computer Architecture: A Quantitative Approach (3rd Edition) |
基本原理
- 体系结构的发展 成本、价格
- 集成电路成本
- 加快经常性事件的速度 Amdahl定律: 总加速比 = 原来执行时间/新的执行时间 = 1/( (1-增强部分比例) 增强部分比例/增强部分加速比 ) CPU性能公式
- CPI:每条指令执行所需要的时钟周期数。CPI = 一个程序的CPU时钟周期数 / 该程序的指令数IC CPU时间 = 一个程序的CPU时钟周期数 * 时钟周期长度 = 指令数IC * 每指令时钟周期数CPI * 时钟周期的长度 MIPS = 指令数 / (指令的执行时间 * 1M) = 时钟频率 / (CPI * 1M)
- 程序经常会重复使用它最近使用过的指令和数据。经验规律指出程序有90%的执行时间执行的是其10%的代码。
指令集原理
- 指令集系统结构分类
- 堆栈系统结构 累加器系统结构 通用寄存器系统结构
- 寄存器-寄存器结构:简单、定长的指令编码,简单的代码生成模式,每条指令运行所需的时钟周期相近。一个程序的指令数量比可以直接访问存储器的系统结构多;指令多、指令密度低使程序变大
- 堆栈系统结构 累加器系统结构 通用寄存器系统结构
Edit conflict - other version:
- 寄存器-存储器结构:数据不需要专门的载入指令就可以直接访问;指令格式更易于程序员编码;代码密度高。操作数位置不同使每条指令的执行时钟周期不同;同一条指令内对内存地址和寄存器编码,限制了寄存器的数量;源操作数在二元操作中被破坏,操作数不是等价的。 存储器存储器结构:最紧凑;不浪费寄存器来做临时交换空间。指令长短各不相同;每条指令的操作各不相同;内存访问带来存储器瓶颈。
- 内存寻址 操作数的大小与类型 指令集的操作 控制流指令 指令集编码 MIPS系统结构 Trimedia TM32结构 谬误和易犯的错误
Edit conflict - your version:
- 寄存器-存储器结构:数据不需要专门的载入指令就可以直接访问;指令格式更易于程序员编码;代码密度高。操作数位置不同使每条指令的执行时钟周期不同;同一条指令内对内存地址和寄存器编码,限制了寄存器的数量;源操作数在二元操作中被破坏,操作数不是等价的。 存储器存储器结构:最紧凑;不浪费寄存器来做临时交换空间。指令长短各不相同;每条指令的操作各不相同;内存访问带来存储器瓶颈。
- 内存寻址 操作数的大小与类型 指令集的操作 控制流指令 指令集编码 MIPS系统结构 Trimedia TM32结构 谬误和易犯的错误
End of edit conflict
指令级并行
- 反相关(Antidependence):由名字重复使用造成的相关,它与先读后写(WAR)冲突对应。
- 记分板调度
- 寄存器重命名
- Tomasulo调度
软件方法
- 循环展开
- 软件流水
- 路径调度
- 超级块调度
存储器层次结构设计
- 降低cache缺失率
- 增加块大小 增加cache容量 增加相联度 路预测和伪相联cache 编译优化
多处理器和线程级并行
存储系统
互联网络和集群
- 集群
- 缺点 优势
- 可靠性和可扩展性
- 缺点 优势
参考资料
- John Hennessy, David Patterson, Computer Architecture: A Quantitative Approach (3rd Edition)