博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
对超线程几个不同角度的解释
阅读量:6404 次
发布时间:2019-06-23

本文共 2247 字,大约阅读时间需要 7 分钟。

角度1:举个栗子

假设我是一个CPU,我现在需要process(吃)一些食物,我现在只有一张嘴。

假如我有多张嘴,肯定就可以process更多的食物。这就是multi-core processor所要想要完成的任务。但是由于某些原因及限制,有时候无法实现这种方式。

我只有一张嘴,我可以用手抓一片食物,送到嘴边,然后在嘴busy的时候,抓起下一片食物,继续送到嘴边。如果出现这种情况:当我的嘴已经吃完那一片食物了,这个时候手还没有将食物送到嘴边,这时候我的嘴就处于空闲状态。假如我有两只手,即使我的嘴并不能吃得更快,但我的嘴也不需要浪费任何时间,可以一直处于busy的状态。这就是hype-threading(超线程),一个processor,然后加上很智能的调度系统,使得processor可以一直处于busy的状态。

超线程对单线程的任务,也就是后面一部分任务必须依赖于前面一部分任务,并没有太大作用。

比如你要吃一个两勺冰淇淋锥,你必须先吃掉上面的部分,然后才能吃下面的部分。在这种情况下,增加更多的嘴或者手,都是没有什么意义的。

与之相反的,吃很多糖果。吃红色的糖和吃蓝色的糖之间,是没有任何先后关系的。如果现在我有多张手、多张嘴,肯定是可以更多吃完这糖果的。

在现实生活中,受益于超线程和多核处理器的常见任务有:

  • 编辑视频
  • 3D渲染
  • 繁重的多线程任务

比如编辑视频,视频是一帧一帧的,完全可以在编辑这一帧的时候同时编辑另外一帧。

总结一下:超线程的目的,就是使得processor busy,充分利用CPU资源。所以,超线程并没有他名字听上去那么神奇,

角度2:超线程之于CPU的意义

首先需要理清楚CPU核core的关系:

上面这张图一图胜千言,CPU(processor)是一个物理上的小盒子,里面在物理上又分为多个core,每个core在功能上市独立的,可以独立运行自己的线程。不同的core之间共享一个3级缓存、共享common bus。相比多CPU单核,单CPU多核的优势在于不同的core之间可以共享一部分资源,之间通信也要相对容易很多;缺点在于复杂度提升,因为共享自然就会牵涉到不同线程之间的协调、管理、锁等问题。

超线程是intel开发的,已经有10多年的历史了,它可以在同一时刻,执行两个线程,从而提高了单个CPU core的效率。如下图所示:

来简略看一下CPU的发展阶段: 刚开始,一个CPU只有一个core,一个CPU只能同时运行一个线程:

接着,CPU设计师开始往一个CPU里面添加更多的core,现在一个CPU就可以同时运行多个线程了:

为了进一步提高CPU的性能,Intel又发明了超线程。超线程把一个物理的core,在逻辑上分成了两个虚拟核(two virtual cores)。现在,在操作系统的眼里,这个2核CPU实际上就是一个4核CPU了。

在操作系统眼里,现在CPU有4个核,她可以把工作分摊给这4个(虚拟的)核。每个core都可以独立地执行指令。 总结一下:超线程就是提高虚拟核的一种手段,减少了CPU处于空闲状态的时间。

角度3:超线程是如何实现的

我们还是从最开始、最简单的说起。

首先是单核CPU,树莓派使用的就是单核CPU,但是树莓派依然可以运行多任务的linux系统。为什么呢?实际上在底层,操作系统在不停地切换不同的任务,速度之快到让你觉得他们是真的同时运行的。

然后是多核CPU,如上所说的,不同的core之间在逻辑上是独立的,他们会共享一些资源。操作系统就可以给不同的core分发不同的任务,如果你要运行一个多线程的任务,你拥有的core越多,速度就会越快。

再然后就是超线程了。要在一个core上面实现两个线程,那么这个core该怎么设计呢?

把一个core的前半部分复制一下,然后合在一起,再和后半部分拼接一下,这种情况下,我们就有了一个可以同时执行两个线程的FRONTEND,或者以一个程序员更容易理解的角度来说,有了一个可以执行双线程的api接口,对于操作系统来说,他可以"调用"这个接口,同时分两个任务给这个core!这样不就在一个core的基础上实现了双线程吗?(当然,在最后,这两个线程最终是需要合并的。)

把这种core组合一下,就成了多核CPU,且每个CPU都支持超线程技术。

接着再来看一个现实生活中的栗子:地铁过安检。

排了有两个队,但是只有一个安检员。分三种情况讨论:

  • 对面那队是空的,这种情况下我这一对可以很快通过。
  • 对面那队阻塞了,这对我这一队没有影响,我们可以不受影响地通过。
  • 两队都是正常的,这个时候在安检员那儿,就会产生竞争核堵塞。

把队伍换成前面说的两个FRONTEND接口,把安检员当作是core,每个接口都能独立得fetch指令,然后把指令传递给core。core在真正执行指令的时候,是会产生竞争的,**所以在性能上来说,一个有超线程能力的单核CPU,是无法和一个双核CPU相比的。**只有当其中一个queue阻塞的时候,才能得到双倍的性能。一般而言,有超线程的核,性能上是没有超线程的核的1.25倍。

那么我们来做一个计算题:一个6核12线程的CPU,和一个8核8线程的CPU,哪一个综合性能要好一点?

  • 6核12线程,也就是6个有超线程能力的物理核,实际上可以相等于6 * 1.25 = 7.5个核
  • 8核8线程,就是8个核

所以,8核8线程的性能还要相对好一点。

关注我的微信公众号

转载地址:http://ptnea.baihongyu.com/

你可能感兴趣的文章
Exchange Server 2013 规划系列之日志容量规划、数据库容量规划
查看>>
职场必读的经典励志故事
查看>>
九爷带你了解 nginx 日志配置指令详解
查看>>
Jenkins 自动化部署上线
查看>>
unittest框架执行用例
查看>>
简述ssl协议及利用openssl创建私有CA
查看>>
React Native——react-navigation的使用
查看>>
“二子乘舟”的故事很难讲
查看>>
Luhn(卢恩)算法,检测信用卡号的合法性
查看>>
邮件服务的基本理论
查看>>
第九章 性能监控诊断
查看>>
RESTful再理解
查看>>
大数据量下的集合过滤—Bloom Filter
查看>>
Wannafly挑战赛9
查看>>
《企业云桌面实施》-小技巧-02-使用ISO光驱安装esxi6.5
查看>>
Python从菜鸟到高手(4):导入Python模块
查看>>
实战:Windows 2008 WDS使用参考计算机创建安装映像
查看>>
利用缓存来提高网站的性能(Caching to Improve the Performance of Your Website )
查看>>
Android应用程序注册广播接收器(registerReceiver)的过程分析
查看>>
对代理ARP技术的误读、无法完成代理ARP实验的故障分析
查看>>