多核的CPU可以运行一个进程下的多个线程吗?

Gingai-K


如果想弄清楚多核CPU如何运行,以及线程与进程的概念,需要回顾一下计算机软硬件的知识。我们从早期单核CPU开始。

早期单核CPU架构

早期的电路设计能力不支持一个CPU有多核,比较经典的架构如上图所示。

一个单核CPU的架构包括:

  • Control Unit(CU)起协调管理功能。
  • Arithmetic Logic Unit(ALU)接受控制单元的命令,负责进行加减乘与或非运算。所有数据都存放在寄存器(Register)里。
  • 寄存器以极高的速度与CU和ALU交互,通常小于1纳秒。从寄存器的名字可以看出来,里面的数据是临时寄存的,这些数据和指令会被ALU和CU拿来立即进行计算。如果寄存器没有CPU想要的数据,CPU会去内存或硬盘中读取。
  • CPU通过Bus(总线)读取内存或其他设备的数据。计算机中有多条总线。

我们以一个加法运算来解释上面这些概念。对于一个2 + 2的加法,人类可以直接说出答案,但是换成13234 + 87912,就不得不拿出纸和笔来算一下了。计算机对这两次计算速度没有差别,其本质为半导体电路对两个数字执行加法操作。但与人类不同的是,计算机需要知道两个问题:

  1. 本次所执行的是哪个指令。
  2. 该指令的执行对象是什么。

因此,控制单元先取指令 Fetch,然后指令译码 Decode解析出要执行什么指令,并确认指令是对哪些数据(操作数 operand)进行操作,并将操作数从主存加载到寄存器中。ALU执行指令 Execute后结果写回 Store。

多核

当单个CPU主频超过一定范围后,CPU成本和散热成了很大的问题,主频很难突破10GHz。为了获得更快的计算速度和更好的性能,芯片设计者决定绕过主频,采用人海战术,在一块CPU中增加多个核心(Core)。

一个核心是一个可以运行指令的独立单元,它包含了前面所提到的ALU和寄存器,并配备L1和L2 Cache。多个核心共享L3 Cache。

上图中是一个多核处理器的电路图,每个Core旁边的黑色圆圈分别为L1和L2 Cache。可以看到CPU中,各类Cache占用了很大的空间。

个人电脑上的CPU一般是单个Processor,每个Processor有多个Core。服务器上的CPU是多个Processor,每个Processor有多个Core,提供更多计算核心。支持单个CPU的服务器被称为单路服务器,支持两个CPU的服务器被称为双路服务器,支持四个CPU的服务器被称为四路服务器。上图展示了Intel的四路架构,系统支持四个CPU,假如每块CPU内有8个核心,系统可对外提供32核计算能力。

存储金字塔

要了解计算机的运行原理,除了CPU,我们还要聊聊内存。随着技术的发展,计算机的速度瓶颈已经变成了超高速的CPU运算速度与落后的数据读取速度之间的矛盾。CPU计算速度在纳秒级别,但是CPU读取主存的速度竟有百纳秒,CPU进行完计算后,要闲置几十倍的时间,实在是巨大的浪费。从计算本身来说,某个程序一般不需要把硬盘或主存中的所有数据都拿来进行计算,绝大多数时间只需要处理部分热点数据,因此,把热点数据加载到缓存中能解决绝大多数问题。综合计算速度、技术水平、生产成本,设计人员给CPU增加了很多中间的缓存Cache。

CPU的寄存器存取速度极快,但是造价成本太高,发热量大,不能被大量采用。通常,CPU的寄存器只有几KB。L1 Cache和L2 Cache一般设计在CPU上,访问延迟在几纳秒只几十纳秒内,主存的访问延迟在百纳秒内。速度越快,意味着成本越高。所以硬件设计是在现有技术水平、期望计算速度、成本、散热等因素之间所做的trade-off。

线程与进程

前面都是计算机硬件知识,而线程和进程则是操作系统控制这些硬件而创造的软件概念。

进程(Process)具有单独的计算资源,如内存空间。

线程(Thread)是进程的一个子集,一个进程默认启动一个线程,也可以通过多线程编程,启动多个线程,多个线程共享共享进程的资源。

在多核架构出现之前,CPU在某个特定时刻只能执行某个程序,无法并行。就像人在某个时刻只能做一件事情,不可能“吃着火锅还唱着歌”,因为两项活动都占着嘴呢嘛。如果要干另一件事,就必须把其中一件事停下来。

但是前面提到,CPU计算速度是纳秒级别,内存读写却是百纳秒,那么为了充分利用CPU,可以把多项任务的数据都放在缓存里。CPU先“吃会火锅”,再“唱会歌”,边吃边唱,以这种形式实现多线程。单个CPU每次切换不同的线程任务,会产生一些资源开销。吃饭和唱歌之间,总要让人稍微歇歇嘛!

以网页浏览器为例,浏览器打开一个网页时通常需要下载网页中素材,同时也要把数据渲染成画面。在单核场景下,时间被切成了不同的片段,某段时间只能用来做渲染、缓存或下载中的一项任务。每个任务都有优先级,CPU优先执行高优先级的任务。比如,浏览器打开一个新网页时,要第一时间把网页展示出来,背景音乐下载比较慢,可以等网站渲染好后再下载,所以有时候背景音乐会比网页晚半分钟甚至更长。

多核架构提供给用户多个可以独立计算的核心,这也意味着计算机可以同时并行执行多项任务,即并行计算。那么一个网页浏览器使用一个核渲染网页,另一个核缓存其他素材,第三个核下载背景音乐。

上图是我的macOS性能监控的一个软件(htop),Windows上类似的软件是任务管理器。图片绿色横条上方展示了当前8个CPU核的利用率内存利用率,绿色横条下方是我启动的多个进程,其中标蓝色的是我的Chrome浏览器的进程,我还启动了Photoshop等软件。

多核CPU可以运行一个进程里的多个线程吗?当然可以,这需要编程时使用多线程技术。


皮皮鲁的AI星球


目前大多数操作系统不能,通俗的解释很容易,游戏界有句名言,一核打价多核围观。比如amd因为核心比Intel多所以多核性能强,Intel单核性能强。但是玩游戏双核心i3能秒8核心的推土机。就因为一个进程只能跑在一个核。传统游戏就一个进程,新的游戏会拆分成多个进程,绝大多数游戏目前是2个。几乎没2个以上的。


爱米先生


多核心处理器相当于多处理器。目前只有服务器操作系统上的很多程序和桌面版操作系统上少量的应用程序(如PS)支持多核心或多处理器并行计算,也就是多进程。

超线程处理器才是解决单进程多线程应用程序计算效率的技术。但是处理器效率又受到自身频率、缓存、内存以及io性能影响。所以同样外部情况下,单核心超线程处理器在目前的大多数应用环境下,比双核心处理器性能好。

多核心和多处理器不能解决多线程问题。而且多线程其实还是顺序执行,只是利用了指令运行之间由io或其他因素造成的时间空隙,去处理其他线程的处理请求。这两者的理论是不一样的。


果儿科技


完全可以,linux下设置线程的CPU affinity(亲和性)就行。


分享到:


相關文章: