可扩展的并发性—满足非阻塞I / O

佚名

2021-03-31 12:47:11

我们如何实现非阻塞I / O来提高应用程序的性能

> Photo by Benjamin Voros on Unsplash

为什么非阻塞IO更具可扩展性？

在几乎所有现代Web应用程序中，我们都有很多I / O。我们与数据库对话并要求记录或插入/更新它们。通常，我们从硬盘访问一些文件，这又是一个I / O操作。

我们正在讨论不同的第三方Web服务，例如OAuth集成或其他功能。如今，许多Web应用程序还以微服务的形式运行，它们必须通过HTTP请求与同一应用程序的其他部分进行对话。

如果您使用Ruby，Python或许多其他语言编写Web应用程序，则默认情况下所有这些与I / O相关的任务都处于阻塞状态，这意味着该过程将等待直到收到响应，然后继续执行程序。

另一方面，Node.js [1]默认情况下正在使用非阻塞I / O。因此，该过程可以继续在其他地方工作，并在请求完成时执行回调或promise。

这使操作系统可以充分利用一个CPU内核。但是，其他编程语言也可以使用非阻塞编程模型吗？

是的！在此博客文章中，我们将讨论如何使用（几乎）非阻塞I / O在Ruby中编写本机事件循环，然后了解如何改进此设计。

简单实现

首先，让我们看一个可行的本机实现：

<code>

def

process_partial_file_input

(data)

end

big_file =

"network/path/big_file.xlsx"

file_handler = open(big_file) files_to_look_after = [file_handler] loop

puts

"(Re)Starting the Event loop"

readable, _writeable = IO.select files_to_look_after, [], [],

readable readable.each

|ready_io|

read_data = ready_io.read_nonblock(

4096

) process_partial_file_input read_data

read_data

rescue

EOFError => e files_to_look_after.reject! {

|file|

file == ready_io }

end

break

files_to_look_after.empty?

end

/<code>

在讨论如何改进此设计之前，让我们简短地讨论IO.select方法，因为这是事件循环的核心。

IO.select

如评论中所述，此方法是跨平台的，可在运行程序的任何地方使用。

它采用的第一个参数是程序要读取的I / O描述符数组（文件描述符，Unix套接字或类似的东西）。

第二个数组仍然是I / O描述符的数组，但这一次它用于可写连接。

第三个数组是错误数组。

最后，最后一个参数是超时。这是该方法阻塞的最长时间。因此，在上面的示例中，我们可以说一个刻度至少为10毫秒，这取决于数据处理所花费的时间。

简单的事件循环的设计讨论

当我们看一下这段代码时，缺点很明显。并发引入的复杂性与业务逻辑纠缠在一起，并且分离很困难。

事件循环知道我们的业务逻辑，因为它立即调用了该方法。我们可以借助可处理所有读/写事件的寄存器来改善此情况。

寄存器可以利用带有两个键的简单哈希来进行读写，然后在其中保存回调。在Ruby中，回调可以是任何块，proc或lambda。同样，一个简单的实现可能看起来像这样：

<code>

class

CallbackRegister

def

initialize

@callbacks = {

read:

[],

write:

[]}

end

def

each

(type, &block)

@callbacks[type].each

|callback|

yield

callback

end

def

push

(callback, type)

@callbacks[type] << callback

end

big_file =

"network/path/big_file.xlsx"

file_handler = open(big_file) files_to_look_after = [file_handler] register = get_callback_register_from_container_manager loop

puts

"(Re)Starting the Event loop"

readable, _writeable = IO.select files_to_look_after, [], [],

readable readable.each

|ready_io|

read_data = ready_io.read_nonblock(

4096

) register.each(

:read

)

|callback|

callback.call(ready_io, read_data)

end

rescue

EOFError => e files_to_look_after.reject! {

|file|

file == ready_io }

end

break

files_to_look_after.empty?

end

/<code>

现在，我们已将业务逻辑与并发逻辑分离。但这仍然会导致回调地狱。

JavaScript曾经有很多这个问题，但是它通过promise以及最近的async await功能解决了这个问题。这样，您可以编写可同时运行的顺序代码。

尽管如此，我们在此设计中还有其他缺点。它仍然使用一组固定的描述符来照料，并且我们没有地方在运行时进行配置。此外，尽管我们可能不希望这样做，但每个回调事件都会收到通知，通知每个回调事件。

我们该如何改善？符合反应堆模式。

反应堆模式

反应器模式是大多数事件循环的基础。它将应用程序逻辑与切换实现完全分开，因此使代码更易于维护和重用。

它由两个主要部分组成：一个事件多路复用器和一个调度程序，并与另外两个一起工作-资源和请求处理程序。

反应器使用单线程事件循环，在事件多路复用器中注册资源，并在事件触发后分派给回调。

从我们的示例中可以看出，这种方式不需要阻塞I / O，因此进程可以最大限度地利用CPU内核。

实作

Ruby中著名的实现是EventMachine，Celluloid和async。 Python也至少有一个很好的实现，即Twisted。 PHP具有ReactPHP，我可以肯定几乎所有其他语言也都具有不错的实现。

缺点

与其他所有内容一样，反应堆也有一些缺点，您必须意识到这些缺点，才能做出明智的决定，即使用这种模式是否对您的用例有意义。

主要的缺点是，如果其中一个贪婪并且将花费大量时间直到完成，它将阻止所有回调。

本质上，反应堆是一种协作并发。如上所述，反应器是单线程的，如果从一个回调中充分利用了CPU，则其他所有操作都必须等待。

另一个限制是，由于逻辑流程不是程序运行的方式，因此难以调试反应堆模式。这也给开发人员带来了更多的麻烦。

从这里开始

对于并发I / O，反应堆模式是最好的选择吗？

实际上，不，仍然有一些方法可以对此进行改进。如上所述，传统的反应器使用多路分解器同步调度事件，并且必须等待回调完成。我们也可以使用前摄器模式使此异步。

如果您仍然需要更高的性能，那就扔硬件吧！在某些时候，这是您最好的选择。而且，如果您需要执行此操作，那么微服务体系结构将派上用场，因为您可以独立扩展应用程序的一小部分。

[1] Node.js只是一个例子，因为这是最常用的平台，默认使用非阻塞I / O。

(本文翻译自Gernot Gradwohl的文章《Scalable Concurrency — Meet Non-Blocking I/O》，参考：
https://medium.com/better-programming/scalable-concurrency-meet-non-blocking-i-o-edb6b39c59d7)

为什么非阻塞IO更具可扩展性？

简单实现

IO.select

简单的事件循环的设计讨论

反应堆模式

实作

缺点

从这里开始

相關文章:

Java并发 -- 并发容器

面试官问：高并发下，你都怎么选择最优的线程数？

每年那么多人猝死，其实很多都是心梗，身上出现这3处疼痛要警惕

电子战：全频带阻塞干扰

案例！生活和金钱上的困境，我该怎么克服？

心肌梗死自救指南

视力杀手，糖尿病引发，眼底三患，眼底病知识你了解多少

突发！台湾货轮堵了苏伊士运河

80岁爹爹脸肿脖子粗，就医才知拳头大肿瘤已“爬进”上腔静脉

面试：请你谈谈关于IO同步、异步、阻塞、非阻塞的区别

牛急性瘤胃鼓气，腹胀，怎么样第一时间急救？

背痛却查出肺癌早期？这4个异常或许也是早期信号，请引起重视

15秒记住obstruct

毛孔粗大丑3度！皮肤科医生：教你3招，平滑橘子皮养成蛋清肌

打通“毛细血管”阻塞 城区路网建设再提速，无锡在行动

一文详解操作系统进程管理

打呼噜太响！老婆分房睡，专家教你1个办法解决烦恼

面膜怎么敷，圣欧丽开课了，请认真收藏

SynchronousQueue 源码解析

避免宝宝窒息，家长一定要注意这3件事

服务器性能优化的8种常用方法

Linux系统编程—信号集操作函数

腋下淋巴按摩，帮身体排废物消除肩颈痛

不吸烟，没咳嗽，怎么偏偏是肺癌？专家：人们生活中经常会暴露在导致肺癌的环境中，但完全没意识到这种危险

糟了，银行线上跑了一年的代码出问题了

中年男性一侧肢体无力，3天后做核磁，医生说来的太晚了

如何快速入门Netty？收藏这一篇就够了，大厂程序员人手必备

【守护光明】高考备考季，不要因为视力问题被拒之门外！

java多线程：线程池原理、阻塞队列

突击并发编程JUC系列-万字长文解密 JUC 面试题

打呼噜是“小问题”，却会造成大麻烦，你知道它的常见病因吗？

MySQL中存储引擎MyISAM表锁中的读锁和写锁详细案例介绍

BIO、NIO、AIO 介绍和适用场景分析

高并发服务器IO模型

事件驱动编程

面试过程的小问题小问答，我问你答^

性激素、精液、排卵都正常就是不怀孕？很可能输卵管出了问题

IO模型分析

腿部动脉阻塞导致双脚发黑险截肢，医生：打通血管就没事！

嵌入式Linux系统编程——你真的懂线程吗，linux大神进修课！

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

打通“毛细血管”阻塞城区路网建设再提速，无锡在行动

应急科普丨“五一” 期间气温回升谨防森林火灾隐患