Golang应付百万级请求

2020-03-12 17:41:12 Echa攻城獅

热烈欢迎你进来，Echa哥奉献go的学习资料《》

我在不同公司从事反爬虫、反病毒、反恶意程序已经有15年了，我知道，由于每天需要处理和应对的大量数据，这些系统最终会因此变得十分复杂。

目前我是smsjunk.com的CEO以及KnowBe4的首席架构师，两家公司都是活跃与网络安全行业。

有趣的是在过去10年作为一名软件工程师，几乎所有我参与的后端开发项目里面都是用Ruby on Rails来完成的。可是你不要误会，我热爱Ruby on Rails并且我认为它是一个非常出色的开发环境，但当你用ruby的思路在设计和开发系统一段时间以后，你往往会忘记，其实你还可以利用多线程，并行化，高速执行以及更小的内存开销来开发系统。我是一名c/c++,Delphi以及c#的开发人员已经很多年了，然后我开始慢慢意识到，使用合适的工具让系统变得更加简单明了才是一件正确的事情。

编程界对于编程语言以及框架的争论从未停歇，而我并不想参与到其中去。我相信效率高低，生产力大小以及代码的可维护性很大一部分取决于你所设计的架构是否足够简单。

要解决的问题

当我们开发一个匿名遥测以及数据分析系统的时候，其中一个需求是能够处理和应付百万数量级的POST请求，网络请求处理器会接收一个POST过来JSON，这个JSON里面会包含许多需要写入到Amazon S3的数据集合，以便我们的map-reduce系统可以在后续来处理这些数据。

一般情况下我们会考虑构建一个worker分层的结构，并且利用一些中间件，例如：

Sidekiq
Resque
DelayedJob
Elasticbeanstalk Worker Tier
RabbitMQ
等等..

然后设立两个不同的集群，一个是给web客户端，另一个是给worker，然后我们可以将worker扩容到我们处理业务时所需要的数量。

但在最开始的时候，我们的团队就意识到可以用Go来实现所有这些，因为在讨论期间我们认为这将会是一个非常高访问量的系统。我利用Go来开发也已经有两年了，用它来开发过一些系统，但是负载规模远没有此次的需求这么大。

我们先定义一些struct来规定我们POST接收的请求体，以及定义一个上传到S3 bucket的方法UploadToS3

<code>type PayloadCollection struct {
\tWindowsVersion  string    `json:"version"`
\tToken           string    `json:"token"`
\tPayloads        []Payload `json:"data"`
}

type Payload struct {
    // [redacted]
}

func (p *Payload) UploadToS3() error {
\t// the storageFolder method ensures that there are no name collision in
\t// case we get same timestamp in the key name
\tstorage_path := fmt.Sprintf("%v/%v", p.storageFolder, time.Now().UnixNano())

\tbucket := S3Bucket

\tb := new(bytes.Buffer)
\tencodeErr := json.NewEncoder(b).Encode(payload)
\tif encodeErr != nil {
\t\treturn encodeErr
\t}

\t// Everything we post to the S3 bucket should be marked 'private'
\tvar acl = s3.Private
\tvar contentType = "application/octet-stream"

\treturn bucket.PutReader(storage_path, b, int64(b.Len()), contentType, acl, s3.Options{})
}
复制代码/<code>

幼稚地使用Go runtines

最开始的时候我们非常天真地实现一个POST的钩子方法如下，只是简单地将每个请求体的上传动作放到Go rutinues中让他们并行执行：

<code>func payloadHandler(w http.ResponseWriter, r *http.Request) { 


\tif r.Method != "POST" {
\t\tw.WriteHeader(http.StatusMethodNotAllowed)
\t\treturn
\t}

\t// Read the body into a string for json decoding
\tvar content = &PayloadCollection{}
\terr := json.NewDecoder(io.LimitReader(r.Body, MaxLength)).Decode(&content)
\tif err != nil {
\t\tw.Header().Set("Content-Type", "application/json; charset=UTF-8")
\t\tw.WriteHeader(http.StatusBadRequest)
\t\treturn
\t}
\t
\t// Go through each payload and queue items individually to be posted to S3
\tfor _, payload := range content.Payloads {
\t\tgo payload.UploadToS3()   // \t}

\tw.WriteHeader(http.StatusOK)
}
复制代码/<code>

在中等规模的负载情况下，这种方法对大部分人都是没有问题的，但在应对更大规模的请求量时候，我们很快就招架不住了。当我们把这个版本的代码部署到生产环境以后，我们期待能有大量的请求进来但实际还不能达到百万级别的数量级。我们完全低估了这个系统要处理的流量数。

但不管怎么说上面的方法都是欠妥的。因为它没有任何方法让我们去控制Go runtinues启动的数量。所以当我们的系统在面对每分钟百万级POST请求的时候很快就垮掉了。

再战

我们需要找到另外的方法。在一开始我们就在讨论如何让我们的请求处理程序的生命周期尽可能地缩短以及上传到S3的操作能在后台或者异步运行。当然，在Ruby on Rails里面你必须这么做，否则你将会阻塞到所有其他的网络请求处理程序。无论您使用的是美洲狮，独角兽还是过路人（请不要参与JRuby讨论）。然后我们想到使用消息队列这种比较常见的方法来处理来达到我们的目的，例如Resque, Sidekiq, SQS等等，还有数不清的工具因为实在有太多方法来实现这个功能。

所以在第二次迭代的时候，我们需要创建一个缓冲队列，我们会将任务放入队列里面然后再一个个地上传到S3上，但由于我们希望达到能够控制这个队列的最大容量的目的，并且我们有足够的RAM来允许我们将请求体储存到内存当中，所以我们认为直接使用了Go提供的channel，然后将我们的请求直接入队到channel中处理就可以了。

<code>var Queue chan Payload

func init() {
   Queue = make(chan Payload, MAX_QUEUE)
}

func payloadHandler(w http.ResponseWriter, r *http.Request) {
   ...
   // Go through each payload and queue items individually to be posted to S3
   for _, payload := range content.Payloads {
       Queue    }
   ...
}
复制代码/<code>

我们会从channel中获取任务并且执行他们的上传操作

<code>func StartProcessor() {
    for {
        select {
        case job :=             job.payload.UploadToS3()  //         }
    }
}
复制代码/<code>

但说句老实话，我并不知道这是在干嘛。肯定是因为那时已经太晚还有我们已经喝了太多的红牛。

这个改动并没有让我们的困境得到任何改善，我们将并发任务放到了队列中执行仅仅是看上去好像解决了问题。但是我们的异步程序一次只会上传一个请求体到S3上面，但是我们的请求数此时远远大于我们上传到S3的数量，可想而知我们的缓冲队列很快就到达了他的极限爆满了，然后它阻挡了其他网络请求的入队操作。

相当于我们仅仅回避了问题，并且让我们的系统的崩溃时间进入了倒数。我们这个缺陷的版本发布以后，整个系统的延迟率在持续性地每分钟在上涨。

更加好的解决办法

我们决定采用协同的方式来改进我们的Go channel，通过建立一个带有2个的channel处理系统，一个用于将请求体入队，另一个是负责控制worker在JobQueue中并发运行时的数量。

这个想法的核心是以一个相对稳定的频率去并行上传数据到S3，这样的话既不会把我们的服务器弄垮，也不会因为连接过多造成很多S3的连接错误。所以我们开始着手于Job/Worker模式。这个对于熟悉Java，c#开发来说并不陌生，你可以理解为这是Go利用channel来实现worker线程池的方法。

<code>var (
\tMaxWorker = os.Getenv("MAX_WORKERS")
\tMaxQueue  = os.Getenv("MAX_QUEUE")
)

// Job represents the job to be run
type Job struct {
\tPayload Payload
}

// A buffered channel that we can send work requests on.
var JobQueue chan Job

// Worker represents the worker that executes the job
type Worker struct {
\tWorkerPool  chan chan Job
\tJobChannel  chan Job
\tquit    \tchan bool
}

func NewWorker(workerPool chan chan Job) Worker { 

\treturn Worker{
\t\tWorkerPool: workerPool,
\t\tJobChannel: make(chan Job),
\t\tquit:       make(chan bool)}
}

// Start method starts the run loop for the worker, listening for a quit channel in
// case we need to stop it
func (w Worker) Start() {
\tgo func() {
\t\tfor {
\t\t\t// register the current worker into the worker queue.
\t\t\tw.WorkerPool 
\t\t\tselect {
\t\t\tcase job := \t\t\t\t// we have received a work request.
\t\t\t\tif err := job.Payload.UploadToS3(); err != nil {
\t\t\t\t\tlog.Errorf("Error uploading to S3: %s", err.Error())
\t\t\t\t}

\t\t\tcase \t\t\t\t// we have received a signal to stop
\t\t\t\treturn
\t\t\t}
\t\t}
\t}()
}

// Stop signals the worker to stop listening for work requests.
func (w Worker) Stop() {
\tgo func() {
\t\tw.quit \t}()
}
复制代码/<code>

接下来修改我们网络请求的钩子函数，负责创建一个Job的结构体的实例然后将其放入JobQueue channel中等待worker来获取执行。

<code>func payloadHandler(w http.ResponseWriter, r *http.Request) {

    if r.Method != "POST" {
\t\tw.WriteHeader(http.StatusMethodNotAllowed)
\t\treturn
\t}

    // Read the body into a string for json decoding
\tvar content = &PayloadCollection{}
\terr := json.NewDecoder(io.LimitReader(r.Body, MaxLength)).Decode(&content)
    if err != nil { 

\t\tw.Header().Set("Content-Type", "application/json; charset=UTF-8")
\t\tw.WriteHeader(http.StatusBadRequest)
\t\treturn
\t}

    // Go through each payload and queue items individually to be posted to S3
    for _, payload := range content.Payloads {

        // let's create a job with the payload
        work := Job{Payload: payload}

        // Push the work onto the queue.
        JobQueue     }

    w.WriteHeader(http.StatusOK)
}
复制代码/<code>

在我们网络服务初始化的时候创建一个Dispather并且调用Run()创建一个装有一定数量worker的线程池，用来接收和处理来自JobQueue的Job

<code>dispatcher := NewDispatcher(MaxWorker) 
dispatcher.Run()
复制代码/<code>

下面是我们Dispather的实现

<code>type Dispatcher struct {
\t// A pool of workers channels that are registered with the dispatcher
\tWorkerPool chan chan Job
}

func NewDispatcher(maxWorkers int) *Dispatcher {
\tpool := make(chan chan Job, maxWorkers)
\treturn &Dispatcher{WorkerPool: pool}
}

func (d *Dispatcher) Run() {
    // starting n number of workers
\tfor i := 0; i < d.maxWorkers; i++ {
\t\tworker := NewWorker(d.pool)
\t\tworker.Start()
\t}

\tgo d.dispatch() 

}

func (d *Dispatcher) dispatch() {
\tfor {
\t\tselect {
\t\tcase job := \t\t\t// a job request has been received
\t\t\tgo func(job Job) {
\t\t\t\t// try to obtain a worker job channel that is available.
\t\t\t\t// this will block until a worker is idle
\t\t\t\tjobChannel := 
\t\t\t\t// dispatch the job to the worker job channel
\t\t\t\tjobChannel \t\t\t}(job)
\t\t}
\t}
}
复制代码/<code>

注意我们限制了worker在线程池的最大数量。我们的应用运行在一个docker化的Go环境中，部署在Amazon的Elasticbeanstalk上，并且尽量遵循12要素原则来配置我们的生产环境，在环境变量中获取对应的参数值，这样我们就可以控制worker的数量以及JobQueue的最大容量通过直接修改对应的值而不需要重新去部署我们的应用。

<code>var ( 
  MaxWorker = os.Getenv("MAX_WORKERS") 
  MaxQueue  = os.Getenv("MAX_QUEUE") 
)
复制代码/<code>

当我们将这个版本发布到生产环境以后我们的延迟率马上有明显的下降，我们处理请求的能力有一个质的飞跃。

在一分钟以后等我们的负载均衡器完全启动起来以后，可以看到ElasticBeanstalk上服务器接收的请求数将近一百万次每分钟。通常我们早上都有几个小时的流量高峰期，那时甚至会超过百万请求次数每分钟。

而且当我们发布完新代码以后服务器的数量就从100台下降到并稳定在了20台。

当给集群加上合适的配置以及设置自动伸缩以后，甚至可以降到仅仅用4台c4.Large的EC2实例来处理日常业务。并且集群会自动增加新的实例当CPU使用率持续5分钟达到90%时。

总结

简洁化设计永远是我所追求的东西。我们可以设计一个复杂的系统用很多的队列，后台运行worker，复杂的部署等等，但取而代之我们决定利用Elasticbeanstalk强大的自动伸缩功能以及Go所提供开箱即用的并发特性。

总会有一个工具适合你的工作，在有的时候当你Ruby on Rails系统需要一个强大的网络请求处理功能的时候，可以试着考虑一下除了ruby生态圈以外的更加强大和简洁的替代方案。

分享到:

閱讀更多 Echa攻城獅 的文章

關鍵字: 余 C语言 MapReduce

Golang——变量的声明与定义

Golang——详解Go语言的代码规范

Golang 入门系列（十一）orm框架之gorm详细介绍！

Golang 入门系列（十一）orm框架之gorm详细介绍

Golang 入门系列（十一）从零开始实现一个完整的webapi项目！

unrecognized import path "golang.org

Golang 入门系列（四）浅谈Go语言中的面向对象

golang 基础知识点梳理

Golang Channel详细解析

Golang 入门系列（三）打好基本功: Golang 语法基础！

Golang 入门系列（三）打好基本功：Golang 语法基础

golang 并发编程

golang-csv文件追加写入内容

Golang 的引用类型底层实现

golang grpc之etcd服务注册发现

golang template使用自定义函数

golang 开源后台管理系统

golang-9- defer

golang-3- 函数

golang-1- 环境搭建

「GoLang」对mysql操作的简单封装

golang+jaeger实现链路追踪

golang+shell快速实现docker运行时

golang web开发——内存中crud练习

「Golang 系列」 Golang 内存管理和回收

golang Context详解

10.14 Golang(五)最佳Web框架对比

「golang」Go内嵌静态资源go-bindata的安装及使用

知乎社区核心业务 Golang 化实践

Golang net包下操作IP的常用函数

Golang 系统采集工具 gopsutil

Golang atomic 原子操作函数

Golang sync包的7件法宝

golang-定时任务管理gocron

Golang slice注意啦

Golang 设计模式-建造者模式

Golang 单例模式

认识 Golang 协程

Golang 消息服务NATS

golang-同名package冲突解决

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"