如何成功構建大規模 Web 搜索引擎架構？

2020-04-09 12:10:54 CSDN

Web搜索引擎十分複雜，我們的產品是一個分佈式系統，在性能和延遲方面有非常苛刻的要求。除此之外，這個系統的運營也非常昂貴，需要大量人力，當然也需要大量金錢。

這篇文章將探討我們使用的一些技術棧，以及我們做出的一些選擇和決策。

作者 | Cliqz

出品 | CSDN（ID：CSDNnews）

在本文中，我們將系統地介紹我們的私有搜索產品，經過多年的迭代，來滿足外部和內部的用戶。

我們結合使用了很多有名的開源技術，以及雲原生技術，這些技術都經受了嚴格的測試。對於哪些未能從開源或商業系統中找到解決方案的領域，我們只能深入研究，並自行從頭編寫系統。這種方式十分適合我們現在的規模。

免責聲明：本文描述的只是系統現在的情況。當然最初的系統並非如此。多年來我們採用過多種架構，並不斷思考諸如成本、流量和數據大小等約束。但本文並不是構建搜索引擎的指南，而只是我們目前正在使用的系統，高德納曾說：

“過早優化是萬惡之源。”

我們完全同意這句話。我們真心建議所有人不要一次性把所有食材都扔進鍋裡。但也不必逐個放，而是每次一小步，逐步增加複雜性。

搜索引擎的經驗——下拉菜單和SERP

Cliqz的搜索引擎有兩類客戶，他們有不同的需求。

搜索提示

瀏覽器中的Cliqz下拉菜單

瀏覽器的地址欄中可以搜索，搜索結果顯示在下拉菜單中。這類搜索要求的結果很少（通常是3條），但對於延遲的要求十分苛刻（一般在150毫秒以內），否則就會影響用戶體驗。

在SERP中搜索

Cliqz搜索引擎的結果頁面 beta.cliqz.com

在網頁上進行搜索，顯示人所共知的搜索結果頁面。這裡，搜索的深度是無限的，但與下拉菜單相比，它對於延遲的要求較低（只需在1000毫秒以內就可以）。

全自動和近乎實時的搜索

考慮一個查詢，如“拜仁慕尼黑”。這個查詢似乎非常普通，但該查詢會使用我們系統中的數個服務。如果考慮這個查詢的意圖，就會發現用戶可能想要：

研究拜仁慕尼黑俱樂部（這種情況下顯示維基百科的小窗可能會有用）

想訂票、購物或者註冊成為正式的粉絲（顯示官方網站）
想了解有關該俱樂部的新聞：
賽前有關比賽的新聞

比賽中的信息，如實時比分、實時更新或解說
賽後分析
季後信息，如俱樂部的內部情況，轉會期間的活動，聘用新教練等

搜索舊的網頁和內容、俱樂部歷史、過去的比賽記錄等。

你也許會注意到，這些意圖遠非“相關網頁”能概括。這些信息不僅從語義上相關，而且還與時間有關。搜索的時間敏感度對於用戶體驗非常重要。

為提供合理的用戶體驗，這些信息必須由不同的信息源提供，並以近乎實時的方式轉換成可以被搜索的索引。我們要保證所有模型、索引和相關文件都是最新的（例如，加載的圖像必須反映當前的事件，標題和內容也必須隨時根據正在發展的事件而更新）。在大規模的條件下，儘管這一切看似很難，但我們堅持認為我們應該永遠給用戶推送最新的信息。這個理念貫穿了我們整個系統架構的基礎。

Cliqz的數據處理和服務平臺採用了多層的Lambda架構。該架構根據內容索引的即時性分成三層，分別是：

近乎實時的索引

完全自動，由Kafka（生產者、消費者和流處理器）、Cassandra、Granne和RocksDB負責提供
Cassandra將索引信息存儲在多個表中。不同表中的記錄有不同的生存時間（TTL），這樣可以在數據稍後被重新索引時清理存儲空間
該組件還負責根據趨勢或流行程度進行排名，這樣可以協助在不同大小的移動窗口中找出趨勢。這項功能使用了KafkaStreams提供的流處理功能
這些技術造就了產品特性，包括搜索結果中的最新內容、最流行新聞等

每週或基於滑動窗口的批次索引

基於過去60天的內容
每週重建索引（使用Jenkins上的端到端自動流水線中的批處理作業）
根據最新的數據執行機器學習和數據流水線，提高搜索結果的質量
有一個很好的框架，利用一小部分數據測試新的機器學習模型和算法的改變並建立原型，避免在全部數據上進行端到端試驗造成的高昂成本
利用Luigi實現基於Map-Reduce和Spark的批處理工作流管理，並利用Jenkins Pipeline進行回顧管理
利用Keyvi、Cassandra、qpick和Granne提供服務

全批次索引

基於全部數據
每兩個月重建一次索引

用Luigi管理的基於MapReduce和Spark的批處理工作流
用於在大數據集上訓練大規模的機器學習模型。例如，查詢和詞嵌入、近似最近鄰居模型、語言模型等
利用Keyvi、Cassandra、qpick和Granne提供服務

值得指出的是，近乎實時的索引和每週索引負責了SERP上搜索相關內容的一大部分。其他搜索引擎也採用了類似的做法，即更看重某個話題最新的內容，而不是歷史內容。批次索引負責處理與時間無關的查詢、長尾查詢，以及針對罕見內容、歷史內容或語境苛刻的查詢。這三者的組合能為我們提供足夠多的結果，因此Cliqz搜索才做到了今天的樣子。所有系統都能夠應答所有查詢，但是最終結果是所有索引上的結果的混合。

部署——歷史上下文

“只有當你明白何時不該使用某個工具，才算真正掌握了它。”——Kelsey Hightower

從一開始我們就專注於使用雲服務商提供搜索服務，而不是自己搭建基礎設施。在過去的十年內，雲服務已經成了行業的標準，與自己搭建數據中心相比，無論從複雜性還是從資源需求的角度，雲服務都有巨大的優勢，而且使用很方便，創業公司還可以按量付費。對於我們而言，AWS十分方便，我們不需要管理自己的機器和基礎設施。要是沒有AWS，我們就得花很多精力才會有現在的成就。（但是，AWS雖然很方便，但也很昂貴。這篇文章裡會介紹一些可以降低成本的手段，但我們建議你在大規模情況下使用雲服務時務必要謹慎。）

我們通常會避免那些可能會有用的服務，因為在我們的規模下，成本可能會高到無法接受。為了便於理解，我舉一個2014年的例子，當時我們遇到的一個增長的問題就是如何在AWS上可靠地分配資源並部署應用。

剛開始的時候，我們嘗試在AWS上構建自己的基礎設施和配置管理系統。我們的做法是用python實現了一套解決方案，這樣開發者更容易上手。這套解決方案基於Fabric項目，並與Boto集成，只需要幾行代碼就可以建立新的服務器並配置好應用程序。當時docker還剛剛起步，我們採用的是傳統的方法，直接發佈python包，或者純文本的python文件，這種方式在依賴管理上有很大困難。儘管項目收到了許多關注，在Cliqz也被用於管理很多產品中的服務，但以庫為基礎的基礎設施和配置管理方式總是有一些不足。全局狀態管理、基礎設施變更的中心鎖、無法集中地查看某個項目或開發者使用的雲資源、依賴外部工具來清理孤立資源、功能有限的配置管理、很難查看開發者的資源使用量、使用者的環境洩露等，這些問題帶來了不便，逐漸讓操作變得越來越複雜。

因此我們決定尋找一種新的外部管理解決方案，因為我們沒有足夠的資源自行開發。我們最終決定的方案是採用來自Hashicorp的解決方案組合，包括Consun、Terraform和Packer，還有配置管理工具如Ansible和Salt。

Terraform使用優秀的聲明式方式定義基礎設施管理，雲原生領域的許多最新技術都採用了這個概念。因此我們在謹慎地評估之後決定，放棄了自己基於fabric的部署庫，轉而採用Terraform。除了技術上的優劣之外，我們還必須考慮人的因素。一些團隊接受改變比較緩慢，有可能是因為缺乏資源，有可能是因為轉變的代價在各個團隊之間並不一致。我們花了整整一年的時間才完成遷移。

Terraform的一些開箱即用的特性是我們以前沒有的，如：

基礎設施的中心狀態管理
詳盡的計劃、補丁和應用支持
很容易關閉資源，最小化孤立資源
支持多種雲

同時，我們在使用Terraform的過程中也面臨著一些挑戰：

複雜的DSL，一般不遵循DRY原則
很難融合到其他工具中
模板支持有限，有時非常複雜
服務健康狀態方面沒有反饋
無法很容易地回滾
缺乏某些關鍵功能，需要依靠第三方的實現，如terragrunt

Terraform當然在Cliqz有用武之地，時至今日，我們依然用它來部署大多數Kubernetes基礎設施。

搜索系統的複雜性

搜索系統概覽

這些年來，我們由數十臺服務器組成的分佈式架構遷移到了整體式架構，最後又遷移到了微服務架構。

我們相信，每個服務在當時的資源條件下都是最方便的。例如，採用整體式架構是因為絕大多數延遲都是由於集群中的服務器之間的網絡IO導致的。當時AWS發佈了X1實例，它擁有2TB的內存。改變架構可以有效地降低延遲，當然成本也會攀升。而下一個架構方面的迭代重點放在了成本上。我們在不影響其他因素的前提下一點點改變每個變量。儘管這個方法看上去並不那麼漂亮，但非常適合我們。

“微服務架構風格將應用程序分解成一組小服務，每個服務在自己的進程上運行，通過輕量化的機制（通常是HTTP資源API）與其他進程進行通信。” ——Martin Fowler

理論上，Martin Fowler給出的微服務的定義是正確的，但過於抽象。對於我們來說，這個定義並沒有說明應當怎樣構建和分割微服務，而這才是重點。採用微服務給我們帶來了如下好處：

團隊之間更好的模塊化和自動化，以及關注點分離。
水平伸縮和工作負載劃分。
錯誤隔離，更好地支持多語言。
多租戶，更好的安全功能。
更好的運維自動化。

從架構整體以及微服務的結構上來看，每當查詢請求發送到後端時，請求路徑上會觸發多個服務。每個服務都可以看做是微服務，因為它們都有關注點分離，採用輕量級協議（REST/GRPC），並且可水平伸縮。每個服務都由一系列獨立的微服務組成，可以擁有一個持久層。請求路徑通常包括：

Web應用層防火牆（WAF）：應用層防火牆，用於抵禦常見的Web漏洞。
負載均衡器：接收請求、負載均衡。
Ingress代理：路由、邊緣可觀測性、發現、策略執行。
Eagle：SERP的服務器端渲染。
Fuse：API網管，結果融合，邊緣緩存，認證和授權。
建議：查詢建議。
排名：用近乎實時的索引和預編譯的批次索引提供搜索結果（Lambda架構）。
富結果：添加更豐富的信息，如天氣、實時比分的小窗體，以及來自第三方信息源的信息。
知識圖譜和瞬時解答：查找與查詢有關的信息。
地點：基於地理位置的內容推薦。
新聞：來自知名新聞源的實時內容。
跟蹤器：由WhoTracks.me提供的特定於某個領域的跟蹤信息。
圖像：與用戶查詢有關的圖像結果。

所有服務都編排至公用的API網關，該API網關負責處理搜索結果的大小，還提供了其他功能，如針對訪問量激增的保護、根據請求量/CPU/內存/自定義基準自動進行伸縮、邊緣緩存、流量模仿和分割、A/B測試、藍綠部署、金絲雀發佈等。

Docker容器和容器編排系統

到目前為止，我們介紹了產品的部分需求和一些細節。我們介紹了怎樣進行部署，以及各種方案的缺點。有了這些經驗教訓，我們最終選擇了Docker作為所有服務的基本組成部分。我們開始使用Docker容器來分發代碼，而不再使用虛擬機+代碼+依賴的形式。有了Docker，代碼和依賴就可以作為Docker鏡像發送到容器倉庫（ECR）。

但隨著服務繼續增長，我們需要管理這些容器，特別是在需要在生產環境中進行伸縮的情況。難點包括(1)浪費很多計算資源 (2)基礎設施的複雜性 (3) 配置管理。

人員和計算力一直是稀缺資源，這是許多資源有限的創業公司都會面臨的困境。當然，為了提高效率，我們必須重點解決那些存在但現有工具不能解決的問題。但是，我們並不希望重新發明輪子（除非這樣做能有效地改變狀況）。我們十分願意使用開源軟件，開源解決了許多關鍵的業務問題。

Kubernetes 1.0版公佈之後我們立即著手嘗試，到1.4版的時候，Kubernetes已經比較穩定，其工具也比較成熟，我們就開始在Kubernetes上運行生產環境的負載。同時，我們還在大型項目（如fetcher）上評測了其他編排系統，如Apache Mesos和Docker Swarm。最後我們決定用Kubernetes來編排一切，因為有足夠的證據表明，Kubernetes採用了非常誘人的措施來解決編排和配置管理的問題，而其他方案並沒有做到這一點。再說Kubernetes還有強力的社區支持。

Kubernetes - Cliqz的技術棧

Cliqz使用的開源軟件

“開源軟件贏得了世界！”

Cliqz依賴於許多開源軟件項目，特別是依賴於雲原生基金會（Cloud Native Computing Foundation）旗下的諸多項目，來提供整體的雲原生體驗。我們通過提供代碼、博客文章以及Slack等其他渠道盡可能回饋開源社區。下面來介紹一下我們的技術棧中使用的關鍵開源項目：

KOPS——Kubernetes編排

在容器編排方面，我們利用KOPS和一些自己開發的工具來自行管理橫跨多個區域的Kubernetes集群，管理集群生命週期和插件等。感謝Justin Santa Barbara和kops的維護者們做出的優異工作，使得k8s的控制平面和工作節點可以非常好地結合在一起。目前我們沒有依賴任何提供商管理的服務，因為KOPS非常靈活，而AWS提供的k8s控制平面服務EKS還非常不成熟。

使用KOPS以及自行管理集群意味著我們可以按照自己的節奏行事，可以深入研究問題，可以啟用那些應用程序真正需要、卻僅在某個Kubernetes版本中才存在的功能。如果我們依賴於雲服務，那麼達到現狀需要花費更長的時間。

Weave Net——網絡覆蓋

值得一提的是，Kubernetes可以對系統的各個部分進行抽象。不僅包括計算和存儲，還包括網絡。我們的集群可能會增長到幾百個節點，因此我們採用了覆蓋網絡（overlay network）構成了骨幹網絡，為橫跨多個節點甚至多個區的Pod提供基本的網絡功能並實行網絡策略。我們採用了Weave Net作為覆蓋網絡，因為它很容易管理。隨著規模增長，我們可能會切換到AWS VPC CNI和Calico，因為它們更成熟，能提供更少的網絡跳數，以及更一致的路由和流量。到現在為止，Weave Net在我們的延遲和吞吐量環境下表現良好，所以還沒有理由切換。

Helm / Helmfile——包管理和發佈

我們最初依賴於helm（v2）進行Kubernetes manifest的包管理和發佈。儘管它有許多痛點，但我們認為它依然是個優秀的發佈管理和模板工具。我們採用了單一代碼倉庫來存儲所有服務的heml圖，並使用chartmuseum項目進行打包和分發。依賴於環境的值會保存到另一個代碼倉庫中，以實現關注點分離。這些都通過Helmfile提供的的gitOps模式來實現，它提供了聲明式的方式，以實現多個helm圖的發佈管理，並關聯重要的插件，如diff、tillerless，並使用SOPS進行秘密管理。對該代碼倉庫做出的改變，會通過Jenkins的CI/CD流水線進行驗證並部署。

Tilk / K9s——無壓力的本地Kubernetes開發

我們面臨的問題之一在於：怎樣才能在開發者的開發週期中引入Kubernetes。一些需求非常明顯，那就是怎樣才能構建代碼並同步到容器中，怎樣才能做得又快又好。最初我們使用了簡單的自制解決方案，利用文件系統事件來監視源代碼變更，然後rsync到容器中。我們還嘗試了許多項目，如Google的Skaffold和微軟的Draft，試圖解決同樣的問題。最適合我們的是Windmill Engineering的Tilt（感謝Daniel Bentley），該產品非常優秀，其工作流由Tiltfile驅動，該文件由starlark語言編寫。它可以監視文件編輯，可以自動應用修改，實時自動構建容器鏡像，利用集群構建、跳過容器倉庫等手段來加速構建，還有漂亮的UI，可以在一個面板中查看所有服務的信息。如果你希望深入研究，我們把這些k8s的知識開源成一個名為K9s的命令行工具（https://github.com/derailed/k9s），它能以交互的方式執行k9s命令，並簡化開發者的工作流程。今天，所有運行於k8s上的工作負載都在集群中進行開發，並提供統一、快速的體驗，每個新加入的人只需要幾個命令就可以開始工作，這一切都要歸功於helm / tilt / k9s。

Prometheus，AlertManager，Jaeger，Grafana和Loki——可觀測性

我們依賴Prometheus的監視方案，使用時間序列數據庫（tsdb）來收集、統計和轉發從各個服務收集到的指標數據。Prometheus提供了非常好的查詢語言PromQl和報警服務Alert Manager。Jaeger構成了跟蹤統計方案的骨幹部分。最近我們將日誌後臺從Graylog遷移到了Loki，以提供與Prometheus相似的體驗。這一切都是為了提供單一的平面，滿足所有可觀測性的需求，我們打算通過圖表解決方案Grafana來發布這些數據。為了編排這些服務，我們利用Prometheus Operator項目，管理多租戶Prometheus部署的生命週期。在任意時刻，我們都會接收幾十萬條時間序列數據，從中瞭解基礎設施的運行情況，出現問題時判斷從哪個服務開始解決問題。

以後我們打算集成Thanos或Cortex項目來解決Prometheus的可伸縮性問題，並提供全局的查詢視圖、更高的可用性，以及歷史分析的數據備份功能。

Luigi和Jenkins——自動化數據流水線

我們使用Luigi和Jenkins來編排並自動化數據流水線。批處理作業提交到EMR，Luigi負責構建非常複雜的批處理工作流。然後使用Jenkins來觸發一系列ETL操作，這樣我們就能控制每個任務的自動化和資源的使用狀況。

我們將批處理作業的代碼打包並添加版本號後，放到帶有版本號的docker容器中，以保證開發和生產環境中的體驗一致。

插件項目

我們還使用了許多社區開發的其他項目，這些作為插件發佈的項目是集群生命週期的一部分，它們為生產環境和開發環境中部署的服務提供額外的價值。下面簡單介紹一下：

Argo工作流和持續部署：我們評測了該項目，作為Jenkins的後備，用於批量處理任務和持續部署。
AWS IAM認證器：k8s中的用戶認證管理。
ChartMuseum：提供遠程helm圖。
Cluster Autoscaler：管理集群中的自動伸縮。
Vertical Pod Autoscaler：按需要或根據自定義指標來管理Pod的垂直伸縮。
Consul：許多項目的狀態存儲。

External DNS：將DNS記錄映射到Route53來實現外部和內部的訪問。
Kube Downscaler：當不再需要時對部署和狀態集進行向下伸縮。
Kube2IAM：透明代理，限制AWS metadata的訪問，為Pod提供角色管理。
Loki / Promtail：日誌發送和統計。
Metrics Server：指標統計，與其他消費者的接口。
Nginx Ingress：內部和外部服務的ingress控制器。為了擴展API網關的功能，我們在不斷評測其他ingress控制器，包括Gloo、Istio ingress gateway和Kong。
Prometheus Operator：Prometheus操作器棧，能夠準備Grafana、Prometheus、AlertManager和Jaeger部署。
RBAC Manager：可以很容易地為k8s資源提供基於角色的訪問控制。
Spot Termination Handler：通過提前警戒並清空節點的方式來優雅地處理單點中斷。
Istio：我們一直在評測Istio的網格、可觀察性、流量路由等功能。許多功能我們都已自己編寫了解決方案，但長時間以來這些方案開始暴露出了限制，我們希望該項目能夠滿足我們的要求。

k8s的經驗加上豐富的社區支持，我們不僅能夠發佈核心的無狀態服務來提供搜索功能，還能在多個區域和集群中運行大型有狀態的負載，如Cassandra、 Kafka、Memcached和RocksDB等，以提供高可用性和副本。我們還開發了其他工具，在Kubernetes中管理並安全地執行這些負載。

使用Tilt進行本地開發——端到端的用例

上述介紹了許多我們使用的工具。這裡我想結合一個具體的例子來介紹怎樣使用這些工具，更重要的是介紹這些工具怎樣影響開發者的日常工作。

我們以一名負責開發搜索結果排名的工程師為例，之前的工作流為：

使用自定義的OS鏡像啟動一個實例，然後利用所有者信息給實例和相關的資源加上標籤。
將代碼rsync到實例中，然後安裝應用程序依賴。
學習怎樣設置其他服務，如API Gateway和前端，安裝依賴並部署。
通過配置讓這些服務能夠協同工作。
開發排名應用程序。

最後，開發完畢後，要終止該實例。

可見，開發者需要重複進行一系列的操作，團隊中的每個新工程師都要重複這一切，這完全是對開發者生產力的浪費。如果實例丟失，就要重複一遍。而且，生產環境和本地開發環境的工作流還有少許不同，有時會導致不一致。有人認為在開發排名應用程序時設置其他服務（如前端）是不必要的，但這裡的例子是為了通用起見，再說設置完整的產品總沒有壞處。此外，隨著團隊不斷增長，需要創建的雲資源越來越多，資源的利用率也越來越低。工程師會讓實例一直運行，因為他們不想每天重複這一系列操作。如果某個工程師離職，他的實例也沒有加上足夠的標籤，那麼很難判斷是否可以安全地關閉該實例並刪除雲資源。

理想情況是為工程師提供用於設置本地開發環境的基礎模板，該模板可以設置好完整的SERP，以及其他排名應用程序需要的服務。這個模板是通用的，它會給用戶創建的其他資源加上唯一的標籤，幫助他們控制應用程序的生命週期。因為k8s已經將創建實例和管理實例的需求抽象化（我們通過KOPS來集中管理），所以我們利用模板來設置默認值（在非工作時間自動向下伸縮），從而極大地降低了成本。

現在，用戶只需關心他自己編寫的diamante，我們的工具（由Docker、Helm和Tilt組成）會在幕後神奇地完成這一系列工作流。

下面是Tiltfile的例子，描述了設置最小版本的SERP所需的服務和其他依賴的服務。要在開發模式下啟動這些服務，用戶只需要執行tilt up：

<code># -*- mode: Python -*-/<code>
<code>"""/<code><code>This Tiltfile manages 1 primary service which depends on a number of other micro services./<code><code>Also, it makes it easier to launch some extra ancilliary services which may be/<code><code>useful during development./<code><code>Here's a quick rundown of these services and their properties:/<code><code>* ranking: Handles ranking/<code><code>* api-gateway: API Gateway for frontend/<code><code>* frontend: Server Side Rendering for SERP/<code>
<code>"""/<code>
<code>####################/<code><code># Project defaults #/<code><code>####################/<code>
<code>project = "some-project"/<code><code>namespace = "some-namespace"/<code><code>chart_name = "some-project-chart"/<code><code>deploy_path = "../../deploy"/<code><code>charts_path = "{}/charts".format(deploy_path)/<code><code>chart_path = "{}/{}".format(charts_path, chart_name)/<code><code>values_path = "{}/some-project/services/development.yaml".format(deploy_path)/<code><code>secrets_path = "{}/some-project/services/secrets.yaml".format(deploy_path)/<code><code>secrets_dec_path = "{}/some-project/services/secrets.yaml.dec".format(deploy_path)/<code><code>chart_version = "X.X.X"/<code>
<code># Load tiltfile library/<code><code>load("../../libs/tilt/Tiltfile", "validate_environment")/<code><code>env = validate_environment(project, namespace)/<code>
<code># Docker repository path for components/<code><code>serving_image = env["docker_registry"] + "/some-repo/services/some-project/serving"/<code>
<code>####################################/<code><code># Build services and deploy to k8s #/<code><code>####################################/<code>
<code># Watch development values file for helm chart to re-execute Tiltfile in case of changes/<code><code>watch_file(values_path)/<code>
<code># Build docker images/<code><code># Uncomment the live_update part if you wish to use the live_update function/<code><code># i.e., no container restarts while developing. Ex: Using Python debugging/<code><code>docker_build(serving_image, "serving", dockerfile="./serving/Dockerfile", build_args={"PIP_INDEX_URL": env["pip_index_url"], "AWS_REGION": env["region"]} #, live_update=[sync('serving/src/', '/some-project/'),]/<code><code>)/<code>
<code># Update local helm repos list/<code><code>local("helm repo update")/<code>
<code># Remove old download chart in case of changes/<code><code>local("rm -rf {}".format(chart_path))/<code>
<code># Decrypt secrets/<code><code>local("export HELM_TILLER_SILENT=true && helm tiller run {} -- helm secrets dec {}".format(namespace, secrets_path))/<code>
<code># Convert helm chart to standard k8s manifests/<code><code>template_script = "helm fetch {}/{} --version {} --untar --untardir {} && helm template {} --namespace {} --name {} -f {} -f {}".format(env["chart_repo"], chart_name, chart_version, charts_path, chart_path, namespace, env["release_name"], values_path, secrets_dec_path)/<code><code>yaml_blob = local(template_script)/<code>
<code># Clean secrets file/<code><code>local("rm {}".format(secrets_dec_path))/<code>
<code># Deploy k8s manifests/<code><code>k8s_yaml(yaml_blob)/<code>
<code>dev_config = read_yaml(values_path)/<code>
<code># Port-forward specific resources/<code><code>k8s_resource('{}-{}'.format(env["release_name"], 'ranking'), port_forwards=['XXXX:XXXX'], new_name="short-name-1")/<code><code>k8s_resource('{}-{}'.format(env["release_name"], 'some-project-2'), new_name="short-name-2")/<code>
<code>if dev_config.get('api-gateway', {}).get('enabled', False):/<code><code> k8s_resource('{}-{}'.format(env["release_name"], 'some-project-3'), port_forwards=['XXXX:XXXX'], new_name="short-name-3")/<code>
<code>if dev_config.get('frontend', {}).get('enabled', False):/<code><code> k8s_resource('{}-{}'.format(env["release_name"], 'some-project-4-1'), port_forwards=['XXXX:XXXX'], new_name="short-name-4-1")/<code><code> k8s_resource('{}-{}'.format(env["release_name"], 'some-project-4-2'), new_name="short-name-4-2")/<code>

說明：

Helm圖主要用於應用程序打包，以及管理每個發佈的生命週期。我們使用helm的模板，並使用自定義yaml為模板提供值。這樣我們就可以對每個發佈進行深入的配置。我們可以配置為容器分配的資源，很容易地配置每個容器需要連接的服務，可以使用的端口等。
使用Tilt加上helm圖來設置本地的k8s開發環境，並將本地代碼映射到helm圖中定義的服務上。利用它提供的功能，我們可以持續地構建docker容器並將應用程序部署到k8s上，或者進行本地更新（將所有本地修改rsync到正在運行的容器上）。開發者也可以利用端口轉發將應用程序映射到本地實例上，以便在開發時訪問服務的端點。我們使用k8s manifest，從helm圖中提取出渲染後的模板，利用它進行部署。這是因為我們的圖的需求過於複雜，無法完全依靠Tilt提供的helm的功能。
如果應用程序端點需要與其他團隊成員共享，那麼helm圖就可以提供統一的機制來創建內部ingress端點。
我們的圖通過公有的helm圖倉庫來公開，因此無論是生產環境還是開發環境，我們使用的都是同一套代碼（帶有版本號的docker鏡像），同一個圖模板，但模板中的值不一樣，以適應不同的需求（如部署名稱、端點名稱、資源、副本等）。
整套實踐在每個端點和每個項目中都保持一致，這樣新加入團隊的人就非常容易上手，雲資源的管理也非常容易。

“只要技術足夠先進，就和魔法沒什麼區別。”——阿瑟·克拉克

但這個魔法有一個問題。它通過更有效的資源共享，提高生產力、增加可靠度並降低成本。但是，當某個東西出問題時，人們很難發現問題在哪裡，找出問題的根源變得十分困難，而且這種錯誤特別容易在在人們不方便解決的時候出現。所以，儘管為這些努力感到驕傲，但我們依然保持謙遜的姿態。

優化成本

廉價的基礎設施和互聯網規模的搜索引擎不可能兼得。話雖如此，想要省錢總會有辦法。我來介紹一下我們是怎樣利用基於k8s的架構來優化成本的。

1. Spot instances

我們極度依賴於AWS spot instances，使用該服務，我們必須在構建系統時考慮可能的失敗。但這樣做是值得的，因為這些實例要比按需的實例要便宜得多。但要注意不要像我們一樣搬起石頭砸自己的腳。我們早就習慣了spot instances，因此有時候會高估自己的實力，導致本不應該發生的失敗。而且，不要榨乾高性能服務器的所有性能，否則你就會陷入與其他公司的競價之爭。最後，永遠不要在大型的NLP/ML會議之前使用spot GPU instances。

使用Spot的混合實例池：我們不僅使用spot instances來完成一次性的作業，也利用它來運行服務的工作負載。我們想出了一個絕佳的策略。我們利用多種實例類型（但配置都類似），為Kubernetes資源創建了一個節點池，該節點池分佈在多個可用性區域中。與Spot Termination handler配合使用，我們就可以將無狀態的工作負載移動到新建的或空閒的spot節點上，避免可能出現的長時間宕機。

2. 共享CPU內存

由於我們完全依靠Kubernetes，因此在討論工作負載時都是在討論Kubernetes需要多少CPU、多少內存，以及每個服務需要多少個副本。因此，如果Request和Limits相等，性能就能得到保證。但是，如果Request低但Limit高（這種情況在零星的工作負載上有用），我們可以多準備一些資源，並將某個實例的資源使用最大化（減少實例上的閒置資源量）。

3. 集群的自動擴展器，Pod的垂直和水平Autoscaler

我們用集群自動擴展器來自動化Pod的創建和縮小，只有在需求上升時才創建實例。這樣在沒有工作負載時僅啟動最少的實例，也不需要人工干預。

4. 開發環境中的部署的downscaler

對於開發設置中的所有服務，我們使用部署的down-scaler在特定時間將pod的副本數收縮為0.在Kubernetes的manifest中添加一條註釋，就可以指定啟動計劃：

<code>annotations:/<code><code> downscaler/uptime: Mon-Fri 08:00-19:30 Europe/Berlin/<code>

也就是說，在非工作時間，部署的大小會收縮為0，副本數也會由集群的自動擴展器進行收縮，因為實例上沒有活躍的工作負載。

5. 成本評估和實例推薦——長期的成本縮減

在生產環境中，一旦我們確定了資源使用量，就可以選擇那些負載會很高的實例。這些實例不再採用按需模式，而是採用預留實例（reserved instance）的定價模型，這種模型需要預先支付一年的費用。但是，其成本要比按需啟動的實例要低得多。

在Kubernetes中，有一些解決方案如kubecost，可以監視長期的使用成本，然後據此來推薦額外的節約陳本的方法。它還提供了指定工作負載的價格估算功能，這樣就可以算出部署一個系統的總體成本。通過同一個界面，使用者還可以知道哪些資源可能不再被使用，如ebs卷等。

所有這些措施都可以為我們每年節省大約幾十到幾千歐元。對於擁有高額基礎設施賬單的大公司來說，如果這些措施得當，就能輕易地每年節省幾百萬。

機器學習系統

機器學習系統中的隱藏技術債務——Sculley等人

很有意思的是，我們的Kubernetes之旅以一種誰也沒想到的方式開始。我們想要搭建一個基礎設施，從而可以用Tensorflow運行分佈式深度學習。當時這個想法還很新穎。儘管Tensorflow的分佈式訓練已經推出了一段時間，但除了為數不多的幾個財大氣粗的公司之外，很少有人知道怎樣大規模地從頭到尾運行分佈式訓練。當時也沒有任何雲解決方案能解決這個問題。

我們一開始採用了Terraform來架設了一個分佈式架構，但很快就意識到這個方案在伸縮性方面有侷限性。同時，我們找到一些社區貢獻的代碼，利用jinja模板引擎來生成Kubernetes manifests，再創建深度學習訓練應用程序的分佈式部署（包括參數服務器和工作模式）。這是我們與Kubernetes的第一次接觸。此外，我們還構建了自己的近乎實時的搜索引擎，同時試驗按照新穎程度的排名。就在那時Kubernetes給我們帶來了曙光，所以我們決定採用Kubernetes。

作為機器學習系統之旅的一部分（就像上述所有基礎設施一樣），我們的目標就是向整個公司開放該系統，讓開發者可以很容易地在Kubernetes上部署應用程序。我們希望開發者能把精力花費在解決問題上，而不是解決服務帶來的基礎設施問題上。

但是，儘管每個人都利用機器學習解決了問題，但我們迅速意識到，維護機器學習系統的確是個非常痛苦的事情。它遠遠不止編寫機器學習代碼或者訓練模型這麼簡單。即使是我們這種規模的公司，也需要解決一些問題。在“Hidden Technical Debt in Machine Learning System”這篇論文中有詳細的描述。任何希望在生產環境中依靠並運行具有一定規模的機器學習系統的人都應該仔細閱讀這篇論文。我們討論了幾種不同的解決方案，例如：

MLT
AWS SageMaker
Kubeflow
MLFlow

在所有這些服務中，我們發現Kubeflow功能最全、性價比最高，且可以定製。

前一段時間，我們還在Kubeflow的官方博客上寫了一些原因。kubeflow除了能為我們提供自定義資源，如TfJob和PytorchJob來運行訓練代碼，它的一大優勢就是自帶notebook支持。

Cliqz的Kubeflow用例

Kubeflow的許多特性都在我們的近實時排名中得到了應用。工程師可以在集群中打開一個notebook，然後直接進入數據基礎設施（批次和實時流）。分享notebook，讓多人分別處理代碼的不同部分非常容易。工程師們可以很容易地進行各種實驗，因為他們不需要設置任何notebook服務器，也不需要任何訪問數據基礎設施的權限，更不需要深入到部署的細節，只需要使用一個簡單的Web界面就可以選擇notebook所需的資源（CPU、內存甚至GPU），分配一個EBS卷，然後啟動一個notebook服務器。有意思的是，一些實驗是在0.5個CPU和1GB內存上進行的。通常這樣規模的資源在我們的集群中隨時存在，生成這種notebook非常容易，甚至都不需要新建實例。如果不這樣做，那麼來自不同團隊的兩名工程師想要一起工作時，他們很可能會啟動各自的實例，這就會導致成本增加，資源的利用率也不高。

此外還可以提交作業，這些作業可以用來在notebook中訓練、驗證模型並用模型提供服務。這方面的一個有意思的項目叫做Fairing。

Kubeflow本身是個非常完善的項目，我們僅僅接觸到了冰山一角。最近我們還開始瞭解其他項目，如Katib（機器學習模型的超參數調節）、KFServing（在Kubernetes上實現機器學習模型的無服務器推斷）和TFX（創建並管理生產環境下的ML流水線）。我們已經利用這些項目創建了一些原型，希望能儘快將其應用到生產環境中。

由於有這許多好處，我們衷心地感謝Kubeflow背後的團隊打造的這個優秀的項目。

隨著我們的增長，隨著我們越來越依賴於機器學習，我們希望圍繞機器學習的處理可以流水線化，可以擁有更高的可重複性。因此，像模型跟蹤、模型管理、數據版本管理變得極其重要。

為了能在這種規模下穩定地運行模型，定期進行更新和評估，我們需要一個數據管理的解決方案，才能在生產環境中運行模型，從而實現模型和索引的自動熱替換。為了解決這個問題，我們自己搭建了一個解決方案“Hydra”，它能為下游的服務提供數據集的訂閱服務。它海能在Kubernetes集群中為服務提供卷管理。

結束語

“在取得成功後，下一個目標就是幫助別人成功。”——Kelsey Hightower

Cliqz的架構很困難，同時也很有趣。我們相信我們還有很長的路要走。隨著開發的進行，我們有多種方案可以選擇。

儘管Cliqz已有120多名員工，但代碼實際上是由數千名開源開發者編寫併發布的，他們儘可能寫出高質量的代碼，並盡一切努力保證了安全性。沒有他們，我們不可能有今天的成就。我們衷心感謝開源社區提供的代碼，以及在我們遇到問題時幫我們解決問題。通過這篇文章，我們希望分享我們曾經的迷茫、獲得的經驗和解決方案，期待能對遇到類似問題的人有所幫助。懷著開放的心態，我們也想分享我們的資源（https://github.com/cliqz-oss/）來回饋開源社區。

原文：https://www.0x65.dev/blog/2019-12-14/the-architecture-of-a-large-scale-web-search-engine-circa-2019.html

本文為CSDN翻譯文章，轉載請註明出處。

☞百年 IBM 終於 All In 人工智能和混合雲！

☞微軟、蘋果、谷歌、三星……這些區塊鏈中的科技巨頭原來已經做了這麼多事！

☞斬獲GitHub 2000+ Star，阿里雲開源的 Alink 機器學習平臺如何跑贏雙11數據“博弈”？| AI 技術生態論

☞微軟為一人收購一公司？破解索尼程序、寫黑客小說，看他彪悍的程序人生！

☞機器學習項目模板：ML項目的6個基本步驟

☞IBM、微軟、蘋果、谷歌、三星……這些區塊鏈中的科技巨頭原來已經做了這麼多事！

☞資深程序員總結：分析Linux進程的6個方法，我全都告訴你

今日福利：評論區留言入選，可獲得價值299元的「2020 AI開發者萬人大會」在線直播門票一張。快來動動手指，寫下你想說的話吧。

分享到:

閱讀更多 CSDN 的文章

關鍵字: 美好，一直在身邊 CS 搜索引擎

網站首頁標題添加網站網址，對SEO優化有沒有幫助？

seo優化有什麼注意事項?

網站死鏈、404頁面會對網站造成哪些影響？

01.28 如何優化網站才能事網站的潛在關鍵詞不斷增加

如何快速挖掘更多優質的長尾關鍵詞

SEO問題之首頁被K內頁正常

做網站關鍵詞排名時容易忽略的問題有哪些？—竹晨網絡

做好網站優化seo的七個步驟

怎麼優化網站內鏈結構

網站被降權的原因有哪些

把握關鍵詞密度的幾點規律

深入淺出mysql索引

5個方面做好快速提高網站排名

搜索引擎的基本原理

導致網站被降權的原因有哪些

網站SEO優化雷區，新手SEO必看

站內SEO優化都優化什麼？SEO站內優化7個技巧

導致網站SEO排名不穩定的原因有哪些？

搜索引擎相關性計算

Robots中Meta標籤簡介

網站內鏈的意義有哪些？

網站排名優化方法要注意適度

分析對營銷型網站進行外鏈建設的三個要素

關鍵詞選擇技巧，如何能讓網站關鍵詞快速排名

【初念科技】搜索引擎推廣的通配符正確使用，你會嗎？

SEO優化應該選擇http還是https？

網站優化過程中常見的幾個問題

附子：誤區解讀，網站降權無需看SITE命令，SEO知識點深度分析！

為什麼“頁面訪問深度”對SEO很重要？

網站的404頁面有什麼用？如何設置？

網站日誌-一個常被忽略的seo重要因素

什麼是反向鏈接？有什麼用處？

SEO必備——長尾關鍵詞

04.02 單頁面網站的SEO優化利弊以及技巧

分享網站精細化操作（第十二天）

【Google優化】SEO優化穩定關鍵詞網站排名

03.21 【Google優化】SEO優化內鏈之重

03.19 保持網站關鍵詞優化排名的因素有哪些？

shell 在手分析服務器日誌不愁

阿里開發強制要求的11條索引創建規範，提高性能

2898站長資源平臺：網站建設前要做好的SEO準備

網站Robots文件需要了解的知識

2898站長資源平臺：網址優化對網站的重要性

TF-IDF介紹

新老網站排名，搜索引擎賦予頁面得分知識！

06.22 高質量的友鏈對seo的好處

06.06 網站seo優化方案與具體思路，值得參考

05.26 如何進行誇庫數據分頁

nginx重寫URL尾部自動添加斜槓，讓你url變的更美

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

沒有取得房抄產證的房子可以轉讓。但如果確定無法取得房產證的，房產轉讓不受法律保襲護。一般情況下，只有取得房產證的房屋才能確定房屋產權人，才具有轉讓的條件。但如果房屋是合法取得的，以百後可以依法辦理度房:-轉賣房產證商品房拿到:我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

鋒利突厥人你這樣說只能說明你對歷史非常不瞭解，我先用一句話概括突厥被大唐雄兵打的有多慘：三次滅國，背井離鄉，遠赴西亞，打不過，俺躲著你還不行嗎？突厥的意思是中間慫起的頭盔。其來歷已經不可靠，可能有著匈奴、鮮卑或:-復國大唐:為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

小高層 60:小高層16層高樓間距60米哪一層比較好？首先需要明白，選擇層數居住與樓間距毫無關係，住在哪一層，肉眼看對面樓的距離，是相差不大的。設定樓間距60米，純粹是混淆視聽。其實，一幢樓的樓層總數確定的情況下，到底哪一層最佳？很簡單，取總層數乘以黃金:-樓間距層高

金銀花盆栽好養嗎？怎麼養？

金銀花可以盆栽，很好養的！金銀花，是忍冬科的常綠纏繞灌木，枝條柔韌修長，多攀爬或匍匐生長。金銀花生性強健，在我國的很多南方省份野外很多地區都能看到它的身影，葉子常年翠綠，到夏季開花，飄香四溢。所以，有:-金銀花盆栽:金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

長城真的無用嗎？在今天許多人認為長城無用，古代國家舉國之力建造的長城不過只是文物，就連康熙都曾作詩諷刺，原文如下：萬里經營到海涯，紛紛調發逐浮誇。當時用盡生民力，天下何曾屬爾家。-康熙但真的如此嗎？小:-匈奴抵禦長城:長城對於抵禦古代匈奴和蒙古人起到了多大作用？蒙古人

什麼樹可以嫁接臘梅？

臘梅只能嫁接在不同品種的臘梅上，其他的樹種不行！臘梅的繁殖可以用播種，壓條，嫁接，分株等繁殖方法。播種法因不易保持花卉的原有優良特性，且播種的優點是在於大量繁殖，而臘梅大都只需培植少量幾株，故一般都不:-臘梅嫁接:什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

堪憂五一假期:行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？事實上，因為教育培訓都是預收費用的模式。但凡有一點點規模的培訓機構老師。在上半年，帶課量是可以得到保證。:-課時量

在農村“立夏節”都有哪些民間習俗？

民間習俗農村:在農村“立夏節”都有哪些民間習俗？在農村“立夏節”都有哪些民間習俗一、農村立夏常見的習俗風俗活動：1、吃雞蛋“立夏吃蛋”習俗由來已久，俗話說“立夏吃了蛋，夏天不疰夏”。據說立夏開始天氣越來越熱，村裡小孩兒會有身體疲勞四肢無力的感覺，吃:-立夏節

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

失望分手看法:男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？你的這個問題特別的有趣，我覺得你先不要看你要怎麼做才讓他才能讓他對你的印象有所改變，你要去看為什麼是兩個月之後可以在一起，這兩個月他會用來做什麼，為什麼會有這兩個月？例如他的身體碰到了什麼樣的問題嗎？:-答應我

工程分包乙方人員傷殘誰承擔？

承擔:工程分包乙方人員傷殘誰承擔？分包乙方分包致人傷殘責任誰承擔？嚴格來說，需要了解更多傷殘原因才能區分的，作為非專業人士，自己發表一點淺見供題主參考：1、如果甲方是央企的話，他們合同中的責任、義務等條款內已經將自己的責任全部撇開了，更會:-乙方傷殘

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

實際上:有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？歷史人物聯繫這個詞貌似太寬泛了，就好像有一個調皮的答案說的，胡亥和溥儀相隔2000多年，牽強的找，也有聯繫：都是亡國之君不是。我想題主的意思是兩個看起來應該風馬牛不相及的人物，在歷史上居然是熟悉或是一個時代的:-毫不相關

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

法系車不保值，如果準備常開可以入手，性價比高，價格應該在二至三萬之間，二手車一車一況，一況一價，居體價格看車況。:-錢能水泡:13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？世嘉自動擋

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

17年駕駛證二手:22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？建議買日系二手車，開順了賣了，買新車，昂克賽拉無法再次出手時獲得好價格，而且也不省油，開完日系車直接換德系:-昂克賽拉

如何騎車去臺灣騎行？

騎車在臺灣沒有迴歸內地前，最好不要去臺灣，一是國內政策不允許你去臺灣，因為已停止了臺灣個人遊。二是你偷著去臺灣旅遊，安全沒有保障，偷渡客在哪裡也沒有安全保障的。以後內地政策允許個人去臺灣旅遊了，建議那時再:-騎行臺灣:如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

預算:本人預算5萬左右，想買一輛二手法系車！求推薦？ 5萬預算5萬元左右，想買一輛二手法系車？推薦東風標緻老款308車型。1 5萬元可以買標緻308車況好的，沒大事故呢，年限15年左右，公里數3萬左右，手動檔車型。2 標緻308車型，底盤調教紮實，跑高速穩定:-法系二手

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

道奇你好，好高興回答你的問題！14年進口馬自達5和10年月道奇酷威個人感覺馬自達5比較划算。新車價馬5報價29.99萬，酷威19.38萬兩款車都是原裝進口，馬5屬於日系，酷威屬於美系。兩款車不屬於同類車型:-酷威馬自達 14年:14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

特殊津貼高校人才就要重視，河南省高校人才更要重視，這個人才不是評出了的，而是推薦出來的，沒有推薦，連參評的資格都沒有。國務院特殊津貼人員推薦，不推薦是百分百沒希望，推薦了希望就非常，那麼是什麼是國務院特殊津貼:-河南大學並列 2020年:2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

李老貓說車為你非專業解答各種選車用車問題本田crv定位於一款緊湊級suv產品，主要對飈豐田榮放，日產奇駿，這款車整體市場表現非常突出，2019年全年累計銷量為18.44萬臺，平均月銷1.5萬以上，其深:-舒適版本田油耗:本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

1.世界經濟遭到重創疫情影響之下，各行各業基本屬於停工停產的狀態，在世界經濟趨於一體化的今天，停工停產勢必會造成一系列的連鎖反應，最後導致的結果可能會引發金融危機。2.世界格局可能發生改變美國仍是世界:-頭腦風暴控制:國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？疫情國外

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

如果有15萬元的預算，讓你選擇一臺空間和動力都很不錯的小型SUV，我覺得很多的讀者都會想到本田XRV這款車型。因為本田XRV確實太出色了，和同級別的其他盒子SUV車型相比，這款車在空間和動力上都有優勢:-xrv 自動:本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？本田豪華版

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

何去何從:現在存款有14萬，借了5萬還沒收回來，該做什麼好？續租存款利息率較低，可以投資較高收益的項目，比如投資基金，一般情況下可獲得6%一10%的回報。如果行情好可達到50%以上收益，去年不少基金超過這目標。目前受疫情影響，股市在低位震盪，也是基金投資的機會。一:-存款 2300

2070super和5700xt買哪個比較好？

如果是玩遊戲毫無疑問選擇n卡，也就是2070 suep。如果追求性價比可以選擇a卡，也就是5700xt. 為什麼遊戲選n卡呢？首先遊戲廠商針對n卡優化比較多，然後就是功耗小，然後N卡架構執行效率極高，:-:2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

二胎我是兩個孩子的媽媽，曾經的我和你一樣，生完寶寶我也抑鬱了，我知道抑鬱症真的很痛苦，產後的那段日子我整天都不開心，做什麼事也沒積極性，誰也不想搭理，別人給我說話我就覺得很煩。忍不住衝家人發脾氣。每當一個:-生完抑鬱:生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？發火

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

感覺:人這一生遇到的人和事為什麼感覺都像是必然的經歷？正所謂有因必有果，所以你今天的因，就會產生明天的果。所以這一切你就會覺得是必然的。生活中大部分是普通人大家的生活規律，生活方式，大致相同。當你看到別人家庭的果，自己家也產生同樣的果，你就會覺得這一切是:-人和經歷

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

校內:現在校內校外到底教的是美式英語還是英式英語還是混搭英語？校外英式答案肯定是不唯一的！美式英語現在是主流，少量英式發音也個別存在！但對於孩子來說，肯定是混搭英語，因為孩子肯定不是一直一位老師教下去，肯定會換老師！而老師的發音肯定是既有英式的，也有美式的！就連一些英語:-美式英語

上有老下有小，我們真的跳不出這個人生循環了嗎？

上有老魔咒:上有老下有小，我們真的跳不出這個人生循環了嗎？的確如此，儘管現在不結婚，晚婚的人很多，但是從人類繁洐生息的歷史和大多數人來看，成家立業，生兒育女，家庭仍是主流，一個人的生理，心理和生存需求決定了生存狀態，生兒育女，瞻養父母即是義務責任，也是生活動:-下有小

如果外面正在下小雨，你會突然想起了誰？

想起:如果外面正在下小雨，你會突然想起了誰？我最不忘，還是秋日的雨夜，天又涼了幾分，已經需要披上一件薄薄的外套了。臨窗而望，眼見窗臺上的幾株小植物，葉片上沾了幾滴小雨珠，我總喜歡，用小手電去照它們，這樣的小水滴看起來晶瑩晶瑩的，有一種清清涼涼的:-小雨

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

初中同學:初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？吃飯許久未見，意思就是交情不怎麼樣，無功不受祿，人家憑什麼那麼熱情，難道真的是多年一來忘不了咱們之間的同學情誼，倍感想念了嗎，不是請幫忙、做業務、就是借錢，十有八九十借錢。我建議還是不要去的好，大家都很忙:-許久未見

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

出口心理:現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？愛你更多的是心裡問題，可能對方還沒有優秀到你滿意的程度，更沒有到那種離不開的地步！愛情最終還是要回歸生活，而生活離不開兩個人的相處，父母終究會老，孩子終究會飛，所以選擇自己的伴侶尤為重要，你現在覺得噁心更:-喜歡你

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

再見王瀝川好看:劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？《遇見王瀝川》吧，高以翔的王瀝川太招人稀罕了。長相，身材，家世，人品，才能樣樣好，簡直完美，挑不出任何毛病，實在要說一個缺點的話，那就是太tm完美，天妒英才、才讓他飽受病魔折磨。偶像劇、深情帥氣的男主:-何以笙簫默

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

學歷是求職必備條件。有了工作不能停止對知識的探索。更高的學歷，可以讓你有更專業的技術能力和學習能力，可以讓你拓展自己的交際圈，可以讓你更知名。總之，活到老，學到老，學習對人總是有好處的，技多不壓身嘛！:-字節跳動:計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？讀研計算機專業

生完二胎的你們，現在有什麼感想？

二胎家庭日常是什麼樣的？是不是覺得家裡多了一個小人兒，溫馨多了？不存在的！生二胎根本是媽媽們的渡劫磨礪！以前週末睡到自然醒，現在全年無休，時刻警醒著，能睡一次懶覺跟過年似的，黑眼圈不說，頭髮呼啦啦地掉:-生完二胎感想:生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華北適合種植蠶豆，種蠶豆的面積大，在西北，華北，都在種植蠶豆，蠶豆莖稈根部有根瘤菌是種植其它農作物的好茬地，特別是土壤培養和防病蟲害起到作用。:-蠶豆種植適合:華北適合種植蠶豆嗎？華北

華為手機更新EMUI10.1系統後效果咋樣？

大家知道現在智能手機的性能不僅僅跟智能手機的硬件有關，還跟智能手機的系統軟件息息相關，在國產智能手機操作系統裡，小米的MIUI系統跟華為的EMUI系統都是比較優秀的操作系統。最近小米推出了小米MIUI:-咋樣華為華為手機更新:華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

蜜蜂爬到:大熱天蜜蜂老是爬到箱外結群正常嗎？盜蜂現在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的時間，所以蜂群中是非常容易發生盜蜂的。在蜂群中發生盜蜂的時候，蜂群守衛蜂會增多，但是這種情況引發的蜜蜂在蜂箱外一般不會結團，只是蜜蜂來:-大熱天

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

最佳期霧都山客來回答您的問題。最近山客家鄉的村民正在進行辣椒移栽，確實有像題主提到的情形，辣椒苗移栽前長勢蔥蔥，嫩綠喜人，但是移栽後幾天內就出現萎蔫現象，細心觀察也不是被病蟲害危害。那究竟是什麼原因導致辣椒:-苗蔫辣椒咋回事:辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

最近這幾年手機在電子產品行業裡可謂是發展速度非常快，蘋果和華為兩大公司可以說也是，明爭暗鬥，產品一次比一次有賣點，前一段時間華為和蘋果還都推出了手機新品，兩家都在大力宣傳強調著拍照功能，像iPhone:-形態相機手機最終:手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

5寸手機支持:華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？很高興回答你的問題，刷頭條刷出來的問題，看到很多人回答，感覺還有一些觀點沒有寫出，所以我來回答一下。首先，華為為什麼不出小尺寸全面屏手機？其實並不只有華為一家沒有出小屏手機，放眼近期各大手機廠商發佈的:-華為

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

胡蘿蔔蔬菜:生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？第一種，黃瓜。這個瓜，可不是菜市場中堆放滿滿的青瓜。各位可要睜大眼睛看清楚了，這個黃瓜，青中帶黃，品種屬以前鄉下農戶少量種植的，形態上面來看這種瓜矮、短、圓，表面覆蓋有比較淡的細毛，經水輕輕沖洗之後整:-山芋

為什麼馬鈴薯不宜過早過遲播種？

不宜:為什麼馬鈴薯不宜過早過遲播種？播種過早為什麼馬鈴薯不宜過早過遲播種？馬鈴薯的種植主要是由於氣候條件的限制，過早出苗後容易遇到低溫被凍死，種植晚了容易遇到乾旱和高溫，影響產量。馬鈴薯種植時間的早晚必須根據種植地方的氣候條件來確定。馬鈴薯生長:-馬鈴薯

疫情愈發嚴重，原油為何反而大漲？

原油愈發:疫情愈發嚴重，原油為何反而大漲？疫情愈發嚴重和原油大漲沒有必然關係。但是資金總是從高處流向低處，原油價格跌的越多，投資價值越明顯，相對於其他產業更有投資價值。舉個例子：深圳南山房價均價大約6萬左右，寶安均價5萬左右，如果南山房價漲到:-疫情

生菜球很好吃，怎麼種植才能高產呢？

種植:生菜球很好吃，怎麼種植才能高產呢？高產對環境條件的要求、1.溫度生菜球為喜冷涼、忌高溫作物，種子在4度以上可發芽、以15～20度為發芽適溫。幼苗能耐較低溫度，日平均溫度12度時生長壯健，葉球生長最適溫度為13～16度。不過目前有些結球生菜:-生菜

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？

看下這個戶型三房改四房，改一個小房間，應該沒有問題。△原戶型圖這個戶型改四房，能改的方案比較多，但是修改以後是否好用，是一件值得考慮的事情。一、主臥室變為兩個臥室可以將主臥室改為兩個臥室，但是這樣的改動佔:-房改 122:裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？ 144

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

房子:大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？這個戶型砸牆，當然可以砸牆，但是在砸牆之前，要搞清楚為什麼要砸牆，砸牆以後有什麼優劣。△原戶型原戶型圖上的白色牆體部分不是承重牆，理論上說否可以砸掉。但是外牆和與旁邊戶型或者是公共區域的共用牆體和圖上:-幫忙

意蜂夏季喝什麼水降溫？

降溫意蜂夏季喝什麼水降溫？氣溫高，蜂巢溫度高的情況下，蜜蜂是通過採水的辦法掛在蜂箱的四壁來蒸發帶走熱量，降低蜂巢溫度同時也能幫助蜂群維持正常的溼度。在平常的情況下，蜜蜂是在室外採自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

黃瓜種子:黃瓜種子催芽後種植需要打底水嗎？你好很高興回答這個問題。答案：不用。1-2天可出芽。黃瓜種子催芽：選用飽滿的種子，用30℃水浸泡4小時後催芽。也可用100倍福爾馬林溶液浸泡種子10-20分鐘，洗淨後清水浸種3-4小時，然後於25-3:-催芽黃瓜打底

書友們展示一下自我感覺發揮較好的作品，一起學習？

自我較好這幅作品是參賽的，色彩的搭配，紙張的拼接都是自己設計完成的，一如既往的清新淡雅感覺。書體用的魏碑中楷書，增加了書寫的趣味性。:-書友展示:書友們展示一下自我感覺發揮較好的作品，一起學習？