深度剖析Spark分佈式執行原理

2019-01-28 15:29:23 啟迪雲Tuscloud

讓代碼分佈式運行是所有分佈式計算框架需要解決的最基本的問題。

Spark是大數據領域中相當火熱的計算框架，在大數據分析領域有一統江湖的趨勢，網上對於Spark源碼分析的文章有很多，但是介紹Spark如何處理代碼分佈式執行問題的資料少之又少，這也是我撰寫文本的目的。

Spark運行在JVM之上，任務的執行依賴序列化及類加載機制，因此本文會重點圍繞這兩個主題介紹Spark對代碼分佈式執行的處理。本文假設讀者對Spark、Java、Scala有一定的瞭解，代碼示例基於Scala，Spark源碼基於2.1.0版本。閱讀本文你可以瞭解到：

Java對象序列化機制類加載器的作用Spark對closure序列化的處理Spark Application的class是如何加載的Spark REPL（spark-shell）中的代碼是如何分佈式執行的

根據以上內容，讀者可以基於JVM相關的語言構建一個自己的分佈式計算服務框架。

Java對象序列化

序列化(Serialization)是將對象的狀態信息轉換為可以存儲或傳輸的形式的過程。所謂的狀態信息指的是對象在內存中的數據，Java中一般指對象的字段數據。我們開發Java應用的時候或多或少都處理過對象序列化，對象常見的序列化形式有JSON、XML等。

JDK中內置一個ObjectOutputStream類可以將對象序列化為二進制數據，使用ObjectOutputStream序列化對象時，要求對象所屬的類必須實現java.io.Serializable接口，否則會報java.io.NotSerializableException的異常。

基本的概念先介紹到這。接下來我們一起探討一個問題：Java的方法能否被序列化？

假設我們有如下的SimpleTask類（Java類）：

import java.io.Serializable;
public abstract class Task implements Serializable {
 public void run() {
 System.out.println("run task!");
 }
}
public class SimpleTask extends Task {
 @Override
 public void run() {
 System.out.println("run simple task!");
 }
}

還有一個用於將對象序列化到文件的工具類FileSerializer：

import java.io.{FileInputStream, FileOutputStream, ObjectInputStream, ObjectOutputStream}
object FileSerializer {
 def writeObjectToFile(obj: Object, file: String) = {
 val fileStream = new FileOutputStream(file)
 val oos = new ObjectOutputStream(fileStream)
 oos.writeObject(obj)
 oos.close()
 }
 def readObjectFromFile(file: String): Object = {
 val fileStream = new FileInputStream(file)
 val ois = new ObjectInputStream(fileStream)
 val obj = ois.readObject()
 ois.close()
 obj
 }
}

簡單起見，我們採用將對象序列化到文件，然後通過反序列化執行的方式來模擬代碼的分佈式執行。SimpleTask就是我們需要模擬分佈式執行的代碼。我們先將SimpleTask序列化到文件中：

val task = new SimpleTask()
FileSerializer.writeObjectToFile(task, "task.ser")

然後將SimpleTask類從我們的代碼中刪除，此時只有task.ser文件中含有task對象的序列化數據。接下來我們執行下面的代碼：

val task = FileSerializer.readObjectFromFile("task.ser").asInstanceOf[Task]
task.run()

請各位讀者思考，上面的代碼執行後會出現什麼樣的結果？

輸出：run simple task! ?輸出：run task! ?還是會報錯？

實際執行會出現形如下面的異常：

Exception in thread "main" java.lang.ClassNotFoundException: site.stanzhai.serialization.SimpleTask
 at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
 at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
 at java.lang.Class.forName0(Native Method)
 at java.lang.Class.forName(Class.java:348)
 at java.io.ObjectInputStream.resolveClass(ObjectInputStream.java:628)
 at java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:1620)
 at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1521)
 at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:1781) 

 at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1353)
 at java.io.ObjectInputStream.readObject(ObjectInputStream.java:373)
 at site.stanzhai.serialization.FileSerializer$.readObjectFromFile(FileSerializer.scala:20)

從異常信息來看，反序列過程中找不到SimpleTask類。由此可以推斷序列化後的數據是不包含類的定義信息的。那麼，ObjectOutputStream到底序列化了哪些信息呢？

對ObjectOutputStream實現機制感興趣的同學可以去看下JDK中這個類的實現，ObjectOutputStream序列化對象時，從父類的數據開始序列化到子類，如果override了writeObject方法，會反射調用writeObject來序列化數據。序列化的數據會按照以下的順序以二進制的形式輸出到OutputStream中：

類的descriptor（僅僅是類的描述信息，不包含類的定義）對象的primitive類型數據(int,boolean等，String和Array是特殊處理的)對象的其他obj數據

回到我們的問題上：Java的方法能否被序列化？通過我們代碼示例及分析，想必大家對這個問題應該清楚了。通過ObjectOutputStream序列化對象，僅包含類的描述（而非定義），對象的狀態數據，由於缺少類的定義，也就是缺少SimpleTask的字節碼，反序列化過程中就會出現ClassNotFound的異常。

如何讓我們反序列化的對象能正常使用呢？我們還需要了解類加載器。

類加載器：ClassLoader

ClassLoader在Java中是一個抽象類，ClassLoader的作用是加載類，給定一個類名，ClassLoader會嘗試查找或生成類的定義，一種典型的加載策略是將類名對應到文件名上，然後從文件系統中加載class file。

在我們的示例中，反序列化SimpleTask失敗，是因為JVM找不到類的定義，因此要確保正常反序列化，我們必須將SimpleTask的class文件保存下來，反序列化的時候能夠讓ClassLoader加載到SimpleTask的class。

接下來，我們對代碼做一些改造，添加一個ClassManipulator類，用於將對象的class文件導出到當前目錄的文件中，默認的文件名就是對象的類名（不含包名）：

object ClassManipulator {
 def saveClassFile(obj: AnyRef): Unit = {
 val classLoader = obj.getClass.getClassLoader
 val className = obj.getClass.getName
 val classFile = className.replace('.', '/') + ".class"
 val stream = classLoader.getResourceAsStream(classFile)
 // just use the class simple name as the file name
 val outputFile = className.split('.').last + ".class"
 val fileStream = new FileOutputStream(outputFile)
 var data = stream.read()
 while (data != -1) {
 fileStream.write(data)
 data = stream.read()
 }
 fileStream.flush()
 fileStream.close()
 }
}

按照JVM的規範，假設對package.Simple這樣的一個類編譯，編譯後的class文件為package/Simple.class，因此我們可以根據路徑規則，從當前JVM進程的Resource中得到指定類的class數據。

在刪除SimpleTask前，我們除了將task序列化到文件外，還需要將task的class文件保存起來，執行完下面的代碼，SimpleTask類就可以從代碼中剔除了：

val task = new SimpleTask()
FileSerializer.writeObjectToFile(task, "task.ser")
ClassManipulator.saveClassFile(task)

由於我們保存class文件的方式比較特殊，既不在jar包中，也不是按package/ClassName.class這種標準的保存方式，因此還需要實現一個自定義的FileClassLoader按照我們保存class文件的方式來加載所需的類：

class FileClassLoader() extends ClassLoader {
 override def findClass(fullClassName: String): Class[_] = {
 val file = fullClassName.split('.').last + ".class"
 val in = new FileInputStream(file)
 val bos = new ByteArrayOutputStream
 val bytes = new Array[Byte](4096)
 var done = false
 while (!done) {
 val num = in.read(bytes)
 if (num >= 0) {
 bos.write(bytes, 0, num)
 } else {
 done = true
 }
 }
 val data = bos.toByteArray
 defineClass(fullClassName, data, 0, data.length)
 }
}

ObjectInputStream類用於對象的反序列化，在反序列化過程中，它根據序列化數據中類的descriptor信息，調用resolveClass方法加載對應的類，但是通過Class.forName加載class使用的並不是我們自定義的FileClassLoader，所以如果直接使用ObjectInputStream進行反序列，依然會因為找不到類而報錯，下面是resolveClass的源碼：

protected Class> resolveClass(ObjectStreamClass desc)
 throws IOException, ClassNotFoundException
{
 String name = desc.getName();
 try {
 return Class.forName(name, false, latestUserDefinedLoader());
 } catch (ClassNotFoundException ex) {
 Class> cl = primClasses.get(name);
 if (cl != null) {
 return cl;
 } else {
 throw ex;
 }
 }
}

為了能讓ObjectInputStream在序列化的過程中使用我們自定義的ClassLoader，我們還需要對FileSerializer中的readObjectFromFile方法做些改造，修改的代碼如下：

def readObjectFromFile(file: String, classLoader: ClassLoader): Object = {
 val fileStream = new FileInputStream(file)
 val ois = new ObjectInputStream(fileStream) {
 override def resolveClass(desc: ObjectStreamClass): Class[_] =
 Class.forName(desc.getName, false, classLoader)
 }
 val obj = ois.readObject()
 ois.close()
 obj
}

最後，我們將反序列化的代碼調整為：

val fileClassLoader = new FileClassLoader()
val task = FileSerializer.readObjectFromFile("task.ser", fileClassLoader).asInstanceOf[Task]
task.run()

反序列化的過程中能夠通過fileClassLoader加載到所需的類，這樣我們在執行就不會出錯了，最終的執行結果為：run simple task!。到此為止，我們已經完整地模擬了代碼分佈式執行的過程。完整的示例代碼，請參閱：https://github.com/stanzhai/jvm-exercise/tree/master/src/main/scala/site/stanzhai/exercise/serialization

Spark對closure序列化的處理

我們依然通過一個示例，快速瞭解下Scala對閉包的處理，下面是從Scala的REPL中執行的代碼：

scala> val n = 2
n: Int = 2
scala> val f = (x: Int) => x * n
f: Int => Int = <function1>
scala> Seq.range(0, 5).map(f)
res0: Seq[Int] = List(0, 2, 4, 6, 8)
/<function1>

f是採用Scala的=>語法糖定義的一個閉包，為了弄清楚Scala是如何處理閉包的，我們繼續執行下面的代碼：

scala> f.getClass
res0: Class[_ <: int=""> Int] = class $anonfun$1
scala> f.isInstanceOf[Function1[Int, Int]]
res1: Boolean = true
scala> f.isInstanceOf[Serializable]
res2: Boolean = true

可以看出f對應的類為$anonfun$1是Function1[Int, Int]的子類，而且實現了Serializable接口，這說明f是可以被序列化的。

Spark對於數據的處理基本都是基於閉包，下面是一個簡單的Spark分佈式處理數據的代碼片段：

val spark = SparkSession.builder().appName("demo").master("local").getOrCreate()
val sc = spark.sparkContext
val data = Array(1, 2, 3, 4, 5)
val distData = sc.parallelize(data)
val sum = distData.map(x => x * 2).sum()
println(sum) // 30.0

對於distData.map(x => x * 2)，map中傳的一個匿名函數，也是一個非常簡單的閉包，對distData中的每個元素*2，我們知道對於這種形式的閉包，Scala編譯後是可以序列化的，所以我們的代碼能正常執行也合情合理。將入我們將處理函數的閉包定義到一個類中，然後將代碼改造為如下形式：

class Operation {
 val n = 2
 def multiply = (x: Int) => x * n
}
...
val sum = distData.map(new Operation().multiply).sum()
...

我們在去執行，會出現什麼樣的結果呢？實際執行會出現這樣的異常：

Exception in thread "main" org.apache.spark.SparkException: Task not serializable
 at org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala:298)
 ...
Caused by: java.io.NotSerializableException: Operation

Scala在構造閉包的時候會確定他所依賴的外部變量，並將它們的引用存到閉包對象中，這樣能保證在不同的作用域中調用閉包不出現問題。

出現Task not serializable的異常，是由於我們的multiply函數依賴Operation類的變量n，雖然multiply是支持序列化的，但是Operation不支持序列化，這導致multiply函數在序列化的過程中出現了NotSerializable的異常，最終導致我們的Task序列化失敗。為了確保multiply能被正常序列化，我們需要想辦法去除對Operation的依賴，我們將代碼做如下修改，在去執行就可以了：

class Operation {
 def multiply = (x: Int) => x * 2
}
...
val sum = distData.map(new Operation().multiply).sum()
...

Spark對閉包序列化前，會通過工具類org.apache.spark.util.ClosureCleaner嘗試clean掉閉包中無關的外部對象引用，ClosureCleaner對閉包的處理是在運行期間，相比Scala編譯器，能更精準的去除閉包中無關的引用。這樣做，一方面可以儘可能保證閉包可被序列化，另一方面可以減少閉包序列化後的大小，便於網絡傳輸。

我們在開發Spark應用的時候，如果遇到Task not serializable的異常，就需要考慮下，閉包中是否或引用了無法序列化的對象，有的話，嘗試去除依賴就可以了。

Spark中實現的序列化工具有多個：

從SparkEnv類的實現來看，用於閉包序列化的是JavaSerializer:

JavaSerializer內部使用的是ObjectOutputStream將閉包序列化：

private[spark] class JavaSerializationStream(
 out: OutputStream, counterReset: Int, extraDebugInfo: Boolean)
 extends SerializationStream {
 private val objOut = new ObjectOutputStream(out)
 ...
}

將閉包反序列化的核心代碼為：

private[spark] class JavaDeserializationStream(in: InputStream, loader: ClassLoader)
 extends DeserializationStream {
 private val objIn = new ObjectInputStream(in) {
 override def resolveClass(desc: ObjectStreamClass): Class[_] =
 try {
 Class.forName(desc.getName, false, loader)
 } catch {
 case e: ClassNotFoundException =>
 JavaDeserializationStream.primitiveMappings.getOrElse(desc.getName, throw e)
 }
 }
 ...
}

關於ObjectInputStream我們前面已有介紹，JavaDeserializationStream有個關鍵的成員變量loader，它是個ClassLoader，可以讓Spark使用非默認的ClassLoader按照自定義的加載策略去加載class，這樣才能保證反序列化過程在其他節點正常進行。

通過前面的介紹，想要代碼在另一端執行，只有序列化還不行，還需要保證執行端能夠加載到閉包對應的類。接下來我們探討Spark加載class的機制。

Spark Application的class是如何加載的

通常情況下我們會將開發的Spark Application打包為jar包，然後通過spark-submit命令提交到集群運行，下面是一個官網的示例：

./bin/spark-submit \
 --class org.apache.spark.examples.SparkPi \
 ... \
 --jars /path/to/dep-libs.jar \
 /path/to/examples.jar \

此時，我們編寫的代碼中所包含的閉包，對應的類已經被編譯到jar包中了，所以Executor端只要能加載到這個jar包，從jar包中定位閉包的class文件，就可以將閉包反序列化了。事實上Spark也是這麼做的。

Spark Application的Driver端在運行的時候會基於netty建立一個文件服務，我們運行的jar包，及--jars中指定的依賴jar包，會被添加到文件服務器中。這個過程在SparkContext的addJar方法中完成：

/**
 * Adds a JAR dependency for all tasks to be executed on this SparkContext in the future.
 * The `path` passed can be either a local file, a file in HDFS (or other Hadoop-supported
 * filesystems), an HTTP, HTTPS or FTP URI, or local:/path for a file on every worker node.
 */
def addJar(path: String) {
 if (path == null) {
 logWarning("null specified as parameter to addJar")
 } else {
 var key = ""
 if (path.contains("\")) {
 // For local paths with backslashes on Windows, URI throws an exception
 key = env.rpcEnv.fileServer.addJar(new File(path))
 } else {
 val uri = new URI(path)
 // SPARK-17650: Make sure this is a valid URL before adding it to the list of dependencies
 Utils.validateURL(uri)
 key = uri.getScheme match { 

 // A JAR file which exists only on the driver node
 case null | "file" =>
 try {
 env.rpcEnv.fileServer.addJar(new File(uri.getPath))
 } catch {
 case exc: FileNotFoundException =>
 logError(s"Jar not found at $path")
 null
 }
 // A JAR file which exists locally on every worker node
 case "local" =>
 "file:" + uri.getPath
 case _ =>
 path
 }
 }
 if (key != null) {
 val timestamp = System.currentTimeMillis
 if (addedJars.putIfAbsent(key, timestamp).isEmpty) {
 logInfo(s"Added JAR $path at $key with timestamp $timestamp")
 postEnvironmentUpdate()
 }
 }
 }
}

Executor端在執行任務的時候，會從任務信息中得到依賴的jar包，然後updateDependencies從Driver端的文件服務器下載缺失的jar包，並將jar包添加到URLClassLoader中，最後再將task反序列化，反序列化前所需的jar都已準備好，因此能夠將task中的閉包正常反序列化，核心代碼如下：

override def run(): Unit = {
 ...
 try {
 val (taskFiles, taskJars, taskProps, taskBytes) =
 Task.deserializeWithDependencies(serializedTask)
 // Must be set before updateDependencies() is called, in case fetching dependencies
 // requires access to properties contained within (e.g. for access control).
 Executor.taskDeserializationProps.set(taskProps)
 updateDependencies(taskFiles, taskJars)
 task = ser.deserialize[Task[Any]](taskBytes, Thread.currentThread.getContextClassLoader)
 ...
 } finally { 

 runningTasks.remove(taskId)
 }
}

這麼來看，整個Spark Application分佈式加載class的機制就比較清晰了。Executor端能夠正常加載class，反序列化閉包，分佈式執行代碼自然就不存在什麼問題了。

Spark REPL（spark-shell）中的代碼是如何分佈式執行的

spark-shell是Spark為我們提供的一個REPL的工具，可以讓我們非常方便的寫一些簡單的數據處理腳本。下面是一個運行在spark-shell的代碼：

scala> val f = (x: Int) => x + 1
f: Int => Int = <function1>
scala> val data = Array(1, 2, 3, 4, 5)
data: Array[Int] = Array(1, 2, 3, 4, 5)
scala> val distData = sc.parallelize(data)
distData: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:26
scala> distData.map(f).sum()
res0: Double = 20.0
/<console>/<function1>

我們已知，閉包f會被Scala編譯為匿名類，如果要將f序列化到Executor端執行，必須要加載f對應的匿名類的class數據，才能正常反序列化。

Spark是如何得到f的class數據的？Executor又是如何加載到的？

源碼面前，了無秘密。我們看一下Spark的repl項目的代碼入口，核心代碼如下：

object Main extends Logging { 

 ...
 val rootDir = conf.getOption("spark.repl.classdir").getOrElse(Utils.getLocalDir(conf))
 val outputDir = Utils.createTempDir(root = rootDir, namePrefix = "repl")
 def main(args: Array[String]) {
 doMain(args, new SparkILoop)
 }
 // Visible for testing
 private[repl] def doMain(args: Array[String], _interp: SparkILoop): Unit = {
 interp = _interp
 val jars = Utils.getUserJars(conf, isShell = true).mkString(File.pathSeparator)
 val interpArguments = List(
 "-Yrepl-class-based",
 "-Yrepl-outdir", s"${outputDir.getAbsolutePath}",
 "-classpath", jars
 ) ++ args.toList
 val settings = new GenericRunnerSettings(scalaOptionError)
 settings.processArguments(interpArguments, true)
 if (!hasErrors) {
 interp.process(settings) // Repl starts and goes in loop of R.E.P.L
 Option(sparkContext).map(_.stop)
 }
 }
 ...
}

Spark2.1.0的REPL基於Scala-2.11的scala.tools.nsc編譯工具實現，代碼已經相當簡潔，Spark給interp設置了2個關鍵的配置-Yrepl-class-based和-Yrepl-outdir，通過這兩個配置，我們在shell中輸入的代碼會被編譯為class文件輸出到執行的文件夾中。如果指定了spark.repl.classdir配置，會用這個配置的路徑作為class文件的輸出路徑，否則使用SPARK_LOCAL_DIRS對應的路徑。下面是我測試過程中輸出到文件夾中的class文件：

我們已經清楚Spark如何將shell中的代碼編譯為class了，那麼Executor端，如何加載到這些class文件呢？在org/apache/spark/executor/Executor.scala中有段和REPL相關的代碼：

private val urlClassLoader = createClassLoader()
private val replClassLoader = addReplClassLoaderIfNeeded(urlClassLoader)
/**
 * If the REPL is in use, add another ClassLoader that will read
 * new classes defined by the REPL as the user types code
 */
private def addReplClassLoaderIfNeeded(parent: ClassLoader): ClassLoader = {
 val classUri = conf.get("spark.repl.class.uri", null)
 if (classUri != null) {
 logInfo("Using REPL class URI: " + classUri)
 try {
 val _userClassPathFirst: java.lang.Boolean = userClassPathFirst
 val klass = Utils.classForName("org.apache.spark.repl.ExecutorClassLoader")
 .asInstanceOf[Class[_ <: classloader=""> val constructor = klass.getConstructor(classOf[SparkConf], classOf[SparkEnv],
 classOf[String], classOf[ClassLoader], classOf[Boolean])
 constructor.newInstance(conf, env, classUri, parent, _userClassPathFirst)
 } catch {
 case _: ClassNotFoundException =>
 logError("Could not find org.apache.spark.repl.ExecutorClassLoader on classpath!")
 System.exit(1)
 null
 }
 } else {
 parent
 }
}
override def run(): Unit = {
 ...
 Thread.currentThread.setContextClassLoader(replClassLoader)
 val ser = env.closureSerializer.newInstance()
 ...
}

Executor啟動時會判斷是否為REPL模式，如果是的話會使用ExecutorClassLoader做為反序列閉包時所使用的ClassLoader，ExecutorClassLoader會通過網絡從Driver端（也就是執行spark-shell的節點）加載所需的class文件。這樣我們在spark-shell中寫的代碼就可以分佈式執行了。

總結

Spark實現代碼的分佈式執行有2個關鍵點：

對象必須可序列化
Executor端能夠加載到所需類的class文件，保證反序列化過程不出錯，這點通過自定義的ClassLoader來保障

滿足以上2個條件，我們的代碼就可以分佈式運行了。

當然，構建一個完整的分佈式計算框架，還需要有網絡通信框架、RPC、文件傳輸服務等作為支撐，在瞭解Spark代碼分佈式執行原理的基礎上，相信讀者已有思路基於JVM相關的語言構建分佈式計算服務。

類比其他非JVM相關的語言，實現一個分佈式計算框架，依然是需要解決序列化，動態加載執行代碼的問題。

本文首發於知乎：大數據Spark

https://zhuanlan.zhihu.com/p/25772054

分享到:

閱讀更多 啟迪雲Tuscloud 的文章

關鍵字: 分佈式計算框架代碼

Spark-local本地環境搭建

Spark SQL

Spark 網頁式開發（五）

Spark SQL 使用反射推斷模式

Spark SQL簡介

Spark 安裝教程

Spark RDD介紹

Spark 簡介與特徵

Spark 網頁式開發（二）

Spark 網頁式開發（一）

spark-submit之後，spark集群內發生了什麼？讓我們一探究竟

03.02 Spark+Zookeeper搭建高可用Spark集群

Spark SQL常見4種數據源詳解

Spark 機器學習四大類算法

Spark for Java: SparkCore RDD Value類型方法案例

Spark SQL概述

12.21 Spark RDD 概念以及核心原理

Spark Troubleshooting（故障排除）

Spark 數據傾斜解決方案

Spark JVM調優

Spark Shuffle調優

Spark 算子調優

Spark 常規性能調優

Spark BlockManager解析

Spark 內存管理

Spark-Core：調度

大數據乾貨分享：Spark Streaming 數據清理機制

Spark 核心概念

Spark Streaming狀態管理函數的選擇比較

hive on spark,spark sql 對比測試結果相差很大

Spark，從入門到精通

Hello Spark!

Spark Standalone集群模式部署（Window）及其Python開發環境搭建

11.14 Spark——診斷內存消耗

Spark-關於Shuffle

Spark 處理大數據的異常解決方案彙總

Spark Streaming VS Flink

Spark Graphx的API操作

Spark SQL與DataFrame詳解以及使用

Spark 彈性分佈式數據集（RDD）

Spark SQL支持的功能測試

Spark Shuffle 過程

spark-sql對多層級parquet支持

spark hadoop數據傾斜問題

Spark Runtime概述

Spark Streaming的容錯

Spark 讀取單個文本文件速度很慢解決方法

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

沒有取得房抄產證的房子可以轉讓。但如果確定無法取得房產證的，房產轉讓不受法律保襲護。一般情況下，只有取得房產證的房屋才能確定房屋產權人，才具有轉讓的條件。但如果房屋是合法取得的，以百後可以依法辦理度房:-轉賣房產證商品房拿到:我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

鋒利突厥人你這樣說只能說明你對歷史非常不瞭解，我先用一句話概括突厥被大唐雄兵打的有多慘：三次滅國，背井離鄉，遠赴西亞，打不過，俺躲著你還不行嗎？突厥的意思是中間慫起的頭盔。其來歷已經不可靠，可能有著匈奴、鮮卑或:-復國大唐:為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

小高層 60:小高層16層高樓間距60米哪一層比較好？首先需要明白，選擇層數居住與樓間距毫無關係，住在哪一層，肉眼看對面樓的距離，是相差不大的。設定樓間距60米，純粹是混淆視聽。其實，一幢樓的樓層總數確定的情況下，到底哪一層最佳？很簡單，取總層數乘以黃金:-樓間距層高

金銀花盆栽好養嗎？怎麼養？

金銀花可以盆栽，很好養的！金銀花，是忍冬科的常綠纏繞灌木，枝條柔韌修長，多攀爬或匍匐生長。金銀花生性強健，在我國的很多南方省份野外很多地區都能看到它的身影，葉子常年翠綠，到夏季開花，飄香四溢。所以，有:-金銀花盆栽:金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

長城真的無用嗎？在今天許多人認為長城無用，古代國家舉國之力建造的長城不過只是文物，就連康熙都曾作詩諷刺，原文如下：萬里經營到海涯，紛紛調發逐浮誇。當時用盡生民力，天下何曾屬爾家。-康熙但真的如此嗎？小:-匈奴抵禦長城:長城對於抵禦古代匈奴和蒙古人起到了多大作用？蒙古人

什麼樹可以嫁接臘梅？

臘梅只能嫁接在不同品種的臘梅上，其他的樹種不行！臘梅的繁殖可以用播種，壓條，嫁接，分株等繁殖方法。播種法因不易保持花卉的原有優良特性，且播種的優點是在於大量繁殖，而臘梅大都只需培植少量幾株，故一般都不:-臘梅嫁接:什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

堪憂五一假期:行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？事實上，因為教育培訓都是預收費用的模式。但凡有一點點規模的培訓機構老師。在上半年，帶課量是可以得到保證。:-課時量

在農村“立夏節”都有哪些民間習俗？

民間習俗農村:在農村“立夏節”都有哪些民間習俗？在農村“立夏節”都有哪些民間習俗一、農村立夏常見的習俗風俗活動：1、吃雞蛋“立夏吃蛋”習俗由來已久，俗話說“立夏吃了蛋，夏天不疰夏”。據說立夏開始天氣越來越熱，村裡小孩兒會有身體疲勞四肢無力的感覺，吃:-立夏節

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

失望分手看法:男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？你的這個問題特別的有趣，我覺得你先不要看你要怎麼做才讓他才能讓他對你的印象有所改變，你要去看為什麼是兩個月之後可以在一起，這兩個月他會用來做什麼，為什麼會有這兩個月？例如他的身體碰到了什麼樣的問題嗎？:-答應我

工程分包乙方人員傷殘誰承擔？

承擔:工程分包乙方人員傷殘誰承擔？分包乙方分包致人傷殘責任誰承擔？嚴格來說，需要了解更多傷殘原因才能區分的，作為非專業人士，自己發表一點淺見供題主參考：1、如果甲方是央企的話，他們合同中的責任、義務等條款內已經將自己的責任全部撇開了，更會:-乙方傷殘

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

實際上:有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？歷史人物聯繫這個詞貌似太寬泛了，就好像有一個調皮的答案說的，胡亥和溥儀相隔2000多年，牽強的找，也有聯繫：都是亡國之君不是。我想題主的意思是兩個看起來應該風馬牛不相及的人物，在歷史上居然是熟悉或是一個時代的:-毫不相關

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

法系車不保值，如果準備常開可以入手，性價比高，價格應該在二至三萬之間，二手車一車一況，一況一價，居體價格看車況。:-錢能水泡:13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？世嘉自動擋

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

17年駕駛證二手:22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？建議買日系二手車，開順了賣了，買新車，昂克賽拉無法再次出手時獲得好價格，而且也不省油，開完日系車直接換德系:-昂克賽拉

如何騎車去臺灣騎行？

騎車在臺灣沒有迴歸內地前，最好不要去臺灣，一是國內政策不允許你去臺灣，因為已停止了臺灣個人遊。二是你偷著去臺灣旅遊，安全沒有保障，偷渡客在哪裡也沒有安全保障的。以後內地政策允許個人去臺灣旅遊了，建議那時再:-騎行臺灣:如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

預算:本人預算5萬左右，想買一輛二手法系車！求推薦？ 5萬預算5萬元左右，想買一輛二手法系車？推薦東風標緻老款308車型。1 5萬元可以買標緻308車況好的，沒大事故呢，年限15年左右，公里數3萬左右，手動檔車型。2 標緻308車型，底盤調教紮實，跑高速穩定:-法系二手

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

道奇你好，好高興回答你的問題！14年進口馬自達5和10年月道奇酷威個人感覺馬自達5比較划算。新車價馬5報價29.99萬，酷威19.38萬兩款車都是原裝進口，馬5屬於日系，酷威屬於美系。兩款車不屬於同類車型:-酷威馬自達 14年:14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

特殊津貼高校人才就要重視，河南省高校人才更要重視，這個人才不是評出了的，而是推薦出來的，沒有推薦，連參評的資格都沒有。國務院特殊津貼人員推薦，不推薦是百分百沒希望，推薦了希望就非常，那麼是什麼是國務院特殊津貼:-河南大學並列 2020年:2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

李老貓說車為你非專業解答各種選車用車問題本田crv定位於一款緊湊級suv產品，主要對飈豐田榮放，日產奇駿，這款車整體市場表現非常突出，2019年全年累計銷量為18.44萬臺，平均月銷1.5萬以上，其深:-舒適版本田油耗:本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

1.世界經濟遭到重創疫情影響之下，各行各業基本屬於停工停產的狀態，在世界經濟趨於一體化的今天，停工停產勢必會造成一系列的連鎖反應，最後導致的結果可能會引發金融危機。2.世界格局可能發生改變美國仍是世界:-頭腦風暴控制:國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？疫情國外

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

如果有15萬元的預算，讓你選擇一臺空間和動力都很不錯的小型SUV，我覺得很多的讀者都會想到本田XRV這款車型。因為本田XRV確實太出色了，和同級別的其他盒子SUV車型相比，這款車在空間和動力上都有優勢:-xrv 自動:本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？本田豪華版

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

何去何從:現在存款有14萬，借了5萬還沒收回來，該做什麼好？續租存款利息率較低，可以投資較高收益的項目，比如投資基金，一般情況下可獲得6%一10%的回報。如果行情好可達到50%以上收益，去年不少基金超過這目標。目前受疫情影響，股市在低位震盪，也是基金投資的機會。一:-存款 2300

2070super和5700xt買哪個比較好？

如果是玩遊戲毫無疑問選擇n卡，也就是2070 suep。如果追求性價比可以選擇a卡，也就是5700xt. 為什麼遊戲選n卡呢？首先遊戲廠商針對n卡優化比較多，然後就是功耗小，然後N卡架構執行效率極高，:-:2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

二胎我是兩個孩子的媽媽，曾經的我和你一樣，生完寶寶我也抑鬱了，我知道抑鬱症真的很痛苦，產後的那段日子我整天都不開心，做什麼事也沒積極性，誰也不想搭理，別人給我說話我就覺得很煩。忍不住衝家人發脾氣。每當一個:-生完抑鬱:生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？發火

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

感覺:人這一生遇到的人和事為什麼感覺都像是必然的經歷？正所謂有因必有果，所以你今天的因，就會產生明天的果。所以這一切你就會覺得是必然的。生活中大部分是普通人大家的生活規律，生活方式，大致相同。當你看到別人家庭的果，自己家也產生同樣的果，你就會覺得這一切是:-人和經歷

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

校內:現在校內校外到底教的是美式英語還是英式英語還是混搭英語？校外英式答案肯定是不唯一的！美式英語現在是主流，少量英式發音也個別存在！但對於孩子來說，肯定是混搭英語，因為孩子肯定不是一直一位老師教下去，肯定會換老師！而老師的發音肯定是既有英式的，也有美式的！就連一些英語:-美式英語

上有老下有小，我們真的跳不出這個人生循環了嗎？

上有老魔咒:上有老下有小，我們真的跳不出這個人生循環了嗎？的確如此，儘管現在不結婚，晚婚的人很多，但是從人類繁洐生息的歷史和大多數人來看，成家立業，生兒育女，家庭仍是主流，一個人的生理，心理和生存需求決定了生存狀態，生兒育女，瞻養父母即是義務責任，也是生活動:-下有小

如果外面正在下小雨，你會突然想起了誰？

想起:如果外面正在下小雨，你會突然想起了誰？我最不忘，還是秋日的雨夜，天又涼了幾分，已經需要披上一件薄薄的外套了。臨窗而望，眼見窗臺上的幾株小植物，葉片上沾了幾滴小雨珠，我總喜歡，用小手電去照它們，這樣的小水滴看起來晶瑩晶瑩的，有一種清清涼涼的:-小雨

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

初中同學:初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？吃飯許久未見，意思就是交情不怎麼樣，無功不受祿，人家憑什麼那麼熱情，難道真的是多年一來忘不了咱們之間的同學情誼，倍感想念了嗎，不是請幫忙、做業務、就是借錢，十有八九十借錢。我建議還是不要去的好，大家都很忙:-許久未見

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

出口心理:現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？愛你更多的是心裡問題，可能對方還沒有優秀到你滿意的程度，更沒有到那種離不開的地步！愛情最終還是要回歸生活，而生活離不開兩個人的相處，父母終究會老，孩子終究會飛，所以選擇自己的伴侶尤為重要，你現在覺得噁心更:-喜歡你

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

再見王瀝川好看:劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？《遇見王瀝川》吧，高以翔的王瀝川太招人稀罕了。長相，身材，家世，人品，才能樣樣好，簡直完美，挑不出任何毛病，實在要說一個缺點的話，那就是太tm完美，天妒英才、才讓他飽受病魔折磨。偶像劇、深情帥氣的男主:-何以笙簫默

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

學歷是求職必備條件。有了工作不能停止對知識的探索。更高的學歷，可以讓你有更專業的技術能力和學習能力，可以讓你拓展自己的交際圈，可以讓你更知名。總之，活到老，學到老，學習對人總是有好處的，技多不壓身嘛！:-字節跳動:計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？讀研計算機專業

生完二胎的你們，現在有什麼感想？

二胎家庭日常是什麼樣的？是不是覺得家裡多了一個小人兒，溫馨多了？不存在的！生二胎根本是媽媽們的渡劫磨礪！以前週末睡到自然醒，現在全年無休，時刻警醒著，能睡一次懶覺跟過年似的，黑眼圈不說，頭髮呼啦啦地掉:-生完二胎感想:生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華北適合種植蠶豆，種蠶豆的面積大，在西北，華北，都在種植蠶豆，蠶豆莖稈根部有根瘤菌是種植其它農作物的好茬地，特別是土壤培養和防病蟲害起到作用。:-蠶豆種植適合:華北適合種植蠶豆嗎？華北

華為手機更新EMUI10.1系統後效果咋樣？

大家知道現在智能手機的性能不僅僅跟智能手機的硬件有關，還跟智能手機的系統軟件息息相關，在國產智能手機操作系統裡，小米的MIUI系統跟華為的EMUI系統都是比較優秀的操作系統。最近小米推出了小米MIUI:-咋樣華為華為手機更新:華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

蜜蜂爬到:大熱天蜜蜂老是爬到箱外結群正常嗎？盜蜂現在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的時間，所以蜂群中是非常容易發生盜蜂的。在蜂群中發生盜蜂的時候，蜂群守衛蜂會增多，但是這種情況引發的蜜蜂在蜂箱外一般不會結團，只是蜜蜂來:-大熱天

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

最佳期霧都山客來回答您的問題。最近山客家鄉的村民正在進行辣椒移栽，確實有像題主提到的情形，辣椒苗移栽前長勢蔥蔥，嫩綠喜人，但是移栽後幾天內就出現萎蔫現象，細心觀察也不是被病蟲害危害。那究竟是什麼原因導致辣椒:-苗蔫辣椒咋回事:辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

最近這幾年手機在電子產品行業裡可謂是發展速度非常快，蘋果和華為兩大公司可以說也是，明爭暗鬥，產品一次比一次有賣點，前一段時間華為和蘋果還都推出了手機新品，兩家都在大力宣傳強調著拍照功能，像iPhone:-形態相機手機最終:手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

5寸手機支持:華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？很高興回答你的問題，刷頭條刷出來的問題，看到很多人回答，感覺還有一些觀點沒有寫出，所以我來回答一下。首先，華為為什麼不出小尺寸全面屏手機？其實並不只有華為一家沒有出小屏手機，放眼近期各大手機廠商發佈的:-華為

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

胡蘿蔔蔬菜:生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？第一種，黃瓜。這個瓜，可不是菜市場中堆放滿滿的青瓜。各位可要睜大眼睛看清楚了，這個黃瓜，青中帶黃，品種屬以前鄉下農戶少量種植的，形態上面來看這種瓜矮、短、圓，表面覆蓋有比較淡的細毛，經水輕輕沖洗之後整:-山芋

為什麼馬鈴薯不宜過早過遲播種？

不宜:為什麼馬鈴薯不宜過早過遲播種？播種過早為什麼馬鈴薯不宜過早過遲播種？馬鈴薯的種植主要是由於氣候條件的限制，過早出苗後容易遇到低溫被凍死，種植晚了容易遇到乾旱和高溫，影響產量。馬鈴薯種植時間的早晚必須根據種植地方的氣候條件來確定。馬鈴薯生長:-馬鈴薯

疫情愈發嚴重，原油為何反而大漲？

原油愈發:疫情愈發嚴重，原油為何反而大漲？疫情愈發嚴重和原油大漲沒有必然關係。但是資金總是從高處流向低處，原油價格跌的越多，投資價值越明顯，相對於其他產業更有投資價值。舉個例子：深圳南山房價均價大約6萬左右，寶安均價5萬左右，如果南山房價漲到:-疫情

生菜球很好吃，怎麼種植才能高產呢？

種植:生菜球很好吃，怎麼種植才能高產呢？高產對環境條件的要求、1.溫度生菜球為喜冷涼、忌高溫作物，種子在4度以上可發芽、以15～20度為發芽適溫。幼苗能耐較低溫度，日平均溫度12度時生長壯健，葉球生長最適溫度為13～16度。不過目前有些結球生菜:-生菜

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？

看下這個戶型三房改四房，改一個小房間，應該沒有問題。△原戶型圖這個戶型改四房，能改的方案比較多，但是修改以後是否好用，是一件值得考慮的事情。一、主臥室變為兩個臥室可以將主臥室改為兩個臥室，但是這樣的改動佔:-房改 122:裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？ 144

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

房子:大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？這個戶型砸牆，當然可以砸牆，但是在砸牆之前，要搞清楚為什麼要砸牆，砸牆以後有什麼優劣。△原戶型原戶型圖上的白色牆體部分不是承重牆，理論上說否可以砸掉。但是外牆和與旁邊戶型或者是公共區域的共用牆體和圖上:-幫忙

意蜂夏季喝什麼水降溫？

降溫意蜂夏季喝什麼水降溫？氣溫高，蜂巢溫度高的情況下，蜜蜂是通過採水的辦法掛在蜂箱的四壁來蒸發帶走熱量，降低蜂巢溫度同時也能幫助蜂群維持正常的溼度。在平常的情況下，蜜蜂是在室外採自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

黃瓜種子:黃瓜種子催芽後種植需要打底水嗎？你好很高興回答這個問題。答案：不用。1-2天可出芽。黃瓜種子催芽：選用飽滿的種子，用30℃水浸泡4小時後催芽。也可用100倍福爾馬林溶液浸泡種子10-20分鐘，洗淨後清水浸種3-4小時，然後於25-3:-催芽黃瓜打底

書友們展示一下自我感覺發揮較好的作品，一起學習？

自我較好這幅作品是參賽的，色彩的搭配，紙張的拼接都是自己設計完成的，一如既往的清新淡雅感覺。書體用的魏碑中楷書，增加了書寫的趣味性。:-書友展示:書友們展示一下自我感覺發揮較好的作品，一起學習？