数据分析的“前戏”——建立数据的初步认知！

2018-03-28 14:16:12 數據分析不是個事兒

对各从事数据工作的人而言，有一个老生常谈的问题——数据认知

！在真正数据分析、数据建模或者BI报表开发前，对数据进行一定的了解和审查，做到心中有数是非常必须的。

今天，就和大家通过本文一起探讨下如何建立对数据的初步认知。

首先，在笔者的概念里，数据的初步认知划分为三大步骤：数据质量检查、数据类型认知和统计指标值。

一、数据质量检查

1) 关注不同数据源在统计质量上的差异

不同的数据来源，因统计、管控、可共享程度等原因在数据粒度和数据质量的保障上都有天壤之别。根据数据来源的渠道主要可将它划分为：内部数据和外部数据。

1. 内部数据源

业务数据：主要指后端研发主动存储的业务数据，一般是对公司运营非常核心的数据，如订单数据、用户信息等。这类数据的准确性一般是最高的，因为它往往关系到公司产品能否正常运转，统计的正确性也就至关重要；
埋点数据：通过埋点技术采集的用户访问过程的数据，不论是自建埋点还是采用第三方埋点工具，因为埋点实施、统计上传机制等，都会造成埋点数据的准确性远不如业务数据；
数仓数据：数据仓库数据它是由生产库数据经过一轮或者多轮次的数据转换，中间可能发生的异常情况比生产库的数据更多。诸如：无人维护、指标口径不一、转换逻辑不一致等。

对于这三种类型的数据源，我们检查的侧重点有所不同：

业务数据：业务数据的复杂度主要在于字段含义、表之间关联关系以及字段与业务的实际对应关系，主要检查的也是这三点；
埋点数据：埋点数据主要需要检查埋点是否与你所期望的业务事件匹配，包括埋点采集的是页面访问还是按钮点击；
数仓数据
：主要了解其中业务指标统计逻辑、计算转换逻辑、脚本更新机制等。

2. 外部数据源

用户调研数据：通过市场调研得到用户反馈数据，存在的风险主要在于市场调研人员的敷衍执行，自行捏造数据以及被调研对象自身判断的错误；
合作方数据：第三方调研或咨询提供的数据，不同公司之间在统计规范和指标定义上都可能有明显差异，需要重点关注。

外部数据源的数据粒度一般较粗糙，数据质量上也比较难以保证，需要做更多的观察和校验。而且，由于这些数据不是我方采集，可控性较差，可实施的检查措施也相对较少，只能在使用时酌情考量，尽可能多的规避错误。

2) 关注取数过程，检查取数代码

我们通过各种方法获取数据，SQL 查询是最常见的取数方式。SQL 语句的出错将导致得到的数据集出错，数据错了，之后的工作也就白谈了。以下是进行 SQL 检查时需要被重点关注的点：

关注 join 处理的逻辑关系，包括采用的 SQL 连接方式 inner、left 还是 outer、两张表之间数据对应关系是 1:1、1:n 还是n:m 等；
关注 SQL 细节，包括是否采用 distinct 去重、采用 case 语句划分类别时的分类区间边界、group by 进行数据聚合的指标粒度是否正确；
多版本代码检查时关注选择条件，对于 SQL 复用的场景，我们要重点关注数据选择条件的更新替换是否完全；
聚合处理时，最好结合 if 条件排除极端值、异常值。

3) 关注处理数据集的空值和异常值

在对数据集是否正确的检查中，最容易发现需要被处理的情况就是空值和异常值。空值出现在数据集中往往一眼便能识别；异常值则需要一定经验性地判断，例如：数值特别夸张、文本特别长、不匹配的数据类型。在后续步骤的数据认知中，对指标进行汇总筛选、分布观察也能帮助识别异常值。

1. 空值处理

空值，如果在平时的汇总统计中可忽略则忽略，如果不可忽略则可采用以下方法来处理：

替换：使用平均值、众数进行替换或者使用最接近的数据替换它，需要仔细对比寻找该行数据的其它值是否相近；
推断：运用模型结合使用非空变量进行推断、预测计算得到这个空值，如：时间序列、回归模型等；

删除：实在无法处理的空值，而且你已经确定它会影响到后续的计算、分析，那么你可以考虑将该行记录删除。如果不确定是否会影响，可考虑暂不处理。

2. 异常值处理

初步观察寻找异常值：

在 Excel 中可以通过筛选功能或去除重复值对数据列进行观察；
在 SQL 中可以通过 distinct 进行去重观察；
在 Python 中，可以通过 pandas.drop_duplicates() 等方式进行去重观察。

垃圾数据或者异常值能采取的处理手段较少，当数据记录占比较大，我们首先应去寻找造成数据异常的原因，尝试从源头解决它；当数据记录占比不多时，我们可以采取直接删除的方式。

二、数据类型认知

数据类型的认知主要可从类型、数据单位、数据量纲三个角度去观察、去认知数据。这一过程后，我们一般对数据整体有一个比较粗线条的认识，知道各列的统计单位、各列的数据类型、量纲或者说数量级等。

类型：同一列数据的数据类型必须保持一致。如：时间序列不得与数值型数据混合、数值型数据不得与文本数据混合；
数据单位：同一列数据的单位必须保持一致，否则量级将完全不一致，不具备任何可比性。如：成交金额，不能既有以分为单位也有以元为单位的混合；
数据量纲：不同数据列的量纲有时会有明显差异，主要指整数型数据和百分比数据。如：活跃用户数与平台用户活跃率。当需要进行作图对比观察时候，我们需要对量纲进行处理，这涉及到标准化/归一化，常见的归一化方法有：

标准差标准化：

数据分析的“前戏”——建立数据的初步认知！

离差标准化：

数据分析的“前戏”——建立数据的初步认知！

对数标准化：

数据分析的“前戏”——建立数据的初步认知！

三、指标值统计

1) 通过描述统计对数据集中趋势、离散程度、分布作认知

描述统计指对数据进行一些描述性的统计，包括均值、中位数、方差等。它主要包含三个方面：

通过均值、众数、中位数等观察平均水平或说是集中趋势；
通过方差与标准差等指标观察离散程度、波动大小；
通过分位数、最大最小值、数据分布图等观察指标的区间分布情况。

1. 平均数

常常说的是算术平均数，即“N 个数字相加后除以 N“。在实际业务中，我们还会使用加权平均数，即“给不同维度的指标赋予不同业务权重后再相加除以权重总和，一般权重可以设为 1”。

平均数的表示含义是：一个群体在某项数据上的一般水平或者集中趋势。

2. 众数

众数，即序列中出现最多的那个数字。

众数真正的价值，不在于数值型数据中的使用而在于用在类别型的数据中。在数值型数字中，可能因为数字精度太细，导致数字出现次数都很少，几乎没有众数；而类别型数据中，众数有时会比较具有代表性。比如：系统每 5 分钟从天气预报网站读取一次实时天气，以小时为单位预测未来天气时，我们可以简单取 12 次读取中出现次数最多的记录作为这个小时的平均天气。

3. 中位数

顾名思义，中位数就是指排在中间位置的数字，将序列分为两部分。

中位数的优势在于它能避免数据的平均水平受到异常值的影响。在数据未进行较完整的清洗时，强烈建议采用中位数代表序列的中间水平。

4. 方差与标准差

方差和标准差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量，衡量数据序列的波动情况。

数据分析的“前戏”——建立数据的初步认知！

以上为方差计算公式，开方的结果即为标准差。

5. 四分位数

百分位即降数据升序排列后，具体数据值的序号除以数据值的总数，所得出的百分比，即该数据值对应的百分位数。我们一般比较关心：25%、50%、75% 分位数。

6. 最大值、最小值

这个顾名思义，没什么好解释的。

四分位数组合最大值、最小值，可以让我们初步认知数据的分布特征。

7. 数据分布

进行了简单的描述统计，我们想对数据的分布进行简单的观察，得到一个更加直观的感受，可以制作频率分布图、箱线图来进行观察。

2) 相关系数统计，对指标间的相互作用关系进行认知

当我们需要观察两个字段之间是否存在相互影响的关系时，我们可以简单的使用相关系数。以下介绍三种相关系数，在不通场景有不同的适用度。

1. 皮尔逊相关

数据分析的“前戏”——建立数据的初步认知！

用于度量两个变量X和Y之间的相关(线性相关)，其值介于-1和1之间。

当 r>0 时，表示两变量正相关，r<0 时，两变量为负相关；
当 |r|=1 时，表示两变量为完全线性相关，即为函数关系；
当 r=0 时，表示两变量间无线性相关关系；
当 0
一般可按三级划分：0.8-1.0 极强相关，0.6-0.8 强相关，0.4-0.6 中等程度相关，0.2-0.4 弱相关，0.0-0.2 极弱相关或无相关。

适用条件：

数据（近似）服从正态分布
尽可能没有异常点
用于描述线性相关

缺点：当样本量 n 较小时，相关系数的波动较大；

2. 斯皮尔曼等级相关

数据分析的“前戏”——建立数据的初步认知！

斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法，是依据两列成对等级的各对等级数之差来进行计算的。它与相关系数一样，取值在 -1 到 +1 之间，所不同的是它是建立在等级的基础上计算的。

适用条件：斯皮尔曼等级相关对原始变量的分布不作要求，属于非参数统计方法，使用范围更广。

缺点：

斯皮尔曼等级相关系数和皮尔逊相关系数都与样本的容量有关，尤其是在样本容量比较小的情况下，其变异程度较大；
需要先对数据进行等级划分。

3. 肯德尔和谐系数

数据分析的“前戏”——建立数据的初步认知！

肯德尔和谐系数是计算多个等级变量相关程度的一种相关量。

前述的斯皮尔曼等级相关讨论的是两个等级变量的相关程度，用于评价时只适用于两个评分者评价 N 个人或N件作品，或同一个人先后两次评价 N 个人或 N 件作品，而肯德尔和谐系数则适用于数据资料是多列相关的等级资料，即可是 k 个评分者评 (N) 个对象，也可以是同一个人先后 k 次评 N 个对象。

通过求得肯德尔和谐系数，可以较为客观地选择好的作品或好的评分者。

3) 多维交叉观察，利用数据进行业务分析

多维交叉观察，其实已经是分析阶段的主要工作。在初步的数据观察中，我们不会进行过多的交叉对比，除非不可避免的要对某些维度进行观察、验证。

数据分析的“前戏”——建立数据的初步认知！

最后，再做下解释。

数据分析前，对数据做质量检查、统计指标值，是绝对必要的。数据就像你手上的扑克牌，你得知道你手上有什么牌，什么分布，是好是坏，是全是缺，才能进一步制定分析目标和策略。一次常规的数据分析，数据清洗往往要占据精力的半数，也只有好的数据才能做出令人信服的分析。

分享到:

閱讀更多 數據分析不是個事兒 的文章

關鍵字: Python 指后脚本语言

数据分析，从认知事物的基本方法，分类法开始！第2辑

数据分析：购物中心商业配比

数据分析，对比差异！

3.16线段、角、相交线、平行线练习与解析

数据分析，如何支持运营迭代

第1章从常见电路初步认识电子电路(电子线路课件)

03.06 数据分析，怎么做才能“可执行”

数据分析&可视化——泰坦尼克号幸存者分析(下)

03.03 「数据分析」土耳其2019年旅游业数据分析

数据分析：谁才是中国的光棍大省？

怎样用「数据分析」辨别渠道作弊？

净增疑似人数大幅度减少

01.29 一觉醒来，假期越来越多！

「数据分析」如何利用活动策划让流失的老客户回头（上）

数据分析:谁才是中国真正的光棍大省？广西老表又躺枪

选定某一领域坚持下去，试水.......

数据分析，假象

九点半：长兴盛奥化纤公司突发火灾目前火势得到初步控制

木材知识：防止兰考泡桐木材变色的初步试验

“新任证监会主席记者招待会”造谣人员初步查实

2018年中国经济稳进发展动态分析图

《乘法初步认识》专项练习

数据分析：郑州市区面积较小，应加快荥阳新郑中牟撤县设区步伐

部编版数学二年上分类专项检测-角的初步认识和观察物体测试卷

直击重庆公交车坠江最新打捞现场：初步核实15人失联

金胆老王10.17初步推荐！红单路上不孤单！

金胆老王10.16初步推荐！红单路上不孤单！

国家自然资源部专家组初步判定堰塞湖淹没区长达20公里

一直用的商标被抢注了怎么办？

榆林人，注意了！注册商标看这里

09.21 注册商标还要再等一等？

新型网络婚骗：数据分析+场景营造

网络婚骗迭代：数据分析+场景营造

商标注册太磨叽，基本就告别品牌梦了

利用数据提升面条质量，这家日本面条厂是如何做到的？

重磅！来了，期待已久的雄安新区规划初步方案公布（高清细节）！

全球第一“无底洞”深湖，数据分析：长江24倍的水资源才能填满

《客服服务管理手册》：会员信息管理，数据分析，会员关系维护

「数据分析」2018年全球有机农业发展报告重磅出炉

「数据分析」“数”说xiaohu——他是混子吗？

SEO精英：优化数据分析做一个价值网站

UZI到底有多强？数据分析全面碾压所有赛区AD

运营整体框架思维全攻略分享（精华版）

06.06 初中数学-数据分析

数据分析：74城市排名谁喜谁忧

提高论文质量？科研达人给出了这些重要建议！

02.22 #我易家白皮书#家装数据分析

07.18 《数据科学与大数据技术》训练营-数据分析&数据挖掘中级-周末班

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

刚刚:刚刚工作的毕业生，一个月只有2000多，是不是太少了？根据你城市消费水平来看啊，还有你从事的工作，假如你在二三线城市做一份事业单位或者是编制类的工作，薪资水平是随着你工作年限逐年增长的，而且在年终也有很多福利补贴待遇等等，算下来收入也是可观的，再举一个例:-毕业生 2000

为什么只有edg赚钱？

电竞行业作为一个新兴产业，这几年发展势头越来越好，IG战队，FPX战队先后夺得了s8-s9世界赛的冠军，据俱乐部知情人士透露，除了国内的几家豪门俱乐部之外，其他俱乐部基本都是亏钱在做的，当然EDG也是:-edg 赚钱:为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

20000:网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？天猫旗舰店，或者淘宝旗舰店，或者京东旗舰店肯定包真，质量好，再说可以官方验证啊，不能图那十块五块的便宜，毕竟一个充电宝要用好久呢，一两年没问题的。:-罗马仕马仕毫安

我们买的新商品房还没有拿到房产证，怎么转卖最好？

没有取得房抄产证的房子可以转让。但如果确定无法取得房产证的，房产转让不受法律保袭护。一般情况下，只有取得房产证的房屋才能确定房屋产权人，才具有转让的条件。但如果房屋是合法取得的，以百后可以依法办理度房:-转卖房产证商品房拿到:我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

锋利突厥人你这样说只能说明你对历史非常不了解，我先用一句话概括突厥被大唐雄兵打的有多惨：三次灭国，背井离乡，远赴西亚，打不过，俺躲着你还不行吗？突厥的意思是中间怂起的头盔。其来历已经不可靠，可能有着匈奴、鲜卑或:-复国大唐:为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

小高层 60:小高层16层高楼间距60米哪一层比较好？首先需要明白，选择层数居住与楼间距毫无关系，住在哪一层，肉眼看对面楼的距离，是相差不大的。设定楼间距60米，纯粹是混淆视听。其实，一幢楼的楼层总数确定的情况下，到底哪一层最佳？很简单，取总层数乘以黄金:-楼间距层高

金银花盆栽好养吗？怎么养？

金银花可以盆栽，很好养的！金银花，是忍冬科的常绿缠绕灌木，枝条柔韧修长，多攀爬或匍匐生长。金银花生性强健，在我国的很多南方省份野外很多地区都能看到它的身影，叶子常年翠绿，到夏季开花，飘香四溢。所以，有:-金银花盆栽:金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

长城真的无用吗？在今天许多人认为长城无用，古代国家举国之力建造的长城不过只是文物，就连康熙都曾作诗讽刺，原文如下：万里经营到海涯，纷纷调发逐浮夸。当时用尽生民力，天下何曾属尔家。-康熙但真的如此吗？小:-匈奴抵御长城:长城对于抵御古代匈奴和蒙古人起到了多大作用？蒙古人

什么树可以嫁接腊梅？

腊梅只能嫁接在不同品种的腊梅上，其他的树种不行！腊梅的繁殖可以用播种，压条，嫁接，分株等繁殖方法。播种法因不易保持花卉的原有优良特性，且播种的优点是在于大量繁殖，而腊梅大都只需培植少量几株，故一般都不:-腊梅嫁接:什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

堪忧五一假期:行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？事实上，因为教育培训都是预收费用的模式。但凡有一点点规模的培训机构老师。在上半年，带课量是可以得到保证。:-课时量

在农村“立夏节”都有哪些民间习俗？

民间习俗农村:在农村“立夏节”都有哪些民间习俗？在农村“立夏节”都有哪些民间习俗一、农村立夏常见的习俗风俗活动：1、吃鸡蛋“立夏吃蛋”习俗由来已久，俗话说“立夏吃了蛋，夏天不疰夏”。据说立夏开始天气越来越热，村里小孩儿会有身体疲劳四肢无力的感觉，吃:-立夏节

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

失望分手看法:男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？你的这个问题特别的有趣，我觉得你先不要看你要怎么做才让他才能让他对你的印象有所改变，你要去看为什么是两个月之后可以在一起，这两个月他会用来做什么，为什么会有这两个月？例如他的身体碰到了什么样的问题吗？:-答应我

工程分包乙方人员伤残谁承担？

承担:工程分包乙方人员伤残谁承担？分包乙方分包致人伤残责任谁承担？严格来说，需要了解更多伤残原因才能区分的，作为非专业人士，自己发表一点浅见供题主参考：1、如果甲方是央企的话，他们合同中的责任、义务等条款内已经将自己的责任全部撇开了，更会:-乙方伤残

有哪些看起来毫不相关的两个历史人物实际上有过联系？

实际上:有哪些看起来毫不相关的两个历史人物实际上有过联系？历史人物联系这个词貌似太宽泛了，就好像有一个调皮的答案说的，胡亥和溥仪相隔2000多年，牵强的找，也有联系：都是亡国之君不是。我想题主的意思是两个看起来应该风马牛不相及的人物，在历史上居然是熟悉或是一个时代的:-毫不相关

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

法系车不保值，如果准备常开可以入手，性价比高，价格应该在二至三万之间，二手车一车一况，一况一价，居体价格看车况。:-钱能水泡:13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？世嘉自动挡

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

17年驾驶证二手:22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？建议买日系二手车，开顺了卖了，买新车，昂克赛拉无法再次出手时获得好价格，而且也不省油，开完日系车直接换德系:-昂克赛拉

如何骑车去台湾骑行？

骑车在台湾没有回归内地前，最好不要去台湾，一是国内政策不允许你去台湾，因为已停止了台湾个人游。二是你偷着去台湾旅游，安全没有保障，偷渡客在哪里也没有安全保障的。以后内地政策允许个人去台湾旅游了，建议那时再:-骑行台湾:如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

预算:本人预算5万左右，想买一辆二手法系车！求推荐？ 5万预算5万元左右，想买一辆二手法系车？推荐东风标致老款308车型。1 5万元可以买标致308车况好的，没大事故呢，年限15年左右，公里数3万左右，手动档车型。2 标致308车型，底盘调教扎实，跑高速稳定:-法系二手

14年进口马自达5PK进口10年道奇酷威买哪个划算？

道奇你好，好高兴回答你的问题！14年进口马自达5和10年月道奇酷威个人感觉马自达5比较划算。新车价马5报价29.99万，酷威19.38万两款车都是原装进口，马5属于日系，酷威属于美系。两款车不属于同类车型:-酷威马自达 14年:14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

特殊津贴高校人才就要重视，河南省高校人才更要重视，这个人才不是评出了的，而是推荐出来的，没有推荐，连参评的资格都没有。国务院特殊津贴人员推荐，不推荐是百分百没希望，推荐了希望就非常，那么是什么是国务院特殊津贴:-河南大学并列 2020年:2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

李老猫说车为你非专业解答各种选车用车问题本田crv定位于一款紧凑级suv产品，主要对飚丰田荣放，日产奇骏，这款车整体市场表现非常突出，2019年全年累计销量为18.44万台，平均月销1.5万以上，其深:-舒适版本田油耗:本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

1.世界经济遭到重创疫情影响之下，各行各业基本属于停工停产的状态，在世界经济趋于一体化的今天，停工停产势必会造成一系列的连锁反应，最后导致的结果可能会引发金融危机。2.世界格局可能发生改变美国仍是世界:-头脑风暴控制:国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？疫情国外

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

如果有15万元的预算，让你选择一台空间和动力都很不错的小型SUV，我觉得很多的读者都会想到本田XRV这款车型。因为本田XRV确实太出色了，和同级别的其他盒子SUV车型相比，这款车在空间和动力上都有优势:-xrv 自动:本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？本田豪华版

现在存款有14万，借了5万还没收回来，该做什么好？

何去何从:现在存款有14万，借了5万还没收回来，该做什么好？续租存款利息率较低，可以投资较高收益的项目，比如投资基金，一般情况下可获得6%一10%的回报。如果行情好可达到50%以上收益，去年不少基金超过这目标。目前受疫情影响，股市在低位震荡，也是基金投资的机会。一:-存款 2300

2070super和5700xt买哪个比较好？

如果是玩游戏毫无疑问选择n卡，也就是2070 suep。如果追求性价比可以选择a卡，也就是5700xt. 为什么游戏选n卡呢？首先游戏厂商针对n卡优化比较多，然后就是功耗小，然后N卡架构执行效率极高，:-:2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

二胎我是两个孩子的妈妈，曾经的我和你一样，生完宝宝我也抑郁了，我知道抑郁症真的很痛苦，产后的那段日子我整天都不开心，做什么事也没积极性，谁也不想搭理，别人给我说话我就觉得很烦。忍不住冲家人发脾气。每当一个:-生完抑郁:生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？发火

人这一生遇到的人和事为什么感觉都像是必然的经历？

感觉:人这一生遇到的人和事为什么感觉都像是必然的经历？正所谓有因必有果，所以你今天的因，就会产生明天的果。所以这一切你就会觉得是必然的。生活中大部分是普通人大家的生活规律，生活方式，大致相同。当你看到别人家庭的果，自己家也产生同样的果，你就会觉得这一切是:-人和经历

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

校内:现在校内校外到底教的是美式英语还是英式英语还是混搭英语？校外英式答案肯定是不唯一的！美式英语现在是主流，少量英式发音也个别存在！但对于孩子来说，肯定是混搭英语，因为孩子肯定不是一直一位老师教下去，肯定会换老师！而老师的发音肯定是既有英式的，也有美式的！就连一些英语:-美式英语

上有老下有小，我们真的跳不出这个人生循环了吗？

上有老魔咒:上有老下有小，我们真的跳不出这个人生循环了吗？的确如此，尽管现在不结婚，晚婚的人很多，但是从人类繁洐生息的历史和大多数人来看，成家立业，生儿育女，家庭仍是主流，一个人的生理，心理和生存需求決定了生存状态，生儿育女，瞻养父母即是义务责任，也是生活动:-下有小

如果外面正在下小雨，你会突然想起了谁？

想起:如果外面正在下小雨，你会突然想起了谁？我最不忘，还是秋日的雨夜，天又凉了几分，已经需要披上一件薄薄的外套了。临窗而望，眼见窗台上的几株小植物，叶片上沾了几滴小雨珠，我总喜欢，用小手电去照它们，这样的小水滴看起来晶莹晶莹的，有一种清清凉凉的:-小雨

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

初中同学:初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？吃饭许久未见，意思就是交情不怎么样，无功不受禄，人家凭什么那么热情，难道真的是多年一来忘不了咱们之间的同学情谊，倍感想念了吗，不是请帮忙、做业务、就是借钱，十有八九十借钱。我建议还是不要去的好，大家都很忙:-许久未见

现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？

出口心理:现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？爱你更多的是心里问题，可能对方还没有优秀到你满意的程度，更没有到那种离不开的地步！爱情最终还是要回归生活，而生活离不开两个人的相处，父母终究会老，孩子终究会飞，所以选择自己的伴侣尤为重要，你现在觉得恶心更:-喜欢你

剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？

再见王沥川好看:剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？《遇见王沥川》吧，高以翔的王沥川太招人稀罕了。长相，身材，家世，人品，才能样样好，简直完美，挑不出任何毛病，实在要说一个缺点的话，那就是太tm完美，天妒英才、才让他饱受病魔折磨。偶像剧、深情帅气的男主:-何以笙箫默

计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？

学历是求职必备条件。有了工作不能停止对知识的探索。更高的学历，可以让你有更专业的技术能力和学习能力，可以让你拓展自己的交际圈，可以让你更知名。总之，活到老，学到老，学习对人总是有好处的，技多不压身嘛！:-字节跳动:计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？读研计算机专业

生完二胎的你们，现在有什么感想？

二胎家庭日常是什么样的？是不是觉得家里多了一个小人儿，温馨多了？不存在的！生二胎根本是妈妈们的渡劫磨砺！以前周末睡到自然醒，现在全年无休，时刻警醒着，能睡一次懒觉跟过年似的，黑眼圈不说，头发呼啦啦地掉:-生完二胎感想:生完二胎的你们，现在有什么感想？

华北适合种植蚕豆吗？

华北适合种植蚕豆，种蚕豆的面积大，在西北，华北，都在种植蚕豆，蚕豆茎秆根部有根瘤菌是种植其它农作物的好茬地，特别是土壤培养和防病虫害起到作用。:-蚕豆种植适合:华北适合种植蚕豆吗？华北

华为手机更新EMUI10.1系统后效果咋样？

大家知道现在智能手机的性能不仅仅跟智能手机的硬件有关，还跟智能手机的系统软件息息相关，在国产智能手机操作系统里，小米的MIUI系统跟华为的EMUI系统都是比较优秀的操作系统。最近小米推出了小米MIUI:-咋样华为华为手机更新:华为手机更新EMUI10.1系统后效果咋样？

大热天蜜蜂老是爬到箱外结群正常吗？

蜜蜂爬到:大热天蜜蜂老是爬到箱外结群正常吗？盗蜂现在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的时间，所以蜂群中是非常容易发生盗蜂的。在蜂群中发生盗蜂的时候，蜂群守卫蜂会增多，但是这种情况引发的蜜蜂在蜂箱外一般不会结团，只是蜜蜂来:-大热天

辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

最佳期雾都山客来回答您的问题。最近山客家乡的村民正在进行辣椒移栽，确实有像题主提到的情形，辣椒苗移栽前长势葱葱，嫩绿喜人，但是移栽后几天内就出现萎蔫现象，细心观察也不是被病虫害危害。那究竟是什么原因导致辣椒:-苗蔫辣椒咋回事:辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

手机相机发展的最终形态会是怎样的？

最近这几年手机在电子产品行业里可谓是发展速度非常快，苹果和华为两大公司可以说也是，明争暗斗，产品一次比一次有卖点，前一段时间华为和苹果还都推出了手机新品，两家都在大力宣传强调着拍照功能，像iPhone:-形态相机手机最终:手机相机发展的最终形态会是怎样的？

华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？

5寸手机支持:华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？很高兴回答你的问题，刷头条刷出来的问题，看到很多人回答，感觉还有一些观点没有写出，所以我来回答一下。首先，华为为什么不出小尺寸全面屏手机？其实并不只有华为一家没有出小屏手机，放眼近期各大手机厂商发布的:-华为

生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？

胡萝卜蔬菜:生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？第一种，黄瓜。这个瓜，可不是菜市场中堆放满满的青瓜。各位可要睁大眼睛看清楚了，这个黄瓜，青中带黄，品种属以前乡下农户少量种植的，形态上面来看这种瓜矮、短、圆，表面覆盖有比较淡的细毛，经水轻轻冲洗之后整:-山芋

为什么马铃薯不宜过早过迟播种？

不宜:为什么马铃薯不宜过早过迟播种？播种过早为什么马铃薯不宜过早过迟播种？马铃薯的种植主要是由于气候条件的限制，过早出苗后容易遇到低温被冻死，种植晚了容易遇到干旱和高温，影响产量。马铃薯种植时间的早晚必须根据种植地方的气候条件来确定。马铃薯生长:-马铃薯

疫情愈发严重，原油为何反而大涨？

原油愈发:疫情愈发严重，原油为何反而大涨？疫情愈发严重和原油大涨没有必然关系。但是资金总是从高处流向低处，原油价格跌的越多，投资价值越明显，相对于其他产业更有投资价值。举个例子：深圳南山房价均价大约6万左右，宝安均价5万左右，如果南山房价涨到:-疫情

生菜球很好吃，怎么种植才能高产呢？

种植:生菜球很好吃，怎么种植才能高产呢？高产对环境条件的要求、1.温度生菜球为喜冷凉、忌高温作物，种子在4度以上可发芽、以15～20度为发芽适温。幼苗能耐较低温度，日平均温度12度时生长壮健，叶球生长最适温度为13～16度。不过目前有些结球生菜:-生菜

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？

看下这个户型三房改四房，改一个小房间，应该没有问题。△原户型图这个户型改四房，能改的方案比较多，但是修改以后是否好用，是一件值得考虑的事情。一、主卧室变为两个卧室可以将主卧室改为两个卧室，但是这样的改动占:-房改 122:装修高手来帮忙看下144平，套内122平，怎么三房改四房？？ 144

大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？

房子:大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？这个户型砸墙，当然可以砸墙，但是在砸墙之前，要搞清楚为什么要砸墙，砸墙以后有什么优劣。△原户型原户型图上的白色墙体部分不是承重墙，理论上说否可以砸掉。但是外墙和与旁边户型或者是公共区域的共用墙体和图上:-帮忙

意蜂夏季喝什么水降温？

降温意蜂夏季喝什么水降温？气温高，蜂巢温度高的情况下，蜜蜂是通过采水的办法挂在蜂箱的四壁来蒸发带走热量，降低蜂巢温度同时也能帮助蜂群维持正常的湿度。在平常的情况下，蜜蜂是在室外采自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什么水降温？

黄瓜种子催芽后种植需要打底水吗？

黄瓜种子:黄瓜种子催芽后种植需要打底水吗？你好很高兴回答这个问题。答案：不用。1-2天可出芽。黄瓜种子催芽：选用饱满的种子，用30℃水浸泡4小时后催芽。也可用100倍福尔马林溶液浸泡种子10-20分钟，洗净后清水浸种3-4小时，然后于25-3:-催芽黄瓜打底

书友们展示一下自我感觉发挥较好的作品，一起学习？

自我较好这幅作品是参赛的，色彩的搭配，纸张的拼接都是自己设计完成的，一如既往的清新淡雅感觉。书体用的魏碑中楷书，增加了书写的趣味性。:-书友展示:书友们展示一下自我感觉发挥较好的作品，一起学习？

数据分析的“前戏”——建立数据的初步认知！

一、数据质量检查

二、数据类型认知

三、指标值统计

最后，再做下解释。

相關文章:

数据分析，从认知事物的基本方法，分类法开始！第2辑

数据分析：购物中心商业配比

数据分析，对比差异！

3.16线段、角、相交线、平行线练习与解析

数据分析，如何支持运营迭代

第1章 从常见电路初步认识电子电路(电子线路课件)

03.06 数据分析，怎么做才能“可执行”

数据分析&可视化——泰坦尼克号幸存者分析(下)

03.03 「数据分析」土耳其2019年旅游业数据分析

数据分析：谁才是中国的光棍大省？

怎样用「数据分析」辨别渠道作弊？

净增疑似人数大幅度减少

01.29 一觉醒来，假期越来越多！

「数据分析」如何利用活动策划让流失的老客户回头（上）

数据分析:谁才是中国真正的光棍大省？广西老表又躺枪

选定某一领域坚持下去，试水.......

数据分析，假象

九点半：长兴盛奥化纤公司突发火灾 目前火势得到初步控制

木材知识：防止兰考泡桐木材变色的初步试验

“新任证监会主席记者招待会”造谣人员初步查实

2018年中国经济稳进发展动态分析图

《乘法初步认识》专项练习

数据分析：郑州市区面积较小，应加快荥阳新郑中牟撤县设区步伐

部编版数学二年上分类专项检测-角的初步认识和观察物体测试卷

直击重庆公交车坠江最新打捞现场：初步核实15人失联

金胆老王10.17初步推荐！红单路上不孤单！

金胆老王10.16初步推荐！红单路上不孤单！

国家自然资源部专家组 初步判定堰塞湖淹没区长达20公里

一直用的商标被抢注了怎么办？

榆林人，注意了！注册商标看这里

09.21 注册商标还要再等一等？

新型网络婚骗：数据分析+场景营造

网络婚骗迭代：数据分析+场景营造

商标注册太磨叽，基本就告别品牌梦了

利用数据提升面条质量，这家日本面条厂是如何做到的？

重磅！来了，期待已久的雄安新区规划初步方案公布（高清细节）！

全球第一“无底洞”深湖，数据分析：长江24倍的水资源才能填满

《客服服务管理手册》：会员信息管理，数据分析，会员关系维护

「数据分析」2018年全球有机农业发展报告重磅出炉

「数据分析」“数”说xiaohu——他是混子吗？

SEO精英：优化数据分析做一个价值网站

UZI到底有多强？数据分析 全面碾压所有赛区AD

运营整体框架思维全攻略分享（精华版）

06.06 初中数学-数据分析

数据分析：74城市排名谁喜谁忧

提高论文质量？科研达人给出了这些重要建议！

02.22 #我易家白皮书#家装数据分析

07.18 《数据科学与大数据技术》训练营-数据分析&数据挖掘中级-周末班

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

在农村“立夏节”都有哪些民间习俗？

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

工程分包乙方人员伤残谁承担？

有哪些看起来毫不相关的两个历史人物实际上有过联系？

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

现在存款有14万，借了5万还没收回来，该做什么好？

2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

第1章从常见电路初步认识电子电路(电子线路课件)

九点半：长兴盛奥化纤公司突发火灾目前火势得到初步控制

国家自然资源部专家组初步判定堰塞湖淹没区长达20公里

UZI到底有多强？数据分析全面碾压所有赛区AD

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？