全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

一週之前,世界經濟論壇發佈了2018全球性別差距報告(Global Gender Gap Report)。

對的,就是那個每年年會在瑞士達沃斯小鎮舉辦年會的世界經濟論壇。

昨天,女權組織橙雨傘通過轉譯文本的形式,在微博上發佈了全球性別差距報告的中國部分。

中國從2006年63名,降為2018年的103名。

在一篇名為《149個國家,中國排名103?》的文章裡,文章作者認為中國的排名倒退,是中國“吃了一嘴灰”。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

出於本能,我仔細看了一下報告中截取的數據,我開始懷疑這篇報告的真實程度。

在這篇文章裡,我無意為“中國被世界經濟論壇黑了”這樣的論調來為中國辯護。

我只想告訴大家這篇報告已知的硬性錯誤可能的方法錯誤,以及最終帶一點我的看法

如果要先說結論的話,那就是:以這篇有漏洞的報告為證據來評價中國的女權現狀是不可信的

(想看錯誤的可以跳到【正文】)




一、已知的硬性錯誤

世界經濟論壇這份報告將男女性別的社會差距分為三個維度:1.參與經濟事務和就業機會(Economic participation andopportunity);2.接受教育(Educationalattainment); 3. 健康與生存(Healthand survival);4. 政治賦權/女性的政治勢力(Political empowerment)。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(原報告截圖)

由於我本人的工作原因,我對第二部分的教育數據非常敏感。在我最近一週經手的亞太地區的教育數據而言,中國在“男童女童享受同樣的教育機會”這件事情上,做的很好。

但中國在這一部分的排名落在148個國家的111,這讓我很詫異。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(注意右上角的排名,英文版來自原報告,中文版來自橙雨傘)

翻看這份報告的方法紀要(下圖),報告內明確指出了三點:

1. 數據來源:聯合國教科文組織統計所(UIS),是2018年10月截取的數據

2. 每一項數據的指標(變量):

識字率,小學淨入學率,中學的淨入學率,高等教育的總入學率。每一個指標都會分別採集同一個時期,某個國家的男女數據,例如:阿富汗2017年的男性識字率和阿富汗2017年的女性識字率。

3. 計算方法:女性數據÷男性數據=女/男比。如果比值大於1,則直接視為該項滿分(1.000分),如果比值小於1,則折算一個分數(我數學太差,應該是根據平均數和標準差折算,第,但是emmm怎麼折呢,不管它)。


全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(折算權重)

這戳中了我的好奇心。

因為,我最近一直在UIS的數據庫裡遨遊。

於是,我想檢驗一下這個數據採集是否正確。

很遺憾,它錯了,錯的很離譜。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

在檢驗具體數據前,我們需要設定一個標準,判斷這部分數據是否能有效地表達女性處於劣勢(男女平等後面再說)。

首先,每一個國家採集的數據,必須按照統一的指標,不可以A國是入學率,B國是考試成績,如果出現變量沒有數據,就空著。其次,每一個國家採集的數據年份儘量一致
,越一致,數據的有效性就越高,可信度高(不是信度),儘量不要是2017年的數據和1917年的數據比較。再次,每一個國家的統計水平相當,不會出現錯漏和故意編輯數據的情況。(本文不討論)

根據這三個原則,我們來觀察這份報告。

為了我一個人不至於累死,我自說自話地選擇了幾個國家:

1. 和中國名稱上靠近,且有數據的幾個國家(柬埔寨Cambodia,加拿大Canada,乍得Chad,智利Chile,【中國】,哥倫比亞Colombia)

2. 這次排名的第一名冰島(Iceland)

3. 數據體系健全的美國(USA)

令人詫異的事實,就此展開。

【正文】

對於識字率數據:

在UIS數據庫中,識字率有多種統計模式,經過不厭其煩地比對,我發現,全球經濟論壇使用的是:15歲以上成年人口的識字率(可理解為:該國識字的女性/所有該國女性;該國識字的男性/所有該國男性)。

我下載了1970年-2018年的該變量的數據庫。

首先,經過對比,我所選擇的幾個國家的識字率數據都來自這一變量(變量名一致),且都是最新的數據(男女數據在同一年)。

但是,”最新“是有差異的。

乍得和哥倫比亞用的是2016年的數據。

中國用的是2010年的數據。

美國,沒有數據……

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(最下面一行數據為美國,無法理解的操作)

但是,令人詫異的是,美國的報告那一頁(287頁)明明寫著男女識字率都是99%啊,是我瞎了麼?

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(注意紫色字跡處)

不是,是世界經濟論壇犯了第一個錯誤:臆測數據

為什麼呢,因為至少加拿大(55頁),法國(101頁),英國(285頁),美國(287頁)在UIS都沒有數據的情況下,他們的男女識字率都被默認為99%…且UIS系統內完全沒有這些國家1970年到2018年的識字率數據。

也就是說,他們的滿分,是白拿的。且不知他們呈現出了雙99%的數據,有興趣的朋友可以自行驗證。

那麼,這些國家在該單項上都領先了中國93名(中國排名94位)。

(我已將所有excel文件打包放在閱讀原文的百度雲盤裡供大家檢驗,UIS的數據網址也是開源的:http://data.uis.unesco.org/#)

對於小學淨入學率:

此處解釋一下,淨入學率(Net Enrolment Rate)與總入學率(Gross Enrolment Rate)的關係。

淨入學率指的是規定年齡段的兒童到某一階段教育入學的比例:不計入逃課的和輟學的情況,和過早過晚讀書的情況。

如:2017年就讀復旦的10歲神童沒有上小學,小學的淨入學率降低了;2017年還在上小學的16歲大男孩沒有上高中,高中的淨入學率降低了。

因此,淨入學率在不出現統計機構自己數據出錯的情況下,不超過100%。但對於高等教育而言,很難解釋什麼樣的年齡段應該完成高等教育,因此一般不計算淨入學率。(http://uis.unesco.org/en/glossary-term/net-enrolment-rate)

總入學率,是該教育階段的學生數(全國所有中學的人數)處以該年齡段應當完成教育的兒童總數(12或13-18)。因為有過早與過晚上學的兒童,發展中國家在集中發展義務教育的階段,總入學率有超過100%的可能。(http://uis.unesco.org/en/glossary-term/gross-enrolment-ratio)

每個國家都會有自己偏愛的,適合制定政策的入學率口徑,因此選用單一變量的風險是,有些國家會在某一數據上全面空白。

世界經濟論壇用的是淨入學率。

對於小學而言,中國這項數據是空白的,因為中國最後一次更新上報這一數據是1997年,因此,該報告沒有采納這一數據

實際上,1997年的時候,我國女生的小學淨入學率達到了88.18%,男生達到了90.03%,與全球經濟論壇提供的2017年的這一指標的均值之差0.001。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(1997中國女生小學淨入學率,黃色單元格)

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(1997中國男生小學淨入學率,黃色單元格)

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(中國在此項上空白)

但是,考慮到計劃生育政策存在的生育瞞報,這一數字可能存疑。反正,沒說為什麼,世界經濟論壇沒有用這個數據。

對於中學淨入學率:

世界經濟論壇採用的是淨入學率。

然鵝,這一指標不在中國的教育統計口徑內,沒有上報UIS,這一項應當也是空白的。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(黃色一欄可見中國沒有申報)

然而,我看到了令人窒息的一幕。

世界經濟論壇的數據顯示,中國的女生中學毛入學率僅為47.1%,男生為52.9%。


全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(令人窒息的黃色數據)

這意味著我們身邊兩個孩子中的一個沒有上中學……

我國九年制義務教育吃了一嘴灰……

事實上,通過我對47.1+52.9=100的觀察,我覺得,世界經濟論壇可能是混用了某個比例……

後來,我找到了。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(“神奇”的替代指標)

世界經濟論壇使用的替代指標為:Percentageof students in secondary education who are female.

直譯為:女學生佔中學學生的比例。

這對於中國而言,是帶有明顯負面引導的數據。

首先,中國的新生兒比例由於男女不平等和其他附帶因素,導致同齡的男性多於同齡的女性。

因此,同一教育階段的男生比女生多不代表女生沒有獲得平等的教育機會。

舉例而言,一個國家有12-18歲男生10名,12-18歲女生5名。他們都讀了中學。該國,男生中學淨入學率=10/10=100%,女生中學淨入學率=5/5=100%,男女獲得了同等的教育機會。

但在”女學生佔中學生比例“的計算下,就變成了5/15=33.33%。

這一變量在此處替用原來變量有三處錯誤:1. 在沒有註明的情況下偷換變量,使得國家間的比較變得無意義;2. 新生兒比例的男女詫異已經在”健康與生存“一節中計分了,如果只對中國採用此變量,便是雙重扣分;3. 這一替代的變量無法符合原本考察男女教育機會是否均等的本意,沒有替換的理由。


全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(中國部分裡本就已經計分的生育率性別比數據)

我希望,這是一個想當然的失誤,而非刻意為之。如果使用總入學率,在這一項上,中國是滿分1分,因為根據UIS最近的2013年的數據,當年中國女生總入學率為95.03%,男生總入學率為94.23%,女生領先。

對於高等教育總入學率:

在這一項上,世界經濟論壇沒有在中國這一部分失誤。

簡要總結,在這裡,我無意重新計算中國排名的提升,因為數據漏洞或許只是冰山一角,在此改動中國的數據計算排名,沒有意義。

這份報告已經不滿足研究倫理上可信的標準了,不夠公正,也許不僅是對中國,也對其他國家。

而上述的中學淨入學率的變量替換法,最早可以追溯到2016年報告,已經用了三年了


二、方法上可能的漏洞

事實上,這篇報告在方法上也存在問題。

比如,在剛果的識字率數據上,它使用了UIS的預測數據,而非實報數據,但沒有註明。

其次,它將女生超過男生的數據全部計為滿分1分,這顯然不符合性別差距報告的名號。漠視女性出超偏誤,將其視為好的表現,這不是平權主義。

作為一個國際組織,我們應該沿著軌道恪守中立,而非冒險。

再次,在教育上排名前50的國家裡,我看到了好幾個被UNESCO亞太教育分局重點關注的需要幫扶的對象。

這篇報告,至少在教育上,我不認同。

此外,在同工同酬方面,它採用問卷的方法,測量女性對同工同酬的感知,然後作為評判。

有沒有問過貧困男同志們的意見?

但說實話,我一個人找不齊,也不想找了。


三、一點想法

對於女權:

這份報告2006年中國是在115個國家裡排名63。

2018年是在149個國家裡排名113。

這個,報告裡說了,有的人沒說。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!

(來自橙雨傘)

我不是女權主義者,但我認同中國需要普及平權知識,但不是以這樣的方式。

不是以不可信的方式,不是以隱瞞的方式,不是以漠視現有成果的方式,不是以不尊重男性的方式。

坦誠,是彼此溝通的基礎,是把性別教育和性教育讓更多人聽懂的必經之路。

這篇報告,很遺憾,沒做到。

不應該被當成證據使用。

同時,也不能因為這份報告的瑕疵而放棄平權。

可能有所不同的是,我本人更相信機會均等,而非結果均等。

對於世界經濟論壇:

今天下午我拿到報告之後,試著撥通了世界經濟論壇的電話。

我發郵件簡要講述了我發現的最大的淨入學率的錯誤。

討論中,世界經濟論壇的工作人員沒有限制我寫下這篇文章。但好像,也沒打算怎麼樣。再討論,在研究,是最後的答案。如果我能把我掌握的內容發給他們,也ok。

我有一點失落,這和我對國際組織的期待產生了落差。

但寫下這篇文章的時候,我又不那麼擔心了,因為我也在履行我短暫的作為國際組織一份子的使命。

希望世界經濟論壇撤下那篇報告,2019年的時候做一份更好的。

請所有的讀者不要斷章取義,世界經濟論壇犯錯了,但或許不是故意的。

全球性別差異報告把中國的教育數據算錯了,一錯錯了三年!


分享到:


相關文章: