智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

宇宙中大多數物質由原子構成,原子又由原子核和電子組成。其中,電子是基本粒子,但原子核又可分為質子和中子,並可進一步分為夸克和膠子。這些夸克和膠子的相互作用非常強烈,以至於只有通過極高能量的質子對撞才能讓它們擺脫束縛。在高能碰撞時可以產生包括夸克和中子在內的大量粒子,向某個方向射出,這些粒子團被稱為噴注(jet)。

噴注可以分為:1)膠體噴注,2)輕夸克噴注,3)魅夸克噴注,4)美夸克噴注。由於它們的不同內在特性(如質量和色量子數),不同種類的噴射經歷不同的衰變過程,其內部結構也在實驗中顯示出不同的觀測值。

儘管在理論物理模擬中可以很容易地識別出噴注的味道,但目前在實驗中沒有可靠的方法可以對所測量的真實噴注進行分類。因此,開發一種穩健的算法來識別噴注味道,將讓我們可以更直接地比較實驗測量和基本粒子理論。

2019 年 11 月,北京智源人工智能研究院聯合數據評測平臺 biendata,共同發佈了粒子碰撞數據集,其中包含數百萬條高能對撞中所產生的噴注信息(質量、能量、方向等),以及相關的碰撞事件信息和噴注中粒子的信息。biendata 同步開放了“高能對撞粒子分類挑戰賽”(

2019 年 11 月-次年 2 月),總獎金為 10 萬元。比賽和數據可於下方鏈接查看,或點擊“閱讀原文”

比賽地址:https://www.biendata.com/competition/jet/

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

背景

宇宙中大多數物質由原子構成,原子又由原子核和電子組成。其中,電子是基本粒子,但原子核又可分為質子和中子,並可進一步分為夸克和膠子。這些夸克和膠子的相互作用非常強烈,以至於只有通過極高能量的質子對撞才能讓它們擺脫束縛。在高能碰撞時可以產生包括夸克和中子在內的大量粒子,向某個方向射出,這些粒子團被稱為噴注(jet)。

噴注可以分為:1)膠體噴注,2)輕夸克噴注,3)魅夸克噴注,4)美夸克噴注。由於它們的不同內在特性(如質量和色量子數),不同種類的噴射經歷不同的衰變過程,其內部結構也在實驗中顯示出不同的觀測值。

儘管在理論物理模擬中可以很容易地識別出噴注的味道,但目前在實驗中沒有可靠的方法可以對所測量的真實噴注進行分類。因此,開發一種穩健的算法來識別噴注味道,將讓我們可以更直接地比較實驗測量和基本粒子理論。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

比賽任務

本次比賽提供粒子碰撞數據集,其中包含對撞中產生的噴注信息(質量、能量、方向等),以及相關的碰撞事件信息和噴注中所包含的粒子信息,要求選手根據噴注的性質(如噴注所含的粒子數、噴注能量、噴注質量、噴注方向),以及噴注中所有粒子的特徵(方向、質量、能量等)和對應的碰撞事件,把噴注分成四類中的一類。

本次比賽分為簡單賽道複雜賽道,依次進行。簡單賽道只要求選手根據噴注屬性的數據集進行分類;複雜賽道在此基礎上,又加入噴注所含粒子的屬性文件和碰撞事件文件,數據的體量和維度劇增,難度也相應加大。簡單賽道和複雜賽道的測試集一樣,只是提供的數據維度不同。

簡單賽道(11 月 30 日至 12 月 25 日)

選手根據噴注的性質(噴注所含的粒子數、噴注能量、噴注質量、噴注方向)進行分類(簡單賽道開放時間較短,建議提前報名參賽)。

複雜賽道(12 月 25 日至次年 2 月 15 日)

選手根據噴注的性質、噴注中所有粒子的特徵、以及噴注所在的碰撞事件進行分類。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

粒子碰撞數據集

本數據集共包含 200 多萬條噴注信息,分為 EVENTJETPARTICLE 三類文件,三者為上下層級關係,一個碰撞事件(EVENT)會產生若干個噴注(JET),而一個噴注中會包含若干個粒子(PARTICLE)。EVENT 文件是對碰撞事件的描述,JET 文件詳細說明了噴注的屬性,PARTICLE 文件進一步描述了噴注中所含各個粒子的屬性。

這三類數據的結構可以通過以下方式直觀理解:
- Event 1: Event 1的屬性

- - Event 1 中的噴注 1 (jet1)

- - - 噴注 1 中的粒子 1 數據

- - - 噴注 1 中的粒子 2 數據

- - - ……

- - Event 2 中的噴注 2 (jet2, event1)

- - ……

- ……

具體而言,在 EVENT 文件中,“event_id”字段是碰撞事件的編號,“number_of_jet_in_this_event”字段表示碰撞事件中產生的噴注數量。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

▲ 圖:Event文件樣例

JET 文件中,“jet_id”字段是噴注的編號,“number_of_jet_in_this_event”字段表示碰撞事件中產生的噴注數量,“jet_px”“jet_py”“jet_pz”字段表示噴注的方向,“jet_energy”表示噴注的能量,“jet_mass”表示噴注的質量,“event_id”表示該噴注所在的碰撞事件,“label”表示噴注屬於的類別。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

▲ 圖:Jet文件樣例

PARTICLE 文件中,“Particle_category”字段是粒子的標籤號,“particle_px”“particle_py”“particle_pz”字段表示粒子的方向,“particle_energy”表示粒子的能量,“Particle_mass”表示粒子的質量,“jet_id”表示該粒子所在的噴注。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

▲ 圖:Particle文件樣例

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

同類研究

自 2016 年開始,物理學界開始嘗試將深度學習引入噴注分類任務中。在此過程中可以發現,最新的機器學習技術創新可以相當顯著地提升模型性能。

目前,已有多種機器學習技術已經在相關數據集上得到應用。2017 年,麻省理工學院的研究團隊將模擬噴注數據中粒子的密度轉化為二維圖片,並用卷積神經網絡等計算機視覺技術對圖片進行分類 [1]。同年,多個團隊報道利用噴注衰變產生的樹狀演變結構,可以採用自然語言處理中的 RNN 及 LSTM 網絡,顯著提升分類的準確率 [2] [3]。一篇 2019 年發表的論文表明,如果考慮一些物理學家設計的變量作為特徵,最高能把膠子-夸克分類的 ROC AUC 數值提升超過 10% 左右,達到 0.899 [4]。

相較於其它數據集,智源“粒子碰撞數據集”的噴注數達到 200 多萬條,而且細分為四類,幷包含具體粒子的詳細信息,在數量和顆粒度上達到了較高的水準。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

參賽方式

點擊閱讀原文鏈接或掃描下圖中的二維碼直達賽事頁面,註冊網站-下載數據

,即可參賽。

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

友情提示,因涉及到數據下載,強烈建議大家登錄 PC 頁面報名參加~~

智源-高能對撞粒子分類挑戰賽,品鑑宇宙粒子的獨特“味道”

智源人工智能系列競賽

2019 年 9 月,智源人工智能算法大賽正式啟動。本次比賽由北京智源人工智能研究院主辦,清華大學、北京大學、中科院計算所、曠視、知乎等協辦,總獎金超過 100 萬元,旨在以全球領先的科研數據集與算法競賽為平臺,選拔培育人工智能創新人才。

北京智源人工智能研究院院長、北京大學教授黃鐵軍介紹:智源的中心任務是在北京建成全球最優的人工智能創新生態,核心是選拔培育人工智能頂尖人才和發展潛力大的青年學術英才。研究院副院長劉江也表示:“我們希望不拘一格來支持人工智能真正的標誌性突破,即使是本科生,如果真的是好苗子,我們也一定支持。”而人工智能大賽就是發現有潛力的年輕學者的重要途徑。

本次智源人工智能算法大賽有兩個重要的目的,一是通過發佈數據集和數據競賽的方式,推動基礎研究的進展。特別是可以讓計算機領域的學者參與到其它學科的基礎科學研究中。二是可以通過比賽篩選、鍛鍊相關領域的人才。截止到目前,智源人工智能系列大賽已開展 5 場,分別涵蓋了神經生物學、自然語言處理、機器視覺等領域。在年底前,智源研究院還將陸續發佈 5 道賽題,敬請大家期待!


目前正在角逐的比賽:

智源-超高清晰電鏡圖像分割挑戰賽—神經元識別大賽

https://www.biendata.com/competition/urisc/

智源-知乎 2019 看山杯專家算法發現大賽

https://www.biendata.com/competition/zhihu2019/


參考文獻

[1] P.T. Komiske, E.M. Metodiev and M.D. Schwartz, Deep learning in color: towards automated quark/gluon jet discrimination, JHEP 01 (2017) 110 [arXiv:1612.01551] [INSPIRE].

[2] S. Egan, W. Fedorko, A. Lister, J. Pearkes and C. Gay, Long Short-Term Memory (LSTM) networks with jet constituents for boosted top tagging at the LHC, arXiv:1711.09059 [INSPIRE].

[3] Cheng, T. Recursive Neural Networks in Quark/Gluon Tagging, Comput. Softw. Big Sci. 2 (2018), no. 1 3. arXiv preprint arXiv:1711.02633.

[4] Hui, L., LUO, M., Kai, W., ZHU, G., & Tao, X. Quark jet versus gluon jet: fully-connected neural networks with high-level features. SCIENCE CHINA Physics, Mechanics & Astronomy. (2019)


分享到:


相關文章: