從海量數據中尋找未知

原文:http://www.astronomy.com/magazine/news/2018/09/seeking-the-unknown-in-cosmic-data

翻譯:陸寅楓

校對:陳豔玲、汪榮鑫

在大規模巡天,公眾科學,和機器學習盛興的時代,天文學應該期待預料之外的發現。

从海量数据中寻找未知

澳大利亞平方千米陣探路者(ASKAP)。目前已知的射電源大概有二百五十萬個,不過Ray Norris希望通過這些望遠鏡在天空中另發現七千萬個左右。

Credit: SKA organization

1964年,天文學家阿諾·彭齊亞斯和羅伯特·威爾森在他們的觀測數據中發現了奇怪的並持續出現的噪聲,他們嘗試尋找了潛在的錯誤輻射信號來源,甚至重新設計瞭望遠鏡的一部分,但都沒能成功去掉它們。當一切方法看起來都不奏效的時候,他們趕走了已經在望遠鏡中築巢的兩隻鴿子,清理了它們的排洩物,但噪聲依然存在。他們當時不知道的是,他們試圖去掉的“噪聲”,其實是我們宇宙中最基本的信號——宇宙微波背景輻射(CMB)。

十年後,彭齊亞斯和威爾森因為宇宙微波背景輻射的偶然發現而獲得了諾貝爾物理學獎。十年前的他們當時正在尋找銀河系周圍的光暈,但是他們最終卻發現了宇宙發出的第一道光。

並不僅僅是彭齊亞斯和威爾森取得過這樣偶然的突破。相反,意外的發現幾乎已經成為天文學的標誌了。威廉·赫歇爾在1781年尋找雙星系統時發現了天王星,他最初還以為他看到的是一顆彗星。工程師琳達·謨拉比託為了更好地看到木星衛星後背景天空中的恆星,在調整照片對比度時發現了木衛一上的火山。物理學家卡爾·央斯基在試圖改善跨大西洋電話質量的時候發現了從銀河系中心發出的無線電波。60年代的一顆美國間諜衛星在尋找秘密核彈爆炸試驗的時候發現了伽馬射線暴。這樣的例子數不勝數。

天文學的發展不僅依靠長時間以來理論和觀測間的調解,也大大得益於意料之外的發現。過去二十年間,哈勃望遠鏡出色地完成了它最初的目標,但它同時也發現了環繞年輕恆星的電離原行星盤,揭開了暗能量的面紗,並且向我們展示了天空中看似漆黑空曠的區域其實也點綴著無數星系。當哈勃望遠鏡剛發射升空時,沒有人會預料到這些發現。

从海量数据中寻找未知

1959年,貝爾實驗室在新澤西州的霍爾姆德建造了15米霍爾姆德喇叭天線,它最初的目標是能夠進行衛星通訊方面開拓性的工作。1964年,彭齊亞斯和威爾森就是用它發現了宇宙微波背景輻射。

Credit: NASA

隨著科技的迅速發展,天文學進入了大數據時代。高分辨率成像技術和新的數據收集技術讓天文學家能以前所未有的速度收集並儲存大量的數據。他們往往會淹沒在這些數據中而沒有足夠的時間去處理它們。所以,大數據天文時代需要一種處理數據的全新方式,而天文學家現在也正在努力改善他們的方法,希望能提高他們做出意料之外發現的機會。

翻遍每個角落

天文學中許多意想不到的發現都直接得益於新技術的發展。伽利略的望遠鏡讓人們第一次能夠以全新的角度觀測天空,從而發現令人震驚的驚喜。幾個世紀後,哈勃望遠鏡讓天文學家能夠更進一步的看入深空,揭露無法想象的奇妙現象。現在,天文學家雷·諾里斯將使用射電對宇宙進行一項新的調查。

宇宙演化圖(Evolutionary Map of the Universe, EMU)項目使用澳大利亞平方千米陣列對夜空中的射電源進行研究。它的目標是結合深度和廣度,在比之前任何嘗試更廣的視場中尋找更微弱的射電源。目前已知的射電源大概在二百五十萬個左右,而EMU項目預期另發現七千萬個。

射電源通常都位於最具活力和爆炸性的天體中。黑洞,超新星,脈衝星等都在向外發射無線電波。EMU項目期望能夠通過發現大量早期宇宙中的天體來解釋最初的恆星和星系是如何形成的。諾里斯已經花了許多時間來思考該如何實現那些意料之外的發現了。

“隨著望遠鏡技術的進步,我們會收集到越來越多的數據”,諾里斯說,“問題的關鍵是發現那些你不曾預料的事情,那些藏在你所熟知的東西之中,數據噪點之後的事情。”

从海量数据中寻找未知

背景和儀器所產生的噪點,就像彭齊亞斯和威爾遜所熟知的那樣,很難量化。隨著望遠鏡等儀器變得越來越複雜,它們留在觀測數據中的噪聲信號也越來越難以理解。所以,區分異常的數據到底僅僅是噪聲還是真正意料之外的發現的能力至關重要。

為了尋找這些意料之外的發現,諾里斯正著手於一個稱為寬場異常值探測器(Widefield ouTlier Finder)的項目。這個探測器明確的目的便是使用雲計算和複雜的算法,從海量的數據中篩選出異常值,有效地減少數據量。

尋找,就尋見

如果你找不到什麼新的目標去觀測,那就嘗試看得比其他人都更仔細吧。當喬斯林·貝爾還是劍橋大學的一名研究生時,她被分配到一項研究類星體數據的任務。在眾多信號數據中,她注意到有一個信號源變化的速率太快,不像是類星體。於是她便發現了脈衝星。

這種方法是許多研究的基礎,例如大型綜合巡天望遠鏡(LSST),它每隔幾晚便將整個天空勘測一遍。

“所有人都相信LSST是尋找非常稀有的天體或天文事件的一場革命是有原因的”,LSST項目科學家Željko Ivezić說,“LSST勘測的量度,維度,和精度都是非常有益於發現稀有天體或天文事件的。”

从海量数据中寻找未知

一個典型的8米望遠鏡和經過特殊設計的LSST的視場寬度比較。

Credit: LSST Corporation; Astronomy: Roen Kelly

LSST計劃於2021年投入使用,屆時起LSST將會向天文學家提供持續不斷的詳盡的巡天數據。LSST的寬場視野可以裝下40個滿月,在如此寬的視場中,LSST將會在從可見光到近紅外的幾個不同波段拍攝照片。每個天晴的晚上,LSST就會記錄下超過30TB的數據。在它預計10年的工作時間中,它將對天空的每塊區域進行超過一千次的拍攝,對大約四百億天體進行超過三萬億(3×10^12)次觀測。

很顯然,這種觀測的方式會把那些亮度變化顯著的天體區分出來,例如脈衝星,超新星,類星體等;同時,它也會把移動的天體給區分出來,比如小行星或是其他在我們太陽系中的小天體。科學家希望LSST還能找出除了這兩種方式以外的變化。

大規模巡天以前當然也進行過,只是從未到達過LSST這種程度。在LSST之前,最大一次規模的巡天是斯隆數字化巡天(Sloan Digital Sky Survey, SDSS),但SDSS只對四分之一的天空進行巡天。和SDSS比起來,LSST使用的望遠鏡幾乎要大三倍,分辨率高兩倍,能探測的光譜波長範圍也更大,並且目標是整個天空。

有了LSST如此高的數據收集效率,研究人員將可以依靠它在影像方面保持前列。為此,LSST的科學家們設計了一套系統,它可以自動地將兩張不同時間拍攝的同一片天空的照片進行對比。並且該系統可以在一分鐘內識別出兩張圖片中改變的部分。當然,找到哪裡變化了是一回事,理解這變化背後的原因就是另一回事了,科學家仍需花上很多時間來做分析。

“我們需要這些工具有能力處理萬億數級的數據量”,Ivezić說,“現在我們的工具可以應對百萬數級甚至十億數級的天體數量,但是將這個能力提升一千倍絕對不是什麼簡單的事情。如果我們能做到這一點,或許我們將帶來能夠改變整個天文學格局的發現。”


分享到:


相關文章: