03.03 天文學產生的數據量為什麼那麼大,這些數據是如何處理的?

魚魚魚__出沒


我們以光學波段觀測為例子。現代天文學進入了CCD時代。那麼這就涉及到CCD的性質因素。

我們一般數碼相機用三種顏色來混合,每種顏色,8位,也就是2^8=256,數值來表示就是0-255。

而天文CCD一般都是16位,單反相機RAW格式,CCD也只是12位,也就是,單色情況下,天文CCD的數據是單反相機,同像素情況下的16倍。數據量一下子就增加了16倍。

其次,天文數據是無壓縮的,通行天文數據是FITS格式。而大部分數碼相機文件都會選取不同畫質的壓縮。所以這使得天文數據比一般文件又大了至少1倍以上。

還有就是天文CCD的尺寸,它往往領先民用相機,民用相機用C畫幅的時候,天文界早就是全畫幅了。這樣數據又至少增加1倍以上。

單單上面的因素,就使得一次曝光,天文數據比同時使用的民用設備,數據大20倍-30倍。

所以,我們一般照相機拍照,最後3M的照片,天文得到的就至少60M甚至更大。

再加上,天文觀測是連續的,對亮天體,基本1秒一次,對暗天體平均100秒左右。那麼一小時的數據量就至少在2400MB左右,差不多是2GB。

如果短曝事件更多,一小時的數據量在10GB以上。

這是對小型CCD探測紀錄的結果。

對複雜的,大型深空CCD,則一次事件的觀測,加上輔助文件等,就可以達到1-2GB,甚至更大。

所以,在天文數據處理方面,有自己一套處理技巧和規範。需要指出的是,這些數據量,還是2005年前後的主流數據量。到了現在,數據更多。動輒以G為單位。

好在計算機硬件、存儲設備都有很大發展。所以總的來說,數據處理的平臺還能跟上。


在具體處理方面,不同的觀測設備,幾乎都有自己的相應軟件。光學方面IRAF比較成熟;IDL有不少軟件包;Python現在也開發了很多軟件包。都可以直接下載使用。


分享到:


相關文章: