04.03 垃圾基因還真的是垃圾

垃圾基因的發現

上世紀科學史上最重大的一件事就是DNA雙螺旋結構的破譯。從此,我們知道了基因以及它的作用。但自那以後,我們對DNA和基因的瞭解一直還在不斷深化。

當科學家首次弄清楚DNA上的鹼基是如何指導蛋白質合成的時候,他們以為,所有DNA上的鹼基都是為了編碼製造蛋白質而存在的。然而,到了20世紀70年代,有一點變得越來越清楚了,即基因組中僅有一小部分DNA序列參與了編碼蛋白質,其餘則都是垃圾基因。它們不參與蛋白質的合成,在生命活動中沒有顯示出任何生理功能。

例如,科學家第一次對人類基因組進行測序時驚訝地發現,在長達30億對鹼基的人類基因組中,傳統意義上的基因(即編碼蛋白質的DNA片段)居然如此稀少。最開始他們預測,至少應該存在10萬或更多的基因,可是最後才找到了大約3.5萬個,而且最終得到確認的只有2.1萬個左右。剩餘的大量DNA全都是沒有用的“垃圾”。

垃圾基因还真的是垃圾

是真“垃圾”還是假“垃圾”?

但儘管這樣,很多生物學家依然認為,這些垃圾基因可能有某些次要的功能,比如調節其他有用基因的活性等。為了確證這一點,2003年,美國啟動了ENCODE計劃(該項目至今還在進行中)。至2012年,ENCODE計劃一共對人類基因組中3%的DNA序列進行了分析和研究。得出的結論是:在調查過的DNA序列中,大約有80%至少從生物化學的角度來看是據有某些功能的。這項成果被評為2012年全球科技十大新聞之一。

如此一來,垃圾基因的比例就大大縮小了。可是,一些生物學家對ENCODE的結論並不服氣。美國休士頓大學的丹·格厄爾就是其中之一。

他和ENCODE的根本分歧在於如何定義“基因是具有功能的”。在ENCODE計劃中,只要觀察到某段DNA序列在生物化學上表現出輕微的活性,就判定它是具有功能的。但在格厄爾看來,這是遠遠不夠的。相反,他認為,只有當一段DNA序列是為了某個實實在在的生理用途進化來的,一旦被突變破壞,就會產生有害的影響,只有這樣的DNA序列,才能被定義為具有功能的。

換句話說,他認為ENCODE對有用基因的定義太寬泛了,這就好比說,你要是把動物定義成“會動的物體”,那麼滾動的石頭,流動的水也可以算是“動物”了。

進化需要大量垃圾基因

格厄爾認為,許多人之所以難以接受DNA上垃圾基因佔絕大多數這一事實,一個勁地要為垃圾基因“翻案”,是因為他們沒考慮到垃圾基因在進化上的重要作用。

我們知道,生物進化的內在驅動力是基因突變。造成突變的原因有紫外線的照射、在細胞分裂過程中DNA複製出錯等。突變是隨機的,就是說在整條DNA上任何一個位置,不論是有用基因還是垃圾基因佔據的位置,發生突變的概率是均等的。在進化過程中,子代往往從父輩那裡遺傳了一大堆突變基因。如果這些突變造成嚴重的後果,有些子輩在未生下自己的子嗣之前就會死去。進化通過這種方式來阻止一個物種中有害突變的逐代積累,不這樣的話,就會危及整個物種的生存。

我們不妨試想一下,倘若我們身上大多數的DNA具有某種生理功能,那意味著,大多數突變將落在這些DNA序列上,生下的大多數孩子將會因有著這樣那樣的缺陷而不能傳宗接代。為了得到一個健康的孩子,要以生下很多有缺陷的孩子為代價。這是與實際情況不符的。相反,如果我們的大部分DNA是垃圾,那麼大多數的突變就不會對我們的繁衍造成影響。

格厄爾計算了一下,在不同情況下為了能夠進化,一對夫婦需要生多少孩子才能避免積累太多有害的突變。

他發現,如果整個基因組的DNA序列都具有生理功能,這對夫婦需要大約生1億個孩子,才能保證其中有2個是正常的(2個是保證人類不至於數代之後滅絕的最低數目)。即使基因組中只有1/4的DNA序列據有生理功能,每對夫婦平均也要生近4個孩子,才能保證有2個是正常的。

考慮到基因突變率和史前人類的平均生殖率,格厄爾計算表明,我們的DNA中大約僅有8%到14%可能具有某種實實在在的生理功能。這與2014年的另一項研究所下的結論不謀而合。在那項研究中,科學家將我們的基因組與其他物種的基因組進行了比較,得出結論:人類基因組中大約僅有8%具有某種實實在在的生理功能,所以只有2.1萬個有用基因並不奇怪。


分享到:


相關文章: