癌症基因組學研究全程回顧

實驗設計上的注意事項

測序深度與檢測靈敏度是直接相關的。在典型的實驗中,如果測序流動槽(Flowcell)的一條通道(lane)只上一個樣本,那麼測序深度會非常高,這能實現極其靈敏的檢測。基於此原因,miRNA的測序深度很少成為考慮因素。在篩查應用中,或不需要如此高深度檢測的研究中,樣品可加上測序Index標籤,從而能夠在同一個測序lane中上樣多個不同的樣本。需要注意的是,在設計miRNA的測序深度時,要時刻記住miRNA控制基因表達,因而miRNA水平的小變化可能影響許多編碼蛋白。

新發現的miRNA應當通過功能分析(如Ago2結合或敲除實驗)來確認。

實驗應當包含足夠的樣品,以便結論具有真正的統計意義和高的可信度。一般來說,建立一個可能的假設相對來說是比較容易的,只要能證明miRNA存在於患者的腫瘤中,即便樣本數量不多也是足夠的。但是要真正驗證假設就沒那麼容易了,通常需要大量的患者來檢驗,並建立統計學可信度。目前,關於如何在測序研究中建立統計學可信度和多重檢驗糾正,還沒有特別公認的方法。當前基於測序的miRNA分析並沒有實現miRNA表達的絕對定量,而僅是不同miRNA(如腫瘤-正常配對)的相對量。

樣品分層是癌症樣品的一個問題。一個特定的癌症表型可能代表幾種不同的病因和機理。為了要進行嚴格的分析,應當有足夠多的樣品量,從而能夠充分代表每個腫瘤亞型。而miRNA的表達會隨著腫瘤的發展而變化,因此在實驗設計時應建立腫瘤分期和分級。

RNA-蛋白結合(CLIP-Seq)

在人類細胞中,大多數mRNA(或前體mRNA)與核不均一性核糖蛋白(hnRNP)相結合,形成大的hnRNP-RNA複合物。hnRNA蛋白在RNA加工的所有關鍵環節中都發揮重要作用,包括前體mRNA剪接以及mRNA出核、定位、翻譯和穩定性。幾十種RNA結合蛋白(RBP)和基因的hnRNP蛋白與癌症相關聯。

RNA-蛋白的相互作用可通過交聯免疫沉澱測序(CLIP-Seq)來測定。在CLIP-Seq中,細胞經過紫外線處理,讓RBP與RNA複合物共價交聯。細胞隨後被裂解,RBP-RNA複合物被免疫共沉澱,從而測序相應的RNA。

Wilbert M. L., Huelga S. C., Kapeli K., Stark T. J., Liang T. Y., et al. LIN28 binds messenger RNAs at GGAGA motifs and regulates splicing factor abundance. Mol Cell 48: 195-206LIN28是個保守的RNA結合蛋白,它與多能性、重編程和腫瘤的形成相關。在各種不同的癌細胞和原發腫瘤組織中都發現LIN28的異常上調。在這篇文章中,作者利用CLIP-Seq鑑定了大約四分之一分佈於人類轉錄本中LIN28的結合位點。從這些結合位點中他們發現,LIN28與mRNA中富含環結構的GGAGA序列結合。同時還發現了,LIN28的表達能夠導致可變剪切中的下游變化。

表觀遺傳和甲基化

癌症發展過程中的表觀遺傳改變與異常的基因表達相關聯。近期的研究證據表明,表觀遺傳上的改變可能在癌症 起始中 發揮作用。表觀遺傳的控制是通過多個不同過程進行介導的,包括DNA修飾(甲基化或乙酰化)、組蛋白修飾和核小體重塑。發現控制表觀基因組的基因發生突變,在人類癌症中是一個相當普遍的現象。NGS測序技術提供了一整套工具,可定位突變並測定它們對癌症發展的影響。

癌症基因組學研究全程回顧

癌症中表觀遺傳修飾物的基因突變。在不同類型的癌症中經常觀察到三類表觀遺傳修飾物發生突變,這突出了遺傳學和表觀遺傳學之間的串擾。表觀遺傳修飾物的突變有可能引起癌症的全基因組表觀遺傳改變。瞭解遺傳和表觀遺傳變化的關係將為癌症治療提供新的見解。

DNA修飾

DNA修飾目前可以很容易地通過多種技術來進行測定。不同技術的選擇取決於所需的通量和分辨率。

癌症基因組學研究全程回顧

Bert S. A., Robinson M. D., Strbenac D., Statham A. L., Song J. Z., et al. Regional activation of the cancer genome by long-range epigenetic remodeling. Cancer Cell 23: 9-22文章作者通過協同的長距離表觀遺傳激活(LREA)技術,鑑定出一種結構域基因去調控的機制。這些區域通常會跨越1Mb的基因組長度,包括關鍵癌基因、microRNA和癌症的生物標誌物基因。LREA結構域中基因啟動子的特點是活性染色體標記的的獲得和抑制標記的丟失。

Brastianos P. K., Horowitz P. M., Santagata S., Jones R. T., McKenna A., et al. Genomic sequencing of meningiomas identifies oncogenic SMO and AKT1 mutations. Nat Genet 45: 285-289為了鑑定和驗證腦膜瘤中的體細胞遺傳改變,作者對17個腦膜瘤進行了全基因組或外顯子組測序,並對另外48個腫瘤進行了靶向測序。他們所觀察到的突變譜是分佈廣泛,但他們證實了43%的腫瘤中存在病灶NF2失活,並在另外8%的腫瘤中發現表觀遺傳修飾物的改變。

Duncan C. G., Barwick B. G., Jin G., Rago C., Kapoor-Vazirani P., et al. A heterozygous IDH1R132H/WT mutation induces genome-wide alterations in DNA methylation. Genome Res 22: 2339-2355腦膠質瘤、急性骨髓性白血病和軟骨瘤中經常發生NADP+依賴的異檸檬酸脫氫酶IDH1和IDH2的單等位點基因點突變。作者表明,IDH1R132H等位基因的雜合表達足以誘導這些腫瘤特有的以DNA甲基化為特徵的全基因組改變。這說明了IDH1R132H/WT突變體是推動人類癌細胞的表觀遺傳不穩定性的原因。

Zhang J., Benavente C. A., McEvoy J., Flores-Otero J., Ding L., et al. A novel retinoblastoma therapy from genomic and epigenetic analyses. Nature 481: 329-334視網膜母細胞瘤是一種發生於視網膜的侵襲性兒童癌症,由RB1失活所引發,但潛在機理仍然未知。在此類高度侵襲性的癌症中,許多基因都參與其中,但RB1是唯一的已知發生突變的癌基因。與有限的體細胞突變不同,相對正常的成視網膜細胞,腫瘤的甲基化圖譜表現出巨大的改變。最驚人的結果之一是人視網膜母細胞瘤中原癌基因脾絡氨酸激酶(SYK)的誘導表達。SYK是腫瘤細胞生存所必需的。研究人員接著表明,小分子抑制劑對SYK的抑制導致培養和體內的視網膜母細胞瘤的細胞死亡。

實驗設計上的注意事項

每種組織和細胞類型都有著獨特的甲基化模式;因此必須獲得感興趣的組織以便分析。癌症研究中,腫瘤組織-癌旁正常組織的配對可簡化分析。

通過重亞硝酸氫鹽測序所產生的超大量CpG標誌物很難解釋,且可靠的統計學分析目前仍然困難重重。不過,下面一些實際的方法可簡化分析:

  • RRBS-Seq通過限制覆蓋度而簡化分析;

  • 綜合分析大大改善了結果的可解釋性。例如,將表達分析與甲基化分析相結合,讓我們可專注於表達水平改變的基因;

  • 將分析限制在某個感興趣的基因或區域中。這種方法對GWAS的後續研究很有效,也適合已有實驗證據說明目的區域存在基因調控或染色質重塑的研究。與降低代表性的方法不同。這種方法實現了更多區域的分析,因此可獲得更多信息。

組織培養物應當謹慎使用。隨著時間的推移和組織增殖,培養物的甲基化水平可能已經改變,不大能代表原先的組織樣本。

組蛋白修飾

組蛋白修飾通常指的是甲基化和乙酰化。組蛋白H3K9、H3K27和H4K20的甲基化與基因轉錄的抑制相關,而H3K4和H3K36的三甲基化與活性轉錄的染色質相關。組蛋白乙酰化幾乎總是與染色質可接近性和轉錄活性水平的增高相關。通過操控染色質狀態和DNA可接近性,表觀遺傳修飾在各個發育階段、組織類型和疾病中都對基因表達的控制起著關鍵作用。

Wilkinson A. C., Ballabio E., Geng H., North P., Tapia M., et al. (2013) RUNX1 is a key target in t(4;11) leukemias that contributes to gene activation through an AF4-MLL complex interaction. Cell Rep 3: 116-127這篇文章報道了一種轉化機制,其中兩個致癌融合蛋白合作激活目的基因,然後調節其下游產物的功能。

實驗設計上的注意事項

每種組織和細胞類型都有著獨特的甲基化模式;因此必須獲得目的組織以便分析。

組蛋白修飾可以通過各種ChIP-Seq方法進行檢測,原理是通過抗體與目標甲基化組蛋白進行特異結合。

同樣,組織培養物應當謹慎使用。隨著時間的推移和組織增殖,培養物的甲基化水平可能已經改變,不大能代表原先的組織樣本。

染色質結構與重排

染色體重排需要DNA雙鏈斷裂的形成和連接。這些事件的發生,會破壞基因組的完整性,並經常在白血病、淋巴瘤和肉瘤中觀察到。並且特定基因間的反覆的基因融合在不同的個體中均觀察到,這表明這些基因一定在細胞週期中的某個階段他們之間的物理位置非常接近。

癌症基因組學研究全程回顧

這是一個設想的三維、具有轉錄活性的複合物,它包含了緻密的環化位置。這個示意圖是基於檢測到的成環事件,並假設所有成環事件都能發生在單個細胞內。在這個模型中,所有小環彙集到一個共同的核心(藍色球)。環降低了轉錄活性複合物的物理大小,從而推動轉錄因子接近待定的基因組位點。

癌症基因組學研究全程回顧

檢測染色質相互作用。在三維空間中,相同或不同染色體上遠端的基因組區域相互作用,而這種相互作用是由一個或多個DNA結合蛋白介導的。a) ChIP-Seq 利用染色質免疫共沉澱來鑑定DNA和蛋白的相互作用。人們採用各種DNA-片段化方法和核酸外切酶,來縮小片段的大小分佈。b)染色質構像捕獲實驗利用一個連接步驟將互作的染色質片段相連接。這種方法可鑑定與遙遠序列相結合的蛋白。c)配對末端標籤測序分析染色質相互作用(ChIA-PET)同樣也利用連接步驟來檢測染色質相互作用,將不相鄰的互作區域配對。然而,ChIA-PET利用染色質免疫共沉澱(ChIP)步驟,只能鑑定特定蛋白的相互作用,如RNA聚合酶II。

參考文獻

Papantonis A., Kohro T., Baboo S., Larkin J. D., Deng B., et al. TNFalpha signals through specialized factories where responsive coding and miRNA genes are transcribed. EMBO J 31: 4404- 4414作者利用測序以及染色體構像捕獲(3C)和ChIA-PET表明,TNF_alpha誘導響應基因聚集在分散的『NF-B工廠』。一些『工廠』還專門轉錄編碼miRNA的響應基因,這些miRNA靶定下調的mRNA。

Rocha P. P., Micsinai M., Kim J. R., Hewitt S. L., Souza P. P., et al. Close proximity to Igh is a contributing factor to AID-mediated translocations. Mol Cell 47: 873-885細胞核組織可決定『脫靶』活性以及融合伴侶的選擇。這項研究表明,絕大多數已知的活化誘導胞嘧啶核苷脫氨酶(AID)介導的Igh轉位伴侶在類型轉換過程中與此位點接觸的染色體結構中被發現。此外,這些相互作用結構域可用來鑑定被AID靶定的其他基因。

Theodoratou E., Montazeri Z., Hawken S., Allum G. C., Gong J., et al. Systematic meta- analyses and field synopsis of genetic association studies in colorectal cancer. J Natl Cancer Inst 104: 1433-1457這篇研究文章表明,T細胞特異的轉錄因子GATA3在介導增強子接近調控區域上扮演了重要角色,這些調控區域參與了雌激素受體(ESR1)介導的轉錄。GATA3沉默導致在雌激素刺激之前輔助因子和活性組蛋白標記的整體重新分配。

Hakim O., Resch W., Yamane A., Klein I., Kieffer-Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 484: 69-74作者發現,在培養的小鼠B淋巴細胞中,缺乏經常性的DNA損傷時,Igh或Myc與其他所有基因之間的易位與它們的接觸頻率直接相關。反過來,與經常性位點指向的DNA損傷相關的易位與DNA斷裂形成的速率成正比。他們認為,非定向重排反映了細胞核結構,而DNA斷裂形成決定了包括驅動B細胞惡性腫瘤在內的經常性易位的位置和頻率。

綜合分析(多組學分析)

所有的生物過程都是相互關聯的,而在癌細胞發生過程的任何一個變化都會影響其他所有過程。突變可能影響所表達的活性,繼而又影響DNA甲基化,再就影響其他許多基因的表達等等一連串的反應。每個個體都有著大量的特有突變,再加上這一連串的事件,能夠讓人們深入研究各種用於區分癌症的疾病表型。綜合分析可以使揭示癌症生物學的真正複雜性向前邁進了一步。研究人員如今能夠檢測大部分的單個過程,但認識和治療癌症的真正進步將來自於對所有這些過程的綜合分析,也就是常說的多組學分析。

參考文獻

Weischenfeldt J., Simon R., Feuerbach L., Schlangen K., Weichenhan D., et al. (2013) Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23: 159-170作者發現,早發性前列腺癌的形成涉及到雄激素驅動的結構重排。相比之下,老年發病的前列腺癌積累了非雄激素相關的結構重排,表明一種不同的腫瘤形成機制。

Cowper-Sal lari R., Zhang X., Wright J. B., Bailey S. D., Cole M. D., et al. (2012) Breast cancer risk- associated SNPs modulate the affinity of chromatin for FOXA1 and alter gene expression. Nat Genet 44: 1191-1198作者表明,與乳腺癌風險相關的SNP集中在FOXA1和ESR1的順反組(cistrome),以及組蛋白H3賴氨酸4單甲基化(H3K4me1)的表觀基因組。大多數的風險相關SNP調控FOXA1在遠端調控元件的染色質親和力,這導致等位基因特異的基因表達。

Peifer M., Fernandez-Cuesta L., Sos M. L., George J., Seidel D., et al. (2012) Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat Genet 44: 1104-1110作者發現了TP53和RB1失活的證據,並在編碼組蛋白修飾物的基因中發現了反覆的突變。此外,他們還在PTEN、SLIT2和EPHA7中觀察到突變,以及FGFR1絡氨酸激酶基因的病灶擴增。這種綜合分析表明,組蛋白修飾可能與小細胞肺癌(SCLC)有關。

技術參考

一個良好的實驗設計可以提高技術性能,從而產生最易解釋和可靠的結果。這裡重點強調研究人員在設計實驗時必須牢記的生物學和技術的特性。

癌症中的實驗設計面臨一些獨特的挑戰。典型的腫瘤樣本包含兩個基因組:遺傳自父母的生殖細胞系(germline)和在疾病發展過程中積累的體細胞突變(somatic mutations)。腫瘤細胞在樣本中的比例可能在10%-100%之間。腫瘤基因組也是動態的,會快速積累 de novo 突變。因此,每一個腫瘤中又可能同時包含幾個克隆亞型。

目前大部分已發表研究的樣本量都非常小,可被視為僅是提出了相關的假說。而隨著越來越多的測序信息被我們所獲得,大部分癌症類型可根據其分子表型,被分成多個亞群。這嚴重降低了實驗的能力,並增加了嚴格分析所需的樣本數量。部分解決這一難題的方案是在探索階段利用全基因組測序來尋找新的突變。在第二階段,利用全外顯子組或靶向測序來確認新發現的這些突變,並確定他們在大型隊列中的丰度。然而,在未來,統計學上嚴謹的全基因組測序實驗有可能是非常大的,需要數千個樣本。

使用NGS測序技術進行深度測序是指多次生成定位到同一區域的序列片段,有時達上百次。但由於每條序列片段是從單個DNA分子中產生的,故提高深度測序能夠實現原始樣品中低至1%的克隆的檢測。比較同一個體的腫瘤和癌旁正常組織的序列,我們可以很容易識別浸潤組織的序列片段。最佳的讀取深度將取決於癌症類型和所需的靈敏度,但一般建議為正常基因組最低為40倍的覆蓋深度,而癌症基因組需要80倍以上的覆蓋深度。在腫瘤高度異質時,可能需要腫瘤不同部位的多次活檢,才能包含所有的細胞類型。

癌症基因組學研究全程回顧

在這個假定的例子中,腫瘤含有兩個癌症克隆和鄰近組織。腫瘤樣本中正常細胞所產生的序列(圖中:比對中的前兩個序列)可通過與鄰近正常組織所產生的序列比較後確定。腫瘤樣本中的剩餘序列可分為兩組,分別代表主要和次要的腫瘤克隆。次要克隆,若不及時治療,可能在復發時成為腫瘤的主要組分。在實際分析中,腫瘤樣本至少要有40倍的覆蓋深度,並覆蓋靶定的基因集合、全外顯子組或全基因組。

檢測癌症基因組中的體細胞突變通常有三種方法:全基因組測序、全外顯子組測序和靶向基因測序。下表簡要介紹了每種方法的有點和缺點。在比較多發性骨髓瘤的全基因組和外顯子組測序時,半數的蛋白編碼突變通過染色體畸變(如易位)而存在,其中大部分不能單獨被外顯子組測序而發現。靶向重測序是一種有用的技術,可收錄超大隊列中已知癌症相關基因的突變。從長遠來看,隨著我們對基因組的瞭解日益加深,並且我們處理和解釋大型數據集的能力的提高,全基因組測序無疑是最好的腫瘤分子鑑定方法。而在短期內,靶向基因測序可為患者匹配出市場上已有的藥物,讓他們立刻受益。

癌症基因組學研究全程回顧

參考來源

Illumina cancer research


分享到:


相關文章: