03.02 「研究」通過測序和熒光原位雜交(FISH)數據評估腫瘤異質性

「研究」通過測序和熒光原位雜交(FISH)數據評估腫瘤異質性

「研究」通過測序和熒光原位雜交(FISH)數據評估腫瘤異質性

導讀:癌症中克隆進化的計算重建已成為了解腫瘤如何開始和進展以及該過程在患者之間如何變化的關鍵工具。然而,該領域仍在努力發展,面臨著將系統進化方法應用於癌症的特殊挑戰,例如拷貝數改變(CNA)和結構變異(SV)事件在腫瘤進化中的普遍性和重要性,而這些問題很難通過主流測序準確地描述出來。

通過系統發育推斷算法進行的後續重建是準確的。因此,本文開發了將測序與多重相間熒光原位雜交(miFISH)相結合的計算方法,以利用每種技術的互補優勢,推斷出在全基因組規模上考慮了局部改變和非整倍性的準確的克隆CNA進化模型。

「研究」通过测序和荧光原位杂交(FISH)数据评估肿瘤异质性

長期以來,人們一直以為癌症的進展是由克隆進化引起的。但我們對此的理解在兩大關鍵的創新下進一步加深:高通量測序方法以更高的精確度表徵腫瘤基因組學,以及計算生物學方法的發展使得解釋這些測序數據成為可能,從而講述有關單個癌症或所有癌症的空間如何共同發展的連貫故事。後者發展的一個關鍵組成部分是腫瘤系統學領域的發展,該領域發展了從腫瘤基因組數據構建癌症進化模型的計算方法。

克隆系統發生學的方法引起了計算生物學界的極大興趣,特別是隨著該領域對腫瘤進化機制的複雜性以及從可用基因組數據中重建它們的算法挑戰有了更深入的瞭解。在這方面,最近感興趣的一個特定領域是開發更好的方法,以通過拷貝數改變(CNA)和產生它們的結構變異(SV)解決進化。儘管人們早已知道CNA和SVs在癌症中的重要性,並且一些克隆世系重建的首批方法集中在CNA驅動的進化上,但歷史上許多腫瘤系統發生領域都集中在單核苷酸變異(SNV)上,而省略了CNA,或在很大程度上被視為推論SNV驅動的進化的混雜因素。迄今為止,為了推論CNA的腫瘤進化,目前已經建立了相對較少的計算方法,或者單獨或與SNV聯合,直到最近,才出現了更廣泛地捕獲SV進化的方法。

然而,同時的生物學證據強烈表明,CNV和產生它們的SV在預測治療反應方面優於SNV和其他局灶性變化,並且很可能是腫瘤發展的主要機制,並在功能上適應於逃避控制細胞生長。

CNA驅動的進化相對於SNV驅動的進化產生了很多複雜性。在某種程度上,對CNA進行建模是一個挑戰,因為它在系統發育學中一般是較少被研究的一種機制,因此需要算法上的創新。在某種程度上,這是個挑戰,因為CNA會造成特殊的複雜性,它們可能會在多個尺度上發生,有時會出現難以解決的重疊變化。對於系統進化學的反捲積方法,CNA也特別具有挑戰性其中涉及從整體序列中計算分離出克隆混合物數據的缺乏,由於缺乏具有單細胞數據的大型隊列,因此仍然是該領域的必要條件——因為在沒有附加數據或問題約束的情況下,未充分確定CNA的基本反捲積問題。CNA方法還特別難以處理倍性變化,尤其是通過全基因組複製(WGD)處理,因為倍數性很難僅從序列數據中準確推斷出來。儘管最近的方法表明可以使用多區域批量測序或單細胞測序進行準確的CNA構建,但這些方法需要有限的假設,例如,WGD在腫瘤的病史中只能發生一次。此外,大型群組仍然缺少多區域批量或單細胞測序的方法,並且仍然存在一個懸而未決的問題,如何最好地進行大規模腫瘤基因組研究將為克隆CNA的進化提供信息。

準確重建腫瘤演變倍性變化過程的問題令人擔憂,部分原因是WGD現在被認為是一種侵襲性癌症的病理標誌,但該觀察結果缺乏明確的生物邏輯機制。WGD在腫瘤進化中的早期模型提出了一個早期的WGD事件作為染色體發生腫瘤的前提不穩定的癌症現在被認為過於簡單,因為WGD在癌症的演變過程中既沒有必要,也不一定是一次性事件。相反,可以將WGD視為對不同基因有活性的許多突變類型之一不同癌症的癌症程度,塑造可能的軌跡和患者特定各種進展過程的風險。

本工作開發了提高我們解決CNA-能力的方法遵循多組數據集成策略,推動癌症的進化。Malicik等人展示了整合大容量和單細胞數據用於改進SNV進化模型,這是我們之前的策略也證明了CNA驅動的進化也很成功。在這裡,我們探索引入其他形式的數據的潛力,多相相流原位雜交(miFISH),提供了一種分析腫瘤的方法少量探針的單細胞進化純倍體成為純序列研究的一個挑戰。而miFISH限制每個細胞一個到幾個拷貝數標記,其易於擴展大量細胞使其成為CNV腫瘤系統發育的有力工具尤其是在將FISH探針策略性地放置在基因座上時在感興趣的腫瘤類型中反覆擴增。

在這裡,我們開發了一種將批量序列與單個細胞序列(SCS)和/或miFISH,以結合各自的優勢單拷貝數進化改進重建技術細胞水平。我們用半模擬數據顯示這兩種數據以獨特和協同的方式做出貢獻,以更準確地推斷CNA-驅動進化,尤其是在非整倍體腫瘤中,並證明了它們的實用性通過批量,SCS和miFISH分析膠質母細胞瘤的價值。一起,這項工作證明了將miFISH或相關方法用於如果要進行基於序列的腫瘤系統發育研究的細胞計數分析準確重建CNA驅動的癌症進化機制。

其中,我們選擇了一種目標函數:

「研究」通过测序和荧光原位杂交(FISH)数据评估肿瘤异质性

接下來我們選擇了幾種計算方法:

1.估算F(約束|| B − CP F || 1,約束F)

2.估算S(約束J(S,C,C0),系統發生成本)

3.估算C(約束C,約束 ||XTCP − H0||1)

4.估算P(約束P,約束 ||XTCP − H0||1)

5.膠質母細胞瘤數據

6.模擬數據

其中生成六個數據結構:

①~C:所有選定克隆的歸一化拷貝數圖譜的矩陣,使用組成大量腫瘤數據

②Ĉ:~C中主要克隆的歸一化拷貝數圖的矩陣,使用評估表現

③〜P:所有選定克隆的半倍性對角矩陣

④ˆP:主要克隆的半倍體的對角矩陣

⑤〜F:每個區域中所有選定克隆的混合級分的矩陣

⑥ˆF:每個區域中主要克隆的混合部分的矩陣

結果分為模擬數的評估和世紀GBM數據,前者分析了是否有倍數變化有倍性變化,後者如圖顯示 :

「研究」通过测序和荧光原位杂交(FISH)数据评估肿瘤异质性
「研究」通过测序和荧光原位杂交(FISH)数据评估肿瘤异质性

圖為在實際GBM07((a)-(c))和GBM33((d)-(f))情況下的應用。

(a)(d)推斷細胞成分C0到C5(底部)中每個染色體的拷貝數,軸表示染色體,1-22表示常染色體,23表示X染色體24代表Y染色體。(b)(e)每個推論的相應分數細胞成分。(c)(f)觀察到的細胞組成之間的系統發育關係-nents(粉紅色)和推斷的單元格成分(淺藍色)。

我們已經擴展了腫瘤系統發生方法,以結合拷貝數測量除大量和單細胞序列數據外,還可通過DNA-FISH進行檢測更精確地測量腫瘤倍性和克隆頻率的來源。結果表明,每種數據源分別有助於獲得更多的收益。結合所有這些因素,對癌症中拷貝數演變的準確描述三種數據類型提高了全基因組拷貝解析的準確性數字配置文件。我們通過對一對膠質母細胞瘤病例的應用證明新方法可以提供關於拷貝數進化作用的新穎見解單一癌症中的溶解。結果表明補充序列的價值數據與其他數據源(例如miFISH)一起準確重建CNA機制在腫瘤中表現出的染色體不穩定性。

這裡描述的工作為進一步研究提供了許多途徑。我們方法的侷限性在於,目前很少有腫瘤能被這裡討論的技術組合研究到。我們建議在序列與miFISH配對的情況下進行進一步研究,或者提供類似能力來估計倍性和/或克隆的替代方法頻率更準確,尤其是對於瞭解癌症的演變類型容易發生染色體不穩定和非整倍性。第二,目前的工作就像我們之前的工作一樣,表明了一種準確的單細胞系統發育模型在改善解卷積中的價值。準確重建進化論即使具有已知的單細胞數據,拷貝數空間中的樹仍然是一個挑戰煩人的問題。雖然有先驗的理論來重建拷貝數進化,沒有模型可用於CNA的所有機制我們瞭解的進化過程以及開發規模化的綜合模型能夠處理大型單細胞的全基因組數據仍然是一個挑戰。也有許多其他替代技術可能會納入多組學數據以改善系統發育推斷。在其他工作中,可能會為目前的問題。此外,可能還有改善的空間解決我們工作的核心優化問題。

參考文獻:Haoyun Lei,et al. Tumor heterogeneity assessed by sequencing and fluorescence in situ hybridization (FISH) data. BioRxiv. 29 Feb,2020.

「研究」通过测序和荧光原位杂交(FISH)数据评估肿瘤异质性

【北京大學】新冠肺炎兩大易感因素:肥胖和癌症,緣於ACE2表達量更高

【BioRxiv】新冠病毒的人工合成:僅憑基因片段便能復活完整病毒,還帶綠色熒光!

【Nature News】新冠疫情何時達峰?來自樂觀派與悲觀派的預測

【研究】新冠病毒起源之謎:人類製造or自然選擇?


分享到:


相關文章: