圖文/ 創源生物科技股份有限公司分子視算中心
<參考此篇文獻探討分析:Talman V, Teppo J, Pöhö P, et al. Molecular Atlas of Postnatal Mouse Heart Development. J Am Heart Assoc. 2018;7(20):e010378.>
在這次的Case study 當中,我們希望藉由整合multi-omics資料來探討不同層級的生物資訊,但我們應如何透過IPA整合串接來了解當中的生物故事,並建立能被實驗驗證的假說? 在這次的介紹當中我們會有很詳細的討論。
但首先,我們需要先了解這一次的研究主題:剛出生小鼠的心臟發生了什麼事?
在這篇文獻當中,作者指出小鼠在出生後七日前都上有心肌新生的能力,而他分別採第1、4、7、9及23天的小鼠心室細胞,並進一步分析得出轉錄體、蛋白質體及代謝體的分析資訊。希望透過IPA來找出調控心肌新生至關重要的調控者。
因此,在本次IPA的研究當中,以下為我們希望透過IPA得到的解答:
1.有哪些基因轉譯上的調控發生在剛出生小鼠的心臟發育?
2.哪些假說可以在實驗室中產生和被驗證?
3.哪些組織特異性的修飾差異是有趣的?
4.透過比對我們分析出超過六萬筆資料組,我們能得到哪些生物資訊?
5.有哪些被找出的基因是跟其他參與心臟發育基因有連結?
為了瞭解上述有趣的生物問題,我們以第一天的心肌細胞表現作為控制組,並將所有的分析結果上傳至IPA資料庫分析,以下是針對轉錄體於第4、9及23天的Pathway activity預測表現進行比較分析:
而比較分析(comparison analysis)可以用來了解不同時間點Pathway表現的變化。Heat map顏色是由Z-score來顯示,藍色方框表示抑制;而橘色方框則表示活化。方框上有點點則是Z-score沒有顯著差異。
我們可以發現在自4天至第23天的分析結果,Cell cycle相關的pathway逐漸被抑制,而Cholesterol synthesis也是在第9天後就開始被抑制; 但Cell cycle checkpoint等相關的pathway則是逐漸被活化。
另外與Energy metabolism相關的Pathway如氧化磷酸化路徑Oxidative Phosphorylation & TCA Cycle則是被活化,所以心肌細胞在第九天時會抑制cell cycle的發展並活化Oxidative Phosphorylation,目前這些結果都與我們已知在心肌新生的研究結果相符。
而針對Oxidative Phosphorylation的部份我們可以更詳盡的點開Pathway來展示每個基因的表現資訊。(紅色為表現量上升,綠色為表現量下降)
目前這張圖是第23天的表現,目前可以看到在ATP的生成有明顯的表現上升, 其氧化代謝的增加促進了活性氧的產生,從而誘導了DNA損傷反應,這被認為有助於心肌細胞週期的停滯。
而在蛋白質組的分析結果我們發現與轉錄組的結果大致相似, 在Pathway分析的部分可以看到Oxidative Phosphorylation、fatty acid Oxidation及ATP的生成都是提升的。而glycolysis(which is the main source of energy in the embryonic heart)則是被抑制,Ketone metabolism及BCAA degradation也是漸漸活化。這些都是提供能量的要素。所以在蛋白質體的分析當中我們發現小鼠的心肌細胞自glycolysis改以Oxidative Phosphorylation來獲得能量,並利用分解fatty acid & BCAA 來取得能量。
而在上游調控因子當中,我們一同來看在Transcriptomics、proteomics and metabolic於不同時間點的結果。
在這個結果當中我們看到相同的上游條控因子PPARGC1A/B於第23天都有被共同活化。
但PPARGC1A又有Target到那些Gene?
我們可以用IPA的My Pathway-Grow/ Overlay及function功能來生成這張圖, 我們可以找到與PPARGC1A有相互調控的基因,並套入我們分子調控的結果。最後連結到與分子網路相關的Disease & Function。在這張圖中我們可以展示轉錄組結果在第23天的心肌細胞當中Cardiogenesis表現預測下降, 而與能量應用有關的路徑則提升。所以我們可以了解在PPARGC1A這一個調控者在這些時間點可能會與這些代謝相關的路徑有重要的關聯性。
另外針對我們進一步去推論分子間的調控,IPA可以應用Causal Network Analysis來建立實驗室可驗證的假說。
在Causal Network Analysis我們可以找到Dataset最上游的調控者,以下圖於23天的轉錄組,我們可以發現在第4與23天,PTGER2 & PTGER1的預測表現逐漸下降。
我們將PTGER2 的Causal Network結果詳細展開來觀看,發現其被預測於第四天心肌表現被活化,並促進M phase & Mitosis的活化。更有趣的是PTGER2也會調控CCNA2,並會活化regeneration of heart:
那我們在第23天的PTGER2預測調控方式會是如何呢?
可以發現的其預測表現與第4天完全相反,是呈現被抑制的情形。且包含與細胞分化相關的細胞週期活化、Mitosis細胞分裂&Chromosome Segregation染色體分離都是被抑制的。
因此,為了驗證Causal Network Analysis所預測的調控表現,實驗室可進一步設計PTGER2相關表現實驗來驗證這個假說。
最後,在IPA當中還有另一種分子調控表現方式為regulator effect。在這個Network當中,IPA會將共同影響同一實驗分子群的上游條控因子及下游的Function來做串接。在第23天的代謝體分析當中,我們很驚喜的發現預測的上游條控因子ICMT會藉由影響圖中四個代謝體,而進一步活化氧氣的消耗及Oxidative Phosphorylation。
因此在IPA建立的路徑分析當中,我們可以藉由小鼠心肌的轉錄體學、蛋白質體學、代謝體學變化來產生能在實驗室中被驗證的假說。
另外在轉錄體學的部分,Isoform這一塊的分析也是值得我們提出來好好了解的,在IPA當中的Pathway分析主要都是以Gene Level為主,因此即使同一個基因下有多個Isoform表現,IPA也僅會考慮表現值最強的來做為代表數值。因此若希望在Transcript level底下看到每個實驗當中有偵測到的Isoform資訊,我們會需要使用到Isoprofiler這個功能來細看每個Isoform。
同樣在小鼠心肌的轉錄體學的分析底下,我們可以透過設定Isoform的條件如:表現量強度、是否有Protein coding、是否為principle Isoform以及是否參與心肌細胞分化來篩選感興趣的Isoform資訊。
而在這些條件的篩選底下,IsoProfiler找出了21個相關的基因,並在以下這四個基因ALDH1A2, BIRC5, CCNA2, E2F2當中發現隨著時間的增長,其Isoform表現自活化漸轉為抑制。
接著我們較詳細的來討論這四個基因當中的功能性:
1. ALDH1A2 在心臟上皮細胞發育中扮演重要角色,因此在心肌成熟後自然會抑制此基因。
2. BIRC5 在心臟發育中調控心肌細胞數量。如果過度表現此基因會促進細胞週期活化,而抑制表現的話會導致細胞週期被抑制。
3. 哺乳類心臟中的CCNA2在出生後會被抑制。他的持續性表現會強化心肌細胞分化並導致心臟肥大。
4. E2F2 會促進成年的心肌細胞分化,而成熟的心肌細胞則不需要再持續分化,因而其基因表現抑制。
因此這些表現結果目前我們預測的結果上是一致的。
最後在驗證假說的過程中,我們也可將分析結果與過去的分析資料進行比對,或是與OmicSoft及LINCs資料庫中已共享的分析數據相互比較,進而建立假說與全新的實驗見解。這個功能我們稱為分析匹配(Analysis Match),目前已收錄超過6萬多筆的外部實驗分析結果。這些結果是由OmicSoft Land資料庫所提供,當中包含轉錄體、蛋白質體、磷酸化資訊等。也整理來自SRA、GEO、ArrayExpress等資料庫。
在Analysis Match這個功能當中我們會自動去比對分析組當中,那些外部實驗組的資料結果會與我們的分析結果最相似、或有那些分析結果會是負相關?藉由這樣的資訊呈現,我們可以省下大量閱讀文獻的時間,直接在IPA Analysis Match頁面當中找到與您實驗最相關的分析資訊。
而在第23天的轉錄組學研究,我們可以透過篩選的方式找到一篇與我們實驗組結果相近的分析組如下:
在Analysis Match分析表示在小鼠心肌細胞第23天的狀態,竟然會與急性骨髓性白血病(Acute myeloid leukemia,AML)相似,到底是哪一部分的路徑調控導致IPA會將正常組織與白血病的細胞反應認為兩者相關性非常高呢?
我們進一步將兩者相同參與的分子及路徑Heatmap及metadata展開來看,我們發現這組實驗是CARM1 Knockdown 的分析結果。
而CARM1是一個參與胚胎發育及細胞分化重要的調控子,我們可以在GeneView Page當中了解非常詳細的CARM1資訊:
1.CARM1 全名 Co-activator-associated arginine methyltransferase 1。
2.CARM1 負責在組蛋白上H3R17, H3R26的Arginine 殘基上加上兩個不對稱甲基。
3.CARM1會調控細胞內的重要的途徑,例如 RNA 剪切及自噬作用。
4.在腫瘤中,CARM1過度表現與細胞增生、細胞分裂、降低存活率有關。
而我們詳細看這一份白血病CARM1 Knockdown研究(GSE 1038528)
在這篇研究當中特別提到 CARM1 在骨髓白血球新生扮演重要角色、但在紅血球生成中可有可無,因此他的實驗思路如下:
-
實驗設計:三株白血病細胞株中,將CARM1 抑制基因表現。
-
實驗結果:CARM1 基因抑制導致細胞週期失調、包含細胞凋亡、降低E2F2目標基因的表現。這與我們在第23天時發現細胞週期&E2F2的抑制是部分雷同的。
-
假說:CARM1 也有可能參與出生後小鼠心臟的調控。
因此我們回到Analysis Match的頁面,這次我們將Pathway、上游條控因子及影響的疾病及功能性分開來看:
我們發現在兩者的分析上有著驚人的相似性,包含先前提到的cell cycle、PTGER2以及E2F22的調控方式都是相同的。而在疾病及功能性的部分也可以發現Checkpoint Control 及DNA replication也都是被抑制的。
若我們進一步去探討這些上游條控因子使否也有共通的調控作用?我們可以利用IPA製作以下分子調控關係圖:
我們也發現這些上游調控子(轉錄因子)會在第23天會共同調控cell cycle progress並抑制其作用。
而CARM1 與轉錄調控子有關,我們也在第23天的研究結果發現其會抑制細胞分化。而在第4天的表現當中發現CARM1的活化會造成對cell cycle progress的啟動。
因此我們是否能建立一個假說,判定CARM1 再活化可能會讓細胞週期再次啟動,進而再啟動心肌細胞新生等行為產生?
在這次小鼠心臟的多體學分析的分析當中可以得出一些實驗結論與假說:
1.實驗得到一組潛在性的在心臟中參與代謝轉換的轉錄調控因子。
2.預測得到其中一個重要的調控子PTGER2 在第23天時會被抑制,而他的活化能啟動小鼠心臟中被抑制的細胞週期。
3.四個參與心臟發育的Isoform在小鼠心臟中會專一性的被抑制表現(ALDH1A2-201, BIRC5-201, CCNA2-201, E2F2-201)。
4.在小鼠心臟中與AML中偵測到同一個標記,這個標記確認了CARM1 在小鼠心臟細胞週期中扮演重要角色。
5.CARM1 跟參與心肌細胞功能、結構的基因(COX5B, FTX, LMNA, TUG1)有重要相關性。
藉由這一次的分析結果,我們可以透過IPA來整合multi-Omics的資訊,其結論如下:
1. 透過IPA找出背後負責調控的代謝體學路徑。
2. 提出能在實驗室中被驗證的假說。
3. 找出有組織顯著性的Isoform資訊以及他們的基因表現模式。
4. 比較分析結果與計算前資料組。
5. 將參與心臟發育調控的重要基因視覺化。
研究者們可以透過IPA可信的資料來源及分析演算法,整合不同細胞層級之分析數據,讓我們在完整的生物系統背景下識別新的目標基因或候選生物標記,並將結果進行全面性的比較,以建立全新的實驗假說及見解。
延伸閱讀:
IPA 資料庫使用須知
IPA與冠狀病毒的應用
Ingenuity Pathway Analysis (IPA) 資料庫介紹