中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

GSEA軟件的使用方法是什么

GSEA軟件的使用方法是什么,針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

婁底網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、成都響應(yīng)式網(wǎng)站建設(shè)公司等網(wǎng)站項目制作,到程序開發(fā),運營維護。創(chuàng)新互聯(lián)從2013年成立到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)

Gene Set Enrichment Analysis是一種富集算法,由Broad Institute研究所的科學家提出,算法核心示意如下

GSEA軟件的使用方法是什么

需要兩個輸入元素,一個就是排序好的基因列表,這里的排序的規(guī)則是展現(xiàn)兩組間的差異,比如按照Foldchange的值進行排序,第二個就是基因的注釋集合,然后運行KS檢驗計算Enrichment Score(ES),用置換檢驗評估ES的可靠性。

Broad Institute研究所的科學家同時還提供對應(yīng)的分析軟件GSEA,該軟件是java語言開發(fā)的圖形界面軟件,簡單易用,下載地址如下

http://software.broadinstitute.org/gsea/downloads.jsp

官網(wǎng)提供了多種下載方式,推薦直接下載jar文件,示意圖如下

GSEA軟件的使用方法是什么

如下所示,運行GSEA分析,需要兩個基本元素,第一個就是表達譜數(shù)據(jù),可以是芯片數(shù)據(jù),也可以是rna-seq的定量結(jié)果,第二個就是基因集數(shù)據(jù)庫,官網(wǎng)對于human提供了MSigDB數(shù)據(jù)庫,當然你也可以自己定義基因集。

GSEA軟件的使用方法是什么

在實際操作時,第一步首先是導入數(shù)據(jù),有以下4種數(shù)據(jù)需要導入,由于在windows平臺操作,通過特定的后綴來識別文件格式

1. expression datasets

表達量文件,可以是芯片,也可以是rna-seq的定量結(jié)果,后綴為gct, 示意如下

GSEA軟件的使用方法是什么
該文件是\t分隔的純文本文件,第一行內(nèi)容總是為#1.2, 表示版本,第二行表示表達量矩陣的維度,第一個值對應(yīng)探針探針/基因個數(shù),第二個數(shù)值代表樣本個數(shù),第三行是表達量矩陣的表頭,前兩列固定是NAMEDescription, NAME是基因ID或者探針I(yè)D,必須保證唯一,Description表示描述信息,如果沒有,可以用na填充,后面每列對應(yīng)一個樣本。

2. phenotype labels

樣本的分組文件,后綴為cls, 示意如下

GSEA軟件的使用方法是什么
第一行為空格或者\t分隔的3個數(shù)值,第一個數(shù)值表示樣本總數(shù),第二個數(shù)值表示樣本對應(yīng)的分組數(shù)目,第三個數(shù)值總是1。

第二行以#開頭,指定不同分組的名字;第三行的每個字段代表一個樣本,順序和表達量文件中的樣本順序一致,只不過將樣本名用對應(yīng)的分組名字表示。

3. gene sets

基因集文件,有多種格式,常用的有gmtgmx, gmt示意如下

GSEA軟件的使用方法是什么

每一行代表一個基因集合,第一列為基因集合的名字,必須唯一,第二列為描述信息,如果沒有就用na填充,后面的列為該集合下的基因,每列之間用\t分隔。gmt格式示意如下

GSEA軟件的使用方法是什么

gmt相反,gmt中每一列代表一個基因集合,第一行為基因集合的名字,必須唯一,第二行為描述信息,如果沒有就用na填充,其他行為該集合下的基因。

4. chip  annotation

當提供了芯片數(shù)據(jù)時,可以導入chip類型的文件,該文件保存的是探針和基因之間的對應(yīng)關(guān)系,后綴為chip, 示意如下

GSEA軟件的使用方法是什么

第一列為探針I(yè)D, 表頭為Probe_Set_ID,第二列為探針對應(yīng)的基因,表頭為Gene Symbol, 第三列為探針描述信息,沒有就用na填充。

通過Load Data,首先將以上幾種文件導入軟件中,然后點擊Run GSEA菜單,選擇對應(yīng)的各種文件

GSEA軟件的使用方法是什么

phenotype labels用于指定組間比較的順序,明確哪一組作為control組。

上文中提到,GSEA需要兩個輸入元素,排序好的基因列表和基因集合,當導入表達量數(shù)據(jù)和分組信息后,GSEA會自動計算分組將的差異值,然后根據(jù)這個差異值對基因進行排序,支持的統(tǒng)計量有以下幾種,其中

1. signal2noise

GSEA軟件的使用方法是什么

2. t-Test

GSEA軟件的使用方法是什么

3. ratio_of_class

GSEA軟件的使用方法是什么

4. diff_of_class

GSEA軟件的使用方法是什么

5. log2_ratio_of_class

GSEA軟件的使用方法是什么
默認的算法為signal2noise, 可以在Basic fields中進行調(diào)整,這個參數(shù)可以在``示意如下

GSEA軟件的使用方法是什么

當所有參數(shù)都設(shè)置好之后,點擊下方的Run按鈕即可運行。

關(guān)于GSEA軟件的使用方法是什么問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。

網(wǎng)站名稱:GSEA軟件的使用方法是什么
本文URL:http://www.rwnh.cn/article20/jscejo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、商城網(wǎng)站、App開發(fā)網(wǎng)站維護、網(wǎng)站改版、微信小程序

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營
政和县| 宾阳县| 大竹县| 桐城市| 云浮市| 多伦县| 桦南县| 永宁县| 简阳市| 通江县| 广昌县| 淮北市| 高淳县| 宁阳县| 丹东市| 华安县| 韶关市| 讷河市| 阿巴嘎旗| 馆陶县| 红原县| 平阳县| 鹤峰县| 涿州市| 彰化市| 五指山市| 都兰县| 葵青区| 贡山| 都匀市| 克什克腾旗| 樟树市| 丰顺县| 方山县| 宕昌县| 且末县| 汉中市| 五华县| 丹棱县| 岳普湖县| 安宁市|