單基因表達資料的提取

大家好,今天我們要講的是,

從我們昨天得到的基因表達矩陣裡,提取單基因的表達資料

注意我們下載的資料都是經過校正好的的資料。具體大家可以去看一下,第一節

TCGA

資料庫資料的下載的推文,裡面講的比較詳細!

生信預熱第一談:如何在TCGA資料庫下載你想要的資料?

下面我們來看一下這個基因表達矩陣,

注意:如果一個基因出現多行,要對它進行多行取均值的一個操作。

單基因表達資料的提取

所以接下來,我們要做兩步:第一步是先對單個基因多行取均值的操作,第二步是把我們需要的基因提取出來,就可以了。這兩步的執行需要用到一個指令碼檔案,這個指令碼檔案如圖所示:

單基因表達資料的提取

這個指令碼檔案需要用

R

語言進行執行,所以我們要講解一下,

R

語言的安裝,如圖所示,直接搜尋,按照步驟,點選安裝就可以了。

單基因表達資料的提取

單基因表達資料的提取

這時,我們還需要準備一個輸入檔案:

symbol。txt,

就是我們得到的基因表達矩陣。這個檔案在上次推文中的。如圖所示:

除此之外,指令碼執行過程中,還需要一個包:

limma

包,直接搜尋

limma biocuductor

,點選進入,複製黏貼這三行安裝命令到

R

軟體中,就可以進行安裝了。

如圖所示:

單基因表達資料的提取

指令碼檔案的解析

如圖所示:

單基因表達資料的提取

單基因表達資料的提取

最後是指令碼執行,開啟指令碼,

ctrl

a

ctrl

c,

複製到

R

,就可以開始執行指令碼了。最後執行得到一個檔案。

如圖所示:

如果大家需要練習的指令碼檔案,可以在後臺留言,我們發給您,如果有什麼疑問也可以在後臺留言,我們看到的話,會及時回覆的。如果覺得本文對你們有用的話,歡迎點贊,關注和分享。謝謝大家。

TAG: 指令碼如圖所示基因檔案我們