大家好,今天我們要講的是,
從我們昨天得到的基因表達矩陣裡,提取單基因的表達資料
,
注意我們下載的資料都是經過校正好的的資料。具體大家可以去看一下,第一節
TCGA
資料庫資料的下載的推文,裡面講的比較詳細!
生信預熱第一談:如何在TCGA資料庫下載你想要的資料?
下面我們來看一下這個基因表達矩陣,
注意:如果一個基因出現多行,要對它進行多行取均值的一個操作。
所以接下來,我們要做兩步:第一步是先對單個基因多行取均值的操作,第二步是把我們需要的基因提取出來,就可以了。這兩步的執行需要用到一個指令碼檔案,這個指令碼檔案如圖所示:
這個指令碼檔案需要用
R
語言進行執行,所以我們要講解一下,
R
語言的安裝,如圖所示,直接搜尋,按照步驟,點選安裝就可以了。
這時,我們還需要準備一個輸入檔案:
symbol。txt,
就是我們得到的基因表達矩陣。這個檔案在上次推文中的。如圖所示:
除此之外,指令碼執行過程中,還需要一個包:
limma
包,直接搜尋
limma biocuductor
,點選進入,複製黏貼這三行安裝命令到
R
軟體中,就可以進行安裝了。
如圖所示:
指令碼檔案的解析
如圖所示:
最後是指令碼執行,開啟指令碼,
ctrl
加
a
和
ctrl
加
c,
複製到
R
,就可以開始執行指令碼了。最後執行得到一個檔案。
如圖所示:
如果大家需要練習的指令碼檔案,可以在後臺留言,我們發給您,如果有什麼疑問也可以在後臺留言,我們看到的話,會及時回覆的。如果覺得本文對你們有用的話,歡迎點贊,關注和分享。謝謝大家。