技能篇 | NCBI數據庫使用教程(一)

NCBI :National Center for Biotechnology Information

美國國家生物技術信息中心

俗話說,民以食為天,而科研則以數據為天。NCBI包含的各類數據庫無疑是科研數據積累的寶藏。今天,小編就用一文帶你走進NCBI數據庫。本篇文章分為兩個部分,第一部分:入門,初識NCBI數據庫;第二部分:技能,瞭解NCBI常見的5種使用方法。一起來看看吧!


Part 1:初 識 NCBI

官方網址:
https://www.ncbi.nlm.nih.gov/


NCBI 開發有 Genbank 等公共數據庫,提供 Pubmed 、BLAST 、Entrez 、OMIM 、 Taxonomy 等工具,可對國際分子數據庫和生物醫學文獻進行檢索和分析,並開發用於分析基因組數據和傳播生物醫學信息的軟件工具。

NCBI 還支持與推廣多種醫學及科技方面的數據庫,如:三維蛋白質結構的分子模型數據庫 ( MMDB) 、孟德爾人類遺傳( OMIM )等。


進入官方網址,可看到如下界面:

技能篇 | NCBI數據庫使用教程(一)

NCBI首頁

接下來,小編簡單介紹一下NCBI包含的部分數據庫,從而方便大家在構思研究思路時,能使用得當的數據庫進行查找相關數據。總體來說,可以分為六大類,如圖1、圖2所示:

技能篇 | NCBI數據庫使用教程(一)

圖1

技能篇 | NCBI數據庫使用教程(一)

圖2

具體介紹如下

技能篇 | NCBI數據庫使用教程(一)

文獻類

技能篇 | NCBI數據庫使用教程(一)

基因類


技能篇 | NCBI數據庫使用教程(一)

蛋白質類

技能篇 | NCBI數據庫使用教程(一)

基因組類

技能篇 | NCBI數據庫使用教程(一)

遺傳學

技能篇 | NCBI數據庫使用教程(一)

化學物質


Part2:NCBI的5種常見使用方法


一、查找基因序列、mRNA序列

進入NCBI 主頁,在 search 後面選擇 Gene,輸入需要查找的基因的名字,點擊search,查看結果。

以基因P53為例,搜索結果如圖:

技能篇 | NCBI數據庫使用教程(一)

點擊紅框部分,進入並下拉,可以看到大量的信息,如下圖:

技能篇 | NCBI數據庫使用教程(一)

技能篇 | NCBI數據庫使用教程(一)


二、用Probe查找已經公佈的引物序列


進入NCBI主頁,在下拉菜單選擇Probe之後填寫需要查找的基因名稱。

技能篇 | NCBI數據庫使用教程(一)

點擊search,出現下面界面:

技能篇 | NCBI數據庫使用教程(一)


點擊第一個鏈接,序列結果如下圖所示:

技能篇 | NCBI數據庫使用教程(一)


三、上傳數據到NCBI


NCBI對可提交的數據類型有詳細列表,不同類型的數據分別提交到不同的數據庫。

具體可查看:

http://www.ncbi.nlm.nih.gov/guide/howto/submit-sequence-data/

技能篇 | NCBI數據庫使用教程(一)

由於測序平臺應用在不同類型的項目長會有不同分析結果,所以分析數據的提交要根據測序項目類型來定。


1. 建立一個屬於自己的NCBI登錄賬戶,用以提交數據。

打開下方鏈接:

https://www.ncbi.nlm.nih.gov/account/

點擊圖中標註的“Register for a NCBI account”,進入到註冊頁面,如實填寫信息;

技能篇 | NCBI數據庫使用教程(一)


如何創建My NCBI賬戶,也可詳細見:

http://www.ncbi.nlm.nih.gov/books/NBK3842/#MyNCBI.Registering_with_My_NCBI


2. 為提交的數據申請BioProject和BioSample號。

一個BioProject代表一項測序研究項目,它可包含多次實驗(experiments):

Step1:打開
https://submit.ncbi.nlm.nih.gov/,點擊“BioProject”進入新建頁面;

Step2:點擊“New submission”,進行提交;

Step3:根據研究項目實際情況,填寫一系列信息,每填寫完一個步驟,都要點擊頁面下方的continue,保存已填寫的信息。點擊“submit”即可;


3. 在NCBI網站上登錄自己的賬戶,進入數據提交的Submit界面後,點擊相應的數據庫進行數據的提交。
https://submit.ncbi.nlm.nih.gov/)


四、如何用NCBI批量下載基因序列


1. 登入NCBI主界面,在下拉菜單裡選擇nucleotide,將基因的Accession number都排列在一起,用空格隔開,不要有回車符;

例如:NM_181571 NM_012319 NM_016651 NM_007678NM_004642 NM_145918 NM_024504 NM_014847 NM_004196 NM_002295:

技能篇 | NCBI數據庫使用教程(一)


填好後Search,然後會出現這樣一個界面:

技能篇 | NCBI數據庫使用教程(一)

2. 點擊上面的summary下拉標記,在Format選項中選擇FASTA;

技能篇 | NCBI數據庫使用教程(一)


點擊Apply,就會出現下一個界面:

技能篇 | NCBI數據庫使用教程(一)

3. 點擊右上角的Send下拉標記,選中CompleteRecord和File,然後在下面Format中選擇FASTA,Sort by不變(默認),最後點擊Create File保存數據即可;

技能篇 | NCBI數據庫使用教程(一)


五、如何用NCBI下載物種的全基因組序列


1. 打開NCBI,在下拉欄裡選擇Genome,之後輸入下載物種的拉丁名;

以擬南芥Arabidopsis thaliana為例:

搜索結果如下圖所示:

技能篇 | NCBI數據庫使用教程(一)


2. 點擊上圖的“GenomeAssembly and Annotation report”進入下面的界面:

技能篇 | NCBI數據庫使用教程(一)


一般來說,選擇level這一列中測序水平最高的一組就是黑色部分佔據面積最多的。


3. 點擊Assenbly這一列中的基因組編號,可進入全基因組下載界面;

技能篇 | NCBI數據庫使用教程(一)


4. 點擊該界面的右側,即可進行全基因組的下載;

技能篇 | NCBI數據庫使用教程(一)


參考資料

https://wenku.baidu.com/view/f86d817165ce0508763213df.html

https://www.cnblogs.com/yahengwang/p/9550410.html

https://mp.weixin.qq.com/s/7EPj0lJGz2gesnLK_k_oGg


分享到:


相關文章: