NCBI :National Center for Biotechnology Information
美國國家生物技術信息中心
俗話說,民以食為天,而科研則以數據為天。NCBI包含的各類數據庫無疑是科研數據積累的寶藏。今天,小編就用一文帶你走進NCBI數據庫。本篇文章分為兩個部分,第一部分:入門,初識NCBI數據庫;第二部分:技能,瞭解NCBI常見的5種使用方法。一起來看看吧!
Part 1:初 識 NCBI
官方網址:
https://www.ncbi.nlm.nih.gov/
NCBI 開發有 Genbank 等公共數據庫,提供 Pubmed 、BLAST 、Entrez 、OMIM 、 Taxonomy 等工具,可對國際分子數據庫和生物醫學文獻進行檢索和分析,並開發用於分析基因組數據和傳播生物醫學信息的軟件工具。
NCBI 還支持與推廣多種醫學及科技方面的數據庫,如:三維蛋白質結構的分子模型數據庫 ( MMDB) 、孟德爾人類遺傳( OMIM )等。
進入官方網址,可看到如下界面:
接下來,小編簡單介紹一下NCBI包含的部分數據庫,從而方便大家在構思研究思路時,能使用得當的數據庫進行查找相關數據。總體來說,可以分為六大類,如圖1、圖2所示:
具體介紹如下
Part2:NCBI的5種常見使用方法
一、查找基因序列、mRNA序列
進入NCBI 主頁,在 search 後面選擇 Gene,輸入需要查找的基因的名字,點擊search,查看結果。
以基因P53為例,搜索結果如圖:
點擊紅框部分,進入並下拉,可以看到大量的信息,如下圖:
二、用Probe查找已經公佈的引物序列
進入NCBI主頁,在下拉菜單選擇Probe之後填寫需要查找的基因名稱。
點擊search,出現下面界面:
點擊第一個鏈接,序列結果如下圖所示:
三、上傳數據到NCBI
NCBI對可提交的數據類型有詳細列表,不同類型的數據分別提交到不同的數據庫。
具體可查看:
http://www.ncbi.nlm.nih.gov/guide/howto/submit-sequence-data/
由於測序平臺應用在不同類型的項目長會有不同分析結果,所以分析數據的提交要根據測序項目類型來定。
1. 建立一個屬於自己的NCBI登錄賬戶,用以提交數據。
打開下方鏈接:
https://www.ncbi.nlm.nih.gov/account/
點擊圖中標註的“Register for a NCBI account”,進入到註冊頁面,如實填寫信息;
如何創建My NCBI賬戶,也可詳細見:
http://www.ncbi.nlm.nih.gov/books/NBK3842/#MyNCBI.Registering_with_My_NCBI
2. 為提交的數據申請BioProject和BioSample號。
一個BioProject代表一項測序研究項目,它可包含多次實驗(experiments):
Step1:打開
https://submit.ncbi.nlm.nih.gov/,點擊“BioProject”進入新建頁面;
Step2:點擊“New submission”,進行提交;
Step3:根據研究項目實際情況,填寫一系列信息,每填寫完一個步驟,都要點擊頁面下方的continue,保存已填寫的信息。點擊“submit”即可;
3. 在NCBI網站上登錄自己的賬戶,進入數據提交的Submit界面後,點擊相應的數據庫進行數據的提交。(
https://submit.ncbi.nlm.nih.gov/)
四、如何用NCBI批量下載基因序列
1. 登入NCBI主界面,在下拉菜單裡選擇nucleotide,將基因的Accession number都排列在一起,用空格隔開,不要有回車符;
例如:NM_181571 NM_012319 NM_016651 NM_007678NM_004642 NM_145918 NM_024504 NM_014847 NM_004196 NM_002295:
填好後Search,然後會出現這樣一個界面:
2. 點擊上面的summary下拉標記,在Format選項中選擇FASTA;
點擊Apply,就會出現下一個界面:
3. 點擊右上角的Send下拉標記,選中CompleteRecord和File,然後在下面Format中選擇FASTA,Sort by不變(默認),最後點擊Create File保存數據即可;
五、如何用NCBI下載物種的全基因組序列
1. 打開NCBI,在下拉欄裡選擇Genome,之後輸入下載物種的拉丁名;
以擬南芥Arabidopsis thaliana為例:
搜索結果如下圖所示:
2. 點擊上圖的“GenomeAssembly and Annotation report”進入下面的界面:
一般來說,選擇level這一列中測序水平最高的一組就是黑色部分佔據面積最多的。
3. 點擊Assenbly這一列中的基因組編號,可進入全基因組下載界面;
4. 點擊該界面的右側,即可進行全基因組的下載;
參考資料
https://wenku.baidu.com/view/f86d817165ce0508763213df.html
https://www.cnblogs.com/yahengwang/p/9550410.html
https://mp.weixin.qq.com/s/7EPj0lJGz2gesnLK_k_oGg