生物分子資料庫
❶ 分子資料庫的介紹
分子資料庫生物信息學涉及的資料庫可大致分為二種:初級資料庫和二級資料庫。初級 資料庫貯存原始的生物數據,如 DNA 序列,由晶體衍射(Crystallography)獲得 的蛋白質
❷ 什麼是生物信息學中的二級資料庫
根據需要從一級資料庫中搜集對象的相關數據集合而成的就是二級資料庫。
像genebank,EMBL這種都是不加選專擇的一級資料庫,屬只要是實驗獲得的,不管什麼東西的序列,哪怕是不完整的序列都能上傳,而且它們的數據也有可能有重復。如果有某個人專門研究細菌的鑒定,需要用到正式被認可的16srDNA序列,為了研究方便,把這些一級資料庫的各個種類細菌的公認標准16srDNA序列的數據進行整理,重新構建了一個資料庫,這就是所謂的二級資料庫。如果不構建,直接用一級資料庫做blast,就會得出很多未被承認甚至不完整的序列,還要人工一個個看過去,找出公認的標准序列,這樣就很麻煩。我舉得例子在現實中就是韓國的EzTaxon。
❸ 生物學資料庫都有哪些
分子生物學資料庫大全:核酸資料庫、基因表達資料庫、蛋白資料庫版、糖資料庫、專利數權據庫等國際頂尖資料庫列表可以在生物幫那裡找到的,我一般找資料,最新資訊都是到那裡的,他們比較專業,權威,也比較全面,技術文檔,視頻,產品都蠻豐富的。年來大量生物學實驗的數據積累,形成了當前數以百計的生物信息資料庫。它們各自按一定的目標收集和整理生物學實驗數據,並提供相關的數據查詢、數據處理的服務。
❹ 如果我想去NCBI資料庫中查生物分子相互作用和基因通路信息,我該怎麼做
佳學基因做得不錯,他們的疾病病理分析分析處理大量基因通路信息。
❺ 分子生物信息資料庫的分子生物信息資料庫分類
基因組資料庫來自基因組作圖,序列資料庫來自序列測定,結構資料庫來自X-衍射和核磁共振結構測定。這些資料庫是分子生物信息學的基本數據資源,通常稱為基本資料庫,初始資料庫,也稱一次資料庫。根據生命科學不同研究領域的實際需要,對基因組圖譜、核酸和蛋白質序列、蛋白質結構以及文獻等數據進行分析、整理、歸納、注釋,構建具有特殊生物學意義和專門用途的二次資料庫,是資料庫開發的有效途徑。近年來,世界各國的生物學家和計算機科學家合作,已經開發了幾百個二次資料庫和復合資料庫,也稱專門資料庫、專業資料庫、專用資料庫。
❻ 分子生物學資料庫大全哪裡有哪位知道神經生物學方面的論壇有哪些
分子生物學資料庫大全:核酸資料庫、基因表達資料庫、蛋白資料庫、糖回資料庫、專利答資料庫等國際頂尖資料庫列表可以在生物幫那裡找到的,我一般找資料,最新資訊都是到那裡的,他們比較專業,權威,也比較全面,技術文檔,視頻,產品都蠻豐富的。 你最好找時間自己去了解一下啊( TIME. www.bio1000.com/ )在那裡搜一下,就可以找到分子生物學資料庫大全的介紹了。
❼ 生物信息學演繹資料庫有哪些
一、名詞解釋:
1、生物信息學:生物分子信息的獲取、存貯、分析和利用;以數學為基礎,應用
計算機技術,研究生物學數據的科學。
2、相似性(similarity):兩個序列(核酸、蛋白質)間的相關性。
3、同源性(homology):生物進化過程中源於同一祖先的分支之間的關系。
4、同一性(identity):兩個序列(核酸、蛋白質)間未發生變異序列的關系。
5、序列比對(alignment):為確定兩個或多個序列之間的相似性以至於同源性
,而將它們按照一定的規律排列。
6、生物資料庫檢索(database query,資料庫查詢):對序列、結構以及各種二
次資料庫中的注釋信息進行關鍵詞匹配查找。
7、生物資料庫搜索(database search):通過特定序列相似性比對演算法,找出核
酸或蛋白質序列資料庫中與待檢序列具有一定程度相似性的序列。
二、簡答題:
1、分子生物學的三大核心資料庫是什麼?它們各有何特點?
GenBank核酸序列資料庫;SWISS-PROT蛋白質序列資料庫;PDB生物大分子結構數
據庫;
2、簡述生物信息學的發生和發展。
20世紀50年代,生物信息學開始孕育;
20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯系起來;
20世紀70年代,生物信息學的真正開端;
20世紀70年代到80年代初期,出現了一系列著名的序列比較方法和生物信息分析
方法;
20世紀80年代以後,出現一批生物信息服務機構和生物信息資料庫;
20世紀90年代後,HGP促進生物信息學的迅速發展。
3、生物信息學的主要方法和技術是什麼?
數學統計方法 ;動態規劃方法 ;機器學習與模式識別技術;資料庫技術及數據
挖掘 ;人工神經網路技術;專家系統;分子模型化技術;量子力學和分子力學
計算;生物分子的計算機模擬;網際網路(Internet)技術
4、常見的DNA測序方法有哪些?各有何技術特點和優缺點?
Maxam-Gilbert DNA化學降解法:優點:可測完全未知序列及CG富含區;缺點:操
作繁瑣;
Sanger雙脫氧鏈終止法:優點:簡便,可測較長片段;缺點:需已知部分序列或
加接頭;
焦磷酸測序:優點:廉價、高通量;缺點:一次測序片段短。
5、分子生物學資料庫有哪些類型?各有何特點?
基因組資料庫:基因組測序
核酸序列資料庫:核酸序列測定
一次資料庫:蛋白質序列資料庫:蛋白質序列測定。生物大分子(蛋白質)三維結
構資料庫:X-衍射和核磁共振
特點:數量少,容量大,更新快
二次資料庫:上述四類資料庫和文獻資料為基礎構建
特點:數量多,容量小,更新慢
6、簡述NCBI Entrez系統的功能。
高級檢索系統;查找核酸、蛋白、文獻、結構、基因組序列、大分子三維結構、
突變數據、探針序列、單核苷酸多態性等數據。
7、簡述NCBI BLAST的功能和種類。
序列相似性比對工具;
對核酸:普通blastn,對高度相似序列megablast;
對蛋白質:普通blastp,對保守域rpsblast;
對人工翻譯序列:核酸翻譯序列對蛋白質序列blastx,蛋白質對翻譯序列tblastn
,核酸翻譯序列對翻譯序列tblastx;
其它:基因組blast,基因表達序列搜索GEO blast,序列兩兩比對……
8、舉例說明生物信息學軟體的應用。
9、生物晶元製作和分析過程中可以應用哪些生物信息學軟體。
三、論述題:
1、什麼是生物信息學?生物信息學有哪些主要應用領域?
生物分子信息的獲取、存貯、分析和利用;以數學為基礎,應用計算機技術,研
究生物學數據的科學。
生物分子數據的收集與管理;資料庫搜索及序列比較;基因組序列分析;基因表
達數據的分析與處理;蛋白質結構預測。
2、生物信息學在醫葯領域有什麼應用?
輔助診斷(遺傳病,HLA分型);
研究葯物作用機制,輔助新葯物開發和製造。
3、人類基因組計劃中主要使用的那些生物信息學手段?它們對人類基因組計劃發
揮了哪些重大作用?
單一測序結果判讀;contig和chromosome拼接;識別基因區及其調控區;尋找基
因相互作用的時空關系;
4、試述蛋白質二級結構預測的主要策略和方法。
策略:
目標:判斷每一段中心的殘基是否處於a螺旋、b折疊、b轉角(或其它狀態)之一
的二級結構態,即三態。
a、理論分析法(從頭計演算法):通過理論計算(分子力學、分子動力學等)進行
結構預測。優點:不需要經驗數據,由一級結構推測高級結構
缺點:天然和未折疊蛋白間能級差很小 (kcal/mol);蛋白質可能的構想空間龐大
,針對蛋白質折疊的計算量巨大;計算模型中力場參數不準確。
b、統計方法:對已知結構的蛋白質進行統計分析,建立序列到結構的映射模型,
進而根據映射模型對未知結構的蛋白質直接從氨基酸預測結構。
經驗性方法:根據一定序列形成一定結構的傾向進行結構預測。通過對已知結構
的蛋白質進行統計分析,發現各種氨基酸形成不同二級結構的傾向,從而形成一
系列關於二級結構預測的規律。
結構規律提取方法:從蛋白質結構資料庫中提取關於蛋白質結構形成的一般性
規律,指導建立未知結構的蛋白質模型。
同源模型化方法:通過同源序列分析或模式匹配,預測蛋白質的空間結構或結
構單元。
方法:
1、Chou-Fasman方法;(基於單個氨基酸殘基統計的經驗參數方法,由Chou 和
Fasman在20世紀70年代提出來。通過統計分析,獲得每個殘基出現於特定二級結
構構象的傾向性因子,進而利用這些傾向性因子預測蛋白質的二級結構。)2、
GOR方法;(是一種基於資訊理論和貝葉斯統計學的方法GOR將蛋白質序列當作一連
串的信息值來處理;GOR方法不僅考慮被預測位置本身氨基酸殘基種類的影響,而
且考慮相鄰殘基種類對該位置構象的影響)3、基於氨基酸疏水性的方法;4、最
鄰近方法;5、人工神經網路方法;6、綜合方法:7、利用進化信息預測蛋白質的
❽ 怎樣從生物大分子資料庫PDB批量下載pdb文件
點擊download selected 後,應該是又出來一個網頁,分成三部分:Structure Download,FASTA File Download,RCSB PDB File Download Services。你是你是想下內載structure,你可以在Download Type處,選擇PDB Format 就行容了,然後再下載。
不知道對你有沒有幫助。