生物分子数据库
❶ 分子数据库的介绍
分子数据库生物信息学涉及的数据库可大致分为二种:初级数据库和二级数据库。初级 数据库贮存原始的生物数据,如 DNA 序列,由晶体衍射(Crystallography)获得 的蛋白质
❷ 什么是生物信息学中的二级数据库
根据需要从一级数据库中搜集对象的相关数据集合而成的就是二级数据库。
像genebank,EMBL这种都是不加选专择的一级数据库,属只要是实验获得的,不管什么东西的序列,哪怕是不完整的序列都能上传,而且它们的数据也有可能有重复。如果有某个人专门研究细菌的鉴定,需要用到正式被认可的16srDNA序列,为了研究方便,把这些一级数据库的各个种类细菌的公认标准16srDNA序列的数据进行整理,重新构建了一个数据库,这就是所谓的二级数据库。如果不构建,直接用一级数据库做blast,就会得出很多未被承认甚至不完整的序列,还要人工一个个看过去,找出公认的标准序列,这样就很麻烦。我举得例子在现实中就是韩国的EzTaxon。
❸ 生物学数据库都有哪些
分子生物学数据库大全:核酸数据库、基因表达数据库、蛋白数据库版、糖数据库、专利数权据库等国际顶尖数据库列表可以在生物帮那里找到的,我一般找资料,最新资讯都是到那里的,他们比较专业,权威,也比较全面,技术文档,视频,产品都蛮丰富的。年来大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理的服务。
❹ 如果我想去NCBI数据库中查生物分子相互作用和基因通路信息,我该怎么做
佳学基因做得不错,他们的疾病病理分析分析处理大量基因通路信息。
❺ 分子生物信息数据库的分子生物信息数据库分类
基因组数据库来自基因组作图,序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定。这些数据库是分子生物信息学的基本数据资源,通常称为基本数据库,初始数据库,也称一次数据库。根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的二次数据库,是数据库开发的有效途径。近年来,世界各国的生物学家和计算机科学家合作,已经开发了几百个二次数据库和复合数据库,也称专门数据库、专业数据库、专用数据库。
❻ 分子生物学数据库大全哪里有哪位知道神经生物学方面的论坛有哪些
分子生物学数据库大全:核酸数据库、基因表达数据库、蛋白数据库、糖回数据库、专利答数据库等国际顶尖数据库列表可以在生物帮那里找到的,我一般找资料,最新资讯都是到那里的,他们比较专业,权威,也比较全面,技术文档,视频,产品都蛮丰富的。 你最好找时间自己去了解一下啊( TIME. www.bio1000.com/ )在那里搜一下,就可以找到分子生物学数据库大全的介绍了。
❼ 生物信息学演绎数据库有哪些
一、名词解释:
1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用
计算机技术,研究生物学数据的科学。
2、相似性(similarity):两个序列(核酸、蛋白质)间的相关性。
3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。
4、同一性(identity):两个序列(核酸、蛋白质)间未发生变异序列的关系。
5、序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源性
,而将它们按照一定的规律排列。
6、生物数据库检索(database query,数据库查询):对序列、结构以及各种二
次数据库中的注释信息进行关键词匹配查找。
7、生物数据库搜索(database search):通过特定序列相似性比对算法,找出核
酸或蛋白质序列数据库中与待检序列具有一定程度相似性的序列。
二、简答题:
1、分子生物学的三大核心数据库是什么?它们各有何特点?
GenBank核酸序列数据库;SWISS-PROT蛋白质序列数据库;PDB生物大分子结构数
据库;
2、简述生物信息学的发生和发展。
20世纪50年代,生物信息学开始孕育;
20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来;
20世纪70年代,生物信息学的真正开端;
20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析
方法;
20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库;
20世纪90年代后,HGP促进生物信息学的迅速发展。
3、生物信息学的主要方法和技术是什么?
数学统计方法 ;动态规划方法 ;机器学习与模式识别技术;数据库技术及数据
挖掘 ;人工神经网络技术;专家系统;分子模型化技术;量子力学和分子力学
计算;生物分子的计算机模拟;因特网(Internet)技术
4、常见的DNA测序方法有哪些?各有何技术特点和优缺点?
Maxam-Gilbert DNA化学降解法:优点:可测完全未知序列及CG富含区;缺点:操
作繁琐;
Sanger双脱氧链终止法:优点:简便,可测较长片段;缺点:需已知部分序列或
加接头;
焦磷酸测序:优点:廉价、高通量;缺点:一次测序片段短。
5、分子生物学数据库有哪些类型?各有何特点?
基因组数据库:基因组测序
核酸序列数据库:核酸序列测定
一次数据库:蛋白质序列数据库:蛋白质序列测定。生物大分子(蛋白质)三维结
构数据库:X-衍射和核磁共振
特点:数量少,容量大,更新快
二次数据库:上述四类数据库和文献资料为基础构建
特点:数量多,容量小,更新慢
6、简述NCBI Entrez系统的功能。
高级检索系统;查找核酸、蛋白、文献、结构、基因组序列、大分子三维结构、
突变数据、探针序列、单核苷酸多态性等数据。
7、简述NCBI BLAST的功能和种类。
序列相似性比对工具;
对核酸:普通blastn,对高度相似序列megablast;
对蛋白质:普通blastp,对保守域rpsblast;
对人工翻译序列:核酸翻译序列对蛋白质序列blastx,蛋白质对翻译序列tblastn
,核酸翻译序列对翻译序列tblastx;
其它:基因组blast,基因表达序列搜索GEO blast,序列两两比对……
8、举例说明生物信息学软件的应用。
9、生物芯片制作和分析过程中可以应用哪些生物信息学软件。
三、论述题:
1、什么是生物信息学?生物信息学有哪些主要应用领域?
生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研
究生物学数据的科学。
生物分子数据的收集与管理;数据库搜索及序列比较;基因组序列分析;基因表
达数据的分析与处理;蛋白质结构预测。
2、生物信息学在医药领域有什么应用?
辅助诊断(遗传病,HLA分型);
研究药物作用机制,辅助新药物开发和制造。
3、人类基因组计划中主要使用的那些生物信息学手段?它们对人类基因组计划发
挥了哪些重大作用?
单一测序结果判读;contig和chromosome拼接;识别基因区及其调控区;寻找基
因相互作用的时空关系;
4、试述蛋白质二级结构预测的主要策略和方法。
策略:
目标:判断每一段中心的残基是否处于a螺旋、b折叠、b转角(或其它状态)之一
的二级结构态,即三态。
a、理论分析法(从头计算法):通过理论计算(分子力学、分子动力学等)进行
结构预测。优点:不需要经验数据,由一级结构推测高级结构
缺点:天然和未折叠蛋白间能级差很小 (kcal/mol);蛋白质可能的构想空间庞大
,针对蛋白质折叠的计算量巨大;计算模型中力场参数不准确。
b、统计方法:对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,
进而根据映射模型对未知结构的蛋白质直接从氨基酸预测结构。
经验性方法:根据一定序列形成一定结构的倾向进行结构预测。通过对已知结构
的蛋白质进行统计分析,发现各种氨基酸形成不同二级结构的倾向,从而形成一
系列关于二级结构预测的规律。
结构规律提取方法:从蛋白质结构数据库中提取关于蛋白质结构形成的一般性
规律,指导建立未知结构的蛋白质模型。
同源模型化方法:通过同源序列分析或模式匹配,预测蛋白质的空间结构或结
构单元。
方法:
1、Chou-Fasman方法;(基于单个氨基酸残基统计的经验参数方法,由Chou 和
Fasman在20世纪70年代提出来。通过统计分析,获得每个残基出现于特定二级结
构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。)2、
GOR方法;(是一种基于信息论和贝叶斯统计学的方法GOR将蛋白质序列当作一连
串的信息值来处理;GOR方法不仅考虑被预测位置本身氨基酸残基种类的影响,而
且考虑相邻残基种类对该位置构象的影响)3、基于氨基酸疏水性的方法;4、最
邻近方法;5、人工神经网络方法;6、综合方法:7、利用进化信息预测蛋白质的
❽ 怎样从生物大分子数据库PDB批量下载pdb文件
点击download selected 后,应该是又出来一个网页,分成三部分:Structure Download,FASTA File Download,RCSB PDB File Download Services。你是你是想下内载structure,你可以在Download Type处,选择PDB Format 就行容了,然后再下载。
不知道对你有没有帮助。