生物数据库介绍——NCBI-飞外

NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相关工具、比对查看器、跟踪存档、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/人类蛋白质相互作用数据库、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有这些资源可以在NCBI主页找到。

DatabasesAssembly

一个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。


Computational Resources from NCBI's Structure Group

一个由对NCBI计算生物学分会(CBB)结构组开发的资源的访问和链接的集中页面。 这些资源包括帮助研究大分子结构,保守结构域和蛋白质分类,小分子及其生物活性,以及生物途径和系统的数据库和工具。


CDD是一种蛋白质注释资源,由一系列经过充分注释的古代结构域和全长蛋白质序列比对模型组成。


Database of Genomic Structural Variation (dbVar)

dbVar数据库储存了大规模基因组变异相关的信息,包括大插入,缺失,易位和倒位。 除了分类突变之外,dbVar还存储已定义突变与表型信息的关联。


Database of Genotypes and Phenotypes (dbGaP)

储存基因型和表型相互作用研究结果和描述的数据库,这些研究包括全基因组关联(GWAS)、医学重测序、分子诊断,以及基因型与非临床性状之间的关联。


NIH基因序列数据库,是所有公开可用DNA序列的注释集合。NCBI的GenBank数据库和日本DNA数据库(DDBJ),欧洲分子生物学实验室(EMBL)每天交换数据,保证数据实时跟新。 GenBank由几个部分组成,大部分序列可以通过Nucleotide数据库访问。 例外的是EST和GSS分区,分别通过Nucleotide EST和Nucleotide GSS数据库访问。


一个可搜索的基因数据库,专注于已经完全测序的基因组,并且有一个活跃的研究团体来提供基因特异性数据。基因信息包括命名法、染色体定位、基因产物及其属性(例如,蛋白质相互作用)、相关标记、表型、相互作用、引文链接、序列、突变详情、图谱、表达报告、同源物、蛋白结构域内容和外部数据库链接。


Gene Expression Omnibus (GEO) Database

公共功能基因组数据库,支持符合MIAME标准的数据提交。接受基于芯片和测序数据,并提供工具以帮助用户查询和实验数据并研究基因表达谱。


存储从Gene Expression Omnibus(GEO)数据库组装的基因表达和分子丰度数据集。数据集每个记录包含其他资源,包括集群工具和差异表达式查询。


Gene Expression Omnibus (GEO) Profiles

存储从Gene Expression Omnibus(GEO)数据库组装的单个基因表达和分子丰度配置文件。 基于基因注释或预先计算的轮廓特征搜索感兴趣的特定配置。


NCBI Bookshelf上专家撰写的同行评审疾病描述集,将基因检测应用于具有特定遗传病症的患者和家属的诊断,管理和遗传咨询。


基因测试和实验室记录,包括测量的详细信息,如测量和分析以及临床有效性。 GTR也是遗传条件信息的纽带,并提供与各种资源的特定背景相关的链接,包括实践指南,已发表的文献和遗传数据/信息。 GTR的最初范围包括孟德尔疾病的单基因测试,以及阵列,小组和药物遗传学测试。


包含来自1000多种生物的全基因组的序列和比对数据。 基因组代表完全测序的生物和正在进行测序的生物, 三个主要领域(细菌,古细菌和真核生物),以及许多病毒,噬菌体,类病毒,质粒和细胞器。


Genome Reference Consortium (GRC)

基因组参考联盟(GRC)负责人和小鼠参考基因组,成员包括华盛顿大学的基因组中心,Wellcome Trust Sanger研究所,欧洲生物信息学研究所(EBI)和国家生物技术信息中心(NCBI)。 GRC致力于纠正错误代表的位点并完善剩余的装配间隙。 此外,GRC寻求为复杂或结构变异的基因组位点提供替代组装。 在GRC网站(http://www.genomereference.org)上,公众可以查看目前正在审查的基因组区域,报告基因组相关问题并联系GRC。


HIV-1, Human Protein Interaction Database

已知HIV-1蛋白与人宿主蛋白相互作用的数据库。 它提供了已发表的蛋白质相互作用报告的注释书目,并附有相应PubMed记录和序列数据的链接。


描述在GenBank和RefSeq中注释的编码区中鉴定的蛋白质,以及SwissProt和PDB蛋白质序列的综合记录集合。 该资源允许研究人员获得更有针对性的搜索结果并快速识别感兴趣的蛋白质。


来自NIAID流感基因组测序项目和GenBank的数据集合,它提供了流感序列分析,注释和GenBank提交工具。 该资源还包含其他流感序列资源的链接,以及有关流感病毒的出版物和一般信息。


Journals in NCBI Databases

NLM目录数据库的子数据库,提供NCBI数据库记录中引用的期刊信息,包括PubMed摘要。支持期刊标题,MEDLINE或ISO缩写,ISSN或NLM目录ID搜索此数据库。


MeSH(医学主题词)是美国国家医学图书馆用于索引MEDLINE / PubMed文章的受控词汇表。 MeSH术语提供了一种一致的方法来检索可能对相同概念使用不同术语的信息。


NCBI C++工具包综合手册,包括其设计和开发框架,C++库参考,软件示例和演示,常见问题解答和发行说明。该手册可在线搜索,可以为一系列PDF文档。


作为NCBI手册的一部分,本词汇表包含NCBI工具和首字母缩写词,生物信息学术语和数据表示格式的描述。


有关NCBI数据库和软件的文章集合。,专为新手用户设计,每篇文章都提供了资源及其设计的一般概述,以及搜索和使用可用分析工具的提示。 所有文章都可以在线搜索并以PDF格式; 该手册可以通过NCBI Bookshelf访问。


通过NCBI Bookshelf访问,帮助手册包含许多NCBI资源的文档,包括PubMed,PubMed Central,Entrez系统,Gene,SNP和LinkOut。 所有章节均可以PDF格式。


一个关于收集和分析源自食品,环境和患者分离物的细菌病原体基因组序列的项目。 目前,自动化分析集群并识别主要由公共卫生实验室提供的序列,以协助调查食源性疾病爆发并发现潜在的食物污染源。


来自多个来源的核苷酸序列的集合,包括GenBank,RefSeq,,用户可以直接访问该站点进行全面显示。


来自比较研究的相关DNA序列的数据库:系统发育,种群,环境以及在较小程度上的突变。 数据库中的每个记录都是一组DNA序列。 例如,群体集提供有关生物体内遗传变异的信息,而系统发育集可以包含从几个相关生物获得的单个基因的序列及其比对。


用于各种生物医学研究应用的核酸试剂数据库,有关试剂比例、探针有效性和序列相似性等信息。


相关蛋白质序列(簇)的集合,由完整的原核和细胞器质粒和基因组编码的参考序列蛋白组成。 该数据库提供对注释信息,出版物,域,结构,外部链接和分析工具的轻松访问。


包含来自各种来源的蛋白质序列记录的数据库,包括GenPept,RefSeq,Swiss-Prot,PIR,PRF和PDB。


由沉积的生物活性数据和用于筛选PubChem物质数据库中包含的化学物质的生物活性测定的描述组成,包括筛选程序特有的条件和读数(生物活性水平)的描述。


包含可以使用名称,同义词或关键词搜索的,经过验证的唯一化学结构(小分子)。 如果不同的研究者提供相同的结构,则复合记录可以链接到多个PubChem物质记录。 这些化合物记录反映了用于描述PubChem物质中物质的经过验证的化学描述信息。


PubChem物质记录包含提交人提交给PubChem的物质信息,这包括提交的任何化学结构信息,以及化学名称,评论和提交人网站的链接。


RefSeqGene人类基因特异性参考基因组序列的集合。Reference Sequence (RefSeq)

由NCBI产生的主持的,非冗余的基因组DNA,转录物(RNA)和蛋白质序列的集合。


SARS冠状病毒(CoV)的数据摘要,包括与最新序列数据和出版物的链接,与其他SARS相关资源的链接,以及来自各种分离株的基因组序列的预先计算的比对。


Sequence Read Archive (SRA)

序列读取存档(SRA)存储来自下一代测序平台的测序数据,包括Roche 454GSSystem®,Illumina GenomeAnalyzer®,Life Technologies ABSOLiDSystem®,HelicosBiosciencesHeliscope®,CompleteGenomics®和PacificBiosciencesSMRT®


用于各种大规模测序项目的单次读取的DNA序列色谱图(迹线),碱基调用和质量估计的存储库。


广泛的资源,包括病毒生物学的简述、Entrez Genome中病毒基因组序列的链接,以及有关病毒参考序列的信息、数千个病毒基因组的参考序列的集合。


将流感病毒资源扩展到其他生物体,提供所选病毒序列集的界面,分析工具,包括病毒特异性BLAST页面和基因组注释管道。


一个交互式图形查看器,允许用户研究由 1000 Genomes Project 生成的突变、基因型和支持证据(例如,比对的序列read数)。


该工具允许用户通过比较它们的结构和化学性质,预测由突变引起的蛋白质序列变化,查看常见的取代,以及浏览保守结构域中给定残基的功能来探索氨基酸的特征。


Assembly Archive

将跟踪存档中找到的原始序列信息与公开可用的序列存储库(GenBank / EMBL / DDBJ)中的装配信息相链接。 Assembly Viewer允许用户查看多序列比对以及实际序列色谱图。


BLAST Tutorials and Guides此页面链接到许多与BLAST相关的教程和指南,包括BLAST算法的选择指南,BLAST输出格式的说明,独立BLAST参数的说明,在本地机器上设置独立BLAST的说明以及 使用BLAST URL API。 Basic Local Alignment Search Tool (BLAST)

找到生物序列之间的局部相似性区域,该程序将核苷酸或蛋白质序列与序列数据库进行比较,并计算匹配的统计显着性。 BLAST可用于推断序列之间的功能和进化关系,以及帮助鉴定基因家族的成员。


允许你提交Nucleotide、Protein或其他Entrez数据库中的GI、登录号或其他唯一标识符的文件,从许多Entrez数据库中检索记录。


一个用于分类蛋白质序列和调查其进化关系的应用程序。 CDTree可以导入,分析和更新现有的保守域(CDD)记录和层次结构,还允许用户创建自己的记录和层次结构。 CDTree与Entrez CDD和Cn3D紧密集成,允许用户创建和更新蛋白质域对齐。


COBALT是一种蛋白质多序列比对工具,使用RPS-BLAST,BLASTP和PHI-BLAST找到从保守结构域数据库,蛋白质基序数据库和序列相似性衍生的成对约束的集合。


作为NCBI Bookshelf的一部分,Coffee Break结合了近期生物医学发现的报告和NCBI工具的使用。 每份报告都包含互动教程,展示NCBI生物信息学工具如何用作研究过程的一部分。


显示构成给定蛋白质序列的功能域。 它列出了具有相似结构域结构的蛋白质,并且可以检索含有特定结构域组合的蛋白质。


允许用户使用在线表单构建E-utility分析流程,然后生成Perl脚本以执行分析流程的工具。


用于将查询序列(核苷酸或蛋白质)与包含在GEO数据库中的微阵列或SAGE平台上的GenBank序列对齐的工具。


该工具将核苷酸或蛋白质序列与基因组序列数据库进行比较,并使用基本局部比对搜索工具(BLAST)算法计算匹配的统计显着性。


用于真核RefSeq基因组装配的交互式导航的基因组浏览器,其具有对基因,表达,变异和其他注释的全面检查。


Genome Remapping Service

NCBI的重映射工具允许用户映射注释数据并将特征的位置从一个基因组版本转换为另一个,或通过碱基分析将RefSeqGene序列转换为RefSeqGene序列。


一种允许面简化了临床研究类别的搜索,查找系统评价和搜索医学遗传学文献。


PubMed搜索和链接的一系列Web和Flash教程,使用MeSH和其他PubMed服务在MyNCBI中保存搜索。


相关结构工具允许用户从分子建模数据库(MMDB)中查找与查询蛋白质序列相似的3D结构。


有多种工具可用于搜索SNP数据库,允许使用BLAST通过基因型,方法,群体,提交者,标记和序列相似性进行搜索。


为选定的一组生物生成分类树。 用户可以上传分类标识或名称的文件,也可以直接输入名称或ID。


用于创建和显示系统发育树数据的工具。 Tree Viewer可以分析您自己的序列数据,将可打印的矢量图像生成为PDF,并且可以嵌入到网页中。


用于搜索和查看dbSNP,dbVar和ClinVar数据库中列出的基因组变异的基因组浏览器。 VecScreen

一种用于快速鉴定可能是载体来源的核酸序列区段的系统。