基因是遗传的基本单位,是包含合成多肽(蛋白质)所有信息的DNA片段。蛋白质的合成、折叠、及三级四级结构最终决定了机体的主要结构和功能。
结构
人类有大约20 000到23 000个基因。存在于细胞核内的染色体和线粒体中。人体正常的体细胞(非生殖细胞),有46条染色体,分为23对。每对染色体中,一条来自父亲,一条来自母亲。22对常染色体通常是同源的(即染色体的大小、形状和基因的位置、数目一样)。第23对性染色体(X和Y),决定人的性别,同时包含其他功能基因。女性在每个体细胞核中有两条X染色体(同源),男性则有一条X染色体和一条Y染色体(异源染色体)。
X染色体携带着许多决定遗传性状的基因,而小的Y染色体则携带着启动男性性别分化的基因及其他少部分基因。由于X染色体含有的基因比Y染色体多,男性的许多X染色体基因是不配对的;为了保持男女之间遗传物质的平衡,女性的一条X染色体被随机灭活。核型:一个人细胞中的全套染色体组成。
生殖细胞(卵和精原细胞)进行减数分裂时,染色体数目减为23,是体细胞中数目的一半。减数分裂期来自于父亲和母亲的遗传信息可通过同源染色体之间交换进行重组。当卵子和精子结合时,染色体数又恢复至正常的46条。
基因在染色体的DNA分子中呈线状排列。每一个基因在染色体上有其特定的位置(位点),在同源染色体上,基因的位点是一致的。在同一对的两条染色体上占据两个等同位点的基因(一个来自父亲,另—个来自母亲)称为等位基因。每个基因由特定的序列构成。两个等位基因可有相同的或略有不同的核苷酸序列。某个基因的两个等位基因相同,是纯合子;两个等位基因不同,则为杂合子。某些基因发生在可能彼此相邻或在同一或不同染色体的不同位置上的多拷贝。
基因功能
基因由DNA组成。基因的长度取决于该基因编码蛋白质的长度。DNA是核苷酸(碱基)互补配对的双螺旋结构。
DNA通过转录合成蛋白,DNA的一条链作为模板合成信使RNA(mRNA)。除了尿嘧啶(U)由胸腺嘧啶(T)替代而外,RNA和DNA有着相同的碱基对。mRNA一部分穿过胞核进入胞浆,到达蛋白质合成的部位—核糖体。转运RNA(tRNA)根据mRNA上的编码顺序将每一种氨基酸携带至核糖体,并将氨基酸加至延伸的多肽链上。当一条氨基酸链合成完毕,在附近分子伴侣的影响下自我折叠,形成复杂的三维结构。
DNA的编码由四种核苷酸的其中三种组成三联密码子构成。特定的氨基酸由特定的三联密码子编码。由于有四种核苷酸,可能的三联密码子数目为43(64)。因为仅有20种氨基酸,因此可有多余的三联密码子组合。同一种氨基酸可由不同的三联密码子编码。其余密码子可编码蛋白质合成的起始或终止密码子,它的顺序决定了氨基酸的结合和组装。
基因包含外显子和内含子。外显子编码合成最终蛋白质的氨基酸组分。内含子包含影响蛋白质合成速度和调控的其他信息。外显子和内含子共同转录至mRNA,但内含子部分最终将被剪接掉。转录过程受到很多因素的调控,包括反义RNA,该链由DNA上未转录成mRNA的链为模板合成。除DNA之外,染色体包含组蛋白和其他影响基因表达的蛋白(哪些蛋白和多少蛋白由给定的基因合成)。
基因型指特定的基因组成序列,由它决定编码合成何种蛋白。相反,基因组是指一组完整的单倍体染色体组成,包括它们所包含的所有基因。
基因表型指由其控制的个体(细胞甚或机体)的生化和生理构成性状和功能。表型即基因最终如何表达,取决于实际合成蛋白的类型和数量。
表达 是指某个基因所编码的信息被用来控制某个分子组成(通常为蛋白质或RNA)的过程。基因的表达取决于多种因素,诸如显性或隐性性状、基因的外显度和表现度( 影响基因表达的因素)、组织分化的程度(取决于组织的类型和年龄)、环境因素,以及表达是否受性别限制、染色体失活或基因组印记的影响及其他未知因素。
表观遗传因素
影响基因表达但不改变基因组序列的因素称为表观遗传因素。
许多介导基因表达的生化机制的认知正在迅速增长。变异(也称之为选择性剪接)是内含子剪接的机制之一。由于内含子被剪切,外显子也可能被剪切,紧接着,外显子可能以多种组合集合,导致不同的mRNAs形成,来编码相似却又不同的蛋白质。人类可合成蛋白的数量> 100,000,即使在人类基因组仅包含约20,000个基因。
其他调节基因表达的机制包括DNA甲基化和组蛋白修饰如甲基化和乙酰化。DNA甲基化趋于基因静默。DNA缠绕在类似于线轴一样的组蛋白周围。组蛋白修饰,如甲基化可以增加或减少一个特定的基因合成的蛋白质的量。组蛋白乙酰化同基因表达下降相关。DNA上的非转录链亦可作为合成RNA的模板,来调控另一条链的转录。
另一个重要的机制涉及微小RNAs(miRNAs)。miRNA是短小、发夹状结构(发夹指RNA序列相互捆绑在一起的形状)的RNA,可抑制基因转录后的表达。它们可能涉及多达60%的转录蛋白质的调节。
性状和遗传模式
所谓性状,可以如眼睛的颜色那样简单,也可以如对糖尿病的易感性那么复杂。一个性状的表达可涉及一个基因或多个基因。一些 单基因缺陷可引起多组织的异常,这种效应称为基因多效性。例如,成骨不全症 (由单个胶原基因异常引起的结缔组病)可导致脆骨病、耳聋、蓝巩膜、牙齿发育不良、关节活动度过大和心瓣膜异常([XRef])。