表达序列标签(expressed sequence tags,ESTs)是指从不同组织来源的cDNA序列。这一概念首次由Adams等于1991年提出。近年来由此形成的技术路线被广泛应用于基因识别、绘制基因表达图谱、寻找新基因等研究领域,并且取得了显著成效。在通过mRNA差异显示、代表性差异分析等方法获得未知基因的cDNA部分序列后,研究者都迫切希望克隆到其全长cDNA序列,以便对该基因的功能进行研究。克隆全长cDNA序列的传统途径是采用噬斑原位杂交的方法筛选cDNA文库,或采用PCR的方法,这些方法由于工作量大、耗时、耗材等缺点已满足不了人类基因组时代迅猛发展的要求。而随着人类基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速人类基因克隆研究,同时避免重复工作,节省开支,已成为一个急迫而富有挑战性的课题摆在我们面前,采用生物信息学方法延伸表达序列标签(ESTs)序列,获得基因部分乃至全长cDNAycg,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。文本将就EST技术的应用并就其在基因全长cDNA克隆上的应用作一较为详细的介绍。
1、ESTs与基因识别
EST技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得即昂贵又费时。因为基因组中只有2%的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的mRNA出发,构建各种cDNA文库,并对库中的克隆进行大规模测序。Adams等提出的表达序列标签的概念标志着大规模cDNA测序时代的到来。虽然ESTs序列数据对不精确,精确度最高为97%,但实践证明EST技术可大大加速新基因的发现与研究。Medzhitov等通过果蝇黑胃TOLL蛋白进行dbEST数据库检索,该蛋白已证实在成熟果蝇抗真菌反应中发挥重要作用,通过同源分析的方法,找到相应的人类同源EST(登录号为H48602),这为接下来研究人类TOLL同源蛋白的功能提供了很好的条件。hMSH5基因是从酿酒酵母菌MSH5存在30%的一致性,它与hMSH4特异性相互作用,在减数分裂和精子发生过程中发挥一定的作用。由此可见,应用EST技术,可以跳过生物分类学的界限,从生物模型的已识别基因迅速克隆出人和小鼠基因组相应的更复杂的未知基因。生物间在核苷酸水平上的进货差异阻碍了传统意义上的杂交或以PCR为基础的基因克隆策略,即使是亲缘关系很接近的生物也不例外,如C.elegans和C.briggsae,它们仅在2~5千万年前分化形成。而通过计算机进行dbEST进行数据库筛选,其配制是电子杂交实验,提供了一条更为广泛的基因识别路线,这一路线允许基因组间存在差异,这使得基因识别与新基因克隆策略发生革命性变化,同时它也提供了一个足够大小和复杂的基因数

