您的当前位置:首页正文

基因识别技术综述

来源:九壹网


基因识别技术综述

——生物认证技术

姓名:

班级:

学号:

教师:

【基因识别技术综述】

目 录

生物识别技术知识背景 基因识别技术知识背景 对基因识别的个人初步理解 基因识别技术的基本原理 关于基本原理的个人理解 基因识别相关算法举例 基因识别相关应用技术举例 关于应用技术的一点思考 基因识别方法个人理解 基因识别领域的发展前景 综述小结 第3页

第4页

第5—6页

第7页

第7页

第8—9页

第10页

第10页

第11页

第12页

第13页

第2页

【生物识别技术知识背景】

【基因识别技术综述】

所谓生物识别技术,也就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性,(如指纹、脸像、红膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定。

生物识别系统对生物特征进行取样,提取其唯一的特征并且转化成数字代码,并进一步将这些代码组成相应的特征模板。由于微处理器及各种电子元器件成本不断下降,精度逐渐提高,生物识别系统逐渐应用于商业上的授权控制如门禁、企业考勤管理系统安全认证等领域。

用于生物识别的生物特征有手形、指纹、脸形、虹膜、视网膜、脉搏、耳廓等,行为特征有签字、声音、按键力度等。基于这些特征,人们已经发展了手形识别、指纹识别、面部识别、发音识别、虹膜识别、签名识别等多种生物识别技术。

传统的身份鉴定方法包括身份标识物品(如钥匙、证件、ATM卡等)和身份标识知识(如用户名和密码)但由于主要借助体外物,一旦证明身份的标识物品和标识知识被盗或遗忘,其身份就容易被他人冒充或取代。

生物识别技术比传统的身份鉴定方法更具安全、保密和方便性。生物特征识别技术具不易遗忘、防伪性能好、不易伪造或被盗、随身“携带”和随时随地可用等优点。

——参考资料:百度百科 http://baike.baidu.com/view/356193.htm

【基因识别技术知识背景】

随着人类基因组计划的开展,人们对基因的结构和功能的认识不断深化,并将其应用

第3页

【基因识别技术综述】

到个人身份识别中。因为在全世界60亿人中,与你同时出生或姓名一致、长相酷似、声音相同的人都可能存在,指纹也有可能消失,但只有基因才是代表你本人遗传特性的、独一无二、永不改变的指征。

基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。基因识别是基因组研究的基础。

基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析,我们能够获知它们在染色体上的顺序。若进行大量类似的分析,我们可以确定各个基因的大致位置。现在,由于人类已经获得了巨大数量的基因组信息,依靠较慢的实验分析已不能满足基因识别的需要,而基于计算机算法的基因识别得到了长足的发展,成为了基因识别的主要手段。

识别具有生物学功能的片段与判定该片段(或其对应的产品)的功能是两个不同的概念,后者通常需要通过基因敲除等的实验手段来决定。不过,生物信息学的前沿研究正在使得由基因序列预测基因功能变得愈发可能。

——参考资料:百度百科 http://baike.baidu.com/view/2039116.htm

【对基因识别的个人初步理解】

参阅了网站上的相关资料后,我发现其实生物识别技术其实是一个相当广泛的领域,当然了,在我看来“生物识别”本身也从属于“生物认证”,生物认证应该是还要更加广泛的概念。

第4页

【基因识别技术综述】

简单地理解,就如同之前的两次综述中所提到的,“生物识别”或者说“生物认证”主要就是基于人体的生物特征来辨别不同的人,同时也用于证明某个人是否符合他所声称的身份,而其中“特异性”(也可以说是“唯一性”)、“普遍性”、“稳定性”等则作为十分关键的因素,它们可以用来判别人体的某种生物特征“可不可以”被用来作为识别的标准!

当然了,如我之前综述中提到的,常见的已经被证实可用于作为识别基准的生物特征包括“指纹”、“掌纹”、“虹膜”、“视网膜”等等。

而现在我们要谈论的则是“基因识别技术”,顾名思义,作为识别基准的生物特征就是“基因”,也可以说成是人们日常中提到的“DNA”(当然了DNA的主要特性也就是有基因提供),在认真仔细地查阅和学习该项技术的相关知识之前,我先是简单地了解了一下“基因识别”的来由、背景以及基本原理,这里总结一下:

首先是时代进步的需要(当然也包括市场、人们工作生活的需要),导致了更为精准的识别技术的诞生于迅猛发展,这也是大势所趋——因为即使是我之前提到的“指纹识别”、“虹膜识别”等识别技术,也是有相当大的缺陷的,虽然在一般普通场合中可以应用,但是在对于 “特异/唯一”、“稳定”等关键因素有着非常严格要求的场合中,它们就不再适用了——

首先,在我学过的知识和看过的新闻报道中了解到,譬如“指纹”其实要伪造,虽然十分困难,但是技术上是可以实现的,同时,如果只是要求“指纹”而没有附加“活体认证”等限制的话,也是非常容易被盗用的(电影中我们常看到特工使用别人的手指来欺骗识别系统),再次就是指纹虽然稳定,但是环境因素可能导致指纹识别困难(比如学校机房,我们常常因为手指脱皮而没法通过指纹认证——当然,识别精确度也是其中的一个方面)。

第5页

【基因识别技术综述】

为此,更为精准(甚至可以说是没有比这个更能证明一个人的身份的了)的识别技术孕育而生并且迅猛发展,那就是“基因识别”。

咋一听,感觉特别高端(虽然技术上的确实现起来很复杂),但是其基本原理是很浅显易懂的。基因,也即我们常说的DNA,可以说是一个人能完完全全区别于世界上其他任何一个人的“身份证”,因为DNA的高度复杂性、高度排序性、高度严格性,导致除非提取本人血液(从而提取基因)否则很难伪造(理论上可行,但是实际中就目前科学技术而言是不可能的——未来几十年来成功培养克隆人的可能性就技术层面上来说都是很困难的,更别说现在全世界都明文禁止研究“克隆人”技术),这种“唯一性”绝对不是“指纹”、“虹膜”、“掌纹”什么的可以相提并论的,同样的,其稳定性也是毋庸置疑的,因为在正常生活环境下,一个人的成长过程中不会出现基因变化(也就是俗话说的“天生的”),除非特别恶劣环境(高温高压、化学污染、核污染)下导致基因突变——当然,这种极端情况我们无需去考虑!

【基因识别技术基本原理】

近年来.科学家们开发出多种遗传标记用于个体识别.其中短片段重复序列(Short Tandem Repeat简称STR)广泛存在于人的基因组中.具有高度多态性。它们一般由2~6个碱基构成一个核心序列,在长度上呈串联重复排列.主要由核心序列拷贝数目的变化产生长度多态性,且STR检测方法简便、快速、准确度高.适台于构建大规模的DNA—STR遗传标记数据库,便于检索和查询。对STR进行检测已发展为目前最主要的个体识别检测标记。

——摘自 [1] 吴竹君. 谈DNA生物识别技术及其应用 [J]. 中国安防, 2010(8).

【万方】

第6页

【基因识别技术综述】

【关于基本原理的个人理解】

之前曾经提到过,DNA包含着个人所有的遗传信息.与生具有,并终身保持不变,它成为了我们认定基因(DNA)可以作为识别基准的生物特征之一的科学依据所在,这个科学事实主要涵盖了这样两层信息:一个是“独特/特异性”,另一个则是“稳定性”!

如上面所说的“高度多态性”也是作为基因的“特异性”的其中一部分,由多个碱基形成的核心序列对于每一个人(甚至可以说是对于每一个生命个体)来说都是不一样的。

同样,其高复杂度的生物特征特性体现在“这种遗传信息蕴含在人的骨骼、毛发、血液、唾液等所有人体组织或器官中”,它遍布全身,也就是说它涵盖了可以标识这个人整个个体本身(并且区别于其他个体)所有的特异性信息,这也是我们用于识别和认证的依据所在!

【基因识别相关算法举例】

有关基因识别、认证和检测的算法有多种多样,不管是哪一种算法,其理论基础都是相当复杂的,同时其技术实现方法也是有着高要求和高难度的,这里指简单列举我在图书馆参考文献中看到的两种比较常见而且相对容易理解的算法(或者说技术思路),它们完整的理论依旧需要具备很多专业、高深的知识才能理解,这里只提取它们的中心思想和核心算法!

算法① RepSeeker算法

RepSeeker算法首先找出输入序列S中的所有基本重复体,然后输出重复体的一个有

第7页

【基因识别技术综述】

序表.重复体表中的元素是一个数对,表示一个重复体在输入序列中的起始位置和结束位置.因此,识别基本重复体的问题可以转换为寻找重复体的边界问题.因而,RepSeeker算法检查输入序列中每个位置,并确定一个位置是否是重复体的一个边界.

RepSeeker算法由以下5步组成.

第1步.计算子串在滑动窗口中的频率.

第2步.求出频率相等的块.

第3步.子重复检查.

第4步.重复体扩展.

第5步.重复体归类.

算法② 基于密码子基因预测算法

真核DNA序列中基因的识别是一个复杂的问题,一种方法是首先通过统计分析预测编码区域,挑选出候选的外显子,然后利用动态规划方法构造最优的基因结构,这个最优的基因结构被定义为一个外显子一致的链。然而,直接运用这种方法会遇到概念上和计算上的困难。每一个候选的基因由许多统计参数来刻画,但还不清楚如何将这些统计参数组合到一个打分函数中。这个问题在一定程度上可以用神经网络来解决,运用神经网络为每个候选的外显子打分,或将神经网络与动态规划相结合,从而构造最优基因结构。然而使用标准的动态规划隐含说明仅仅考虑具有加和性的打分,而许多序列分析表明用非线性的函数有时会得到更好的效果。矢量动态规划方法为利用非线性函数提供了可能。矢量动态

第8页

【基因识别技术综述】

规划构造一组基因,并确保其中包含满足自然单调条件的函数所对应的最优基因。

这里首先介绍一种根据各个密码子出现频率识别编码区域的方法。例如,亮氨酸、丙氨酸、色氨酸分别有6个、4个和1个密码子,将一个随机均匀分布的DNA序列翻译成氨基酸序列,则在氨基酸序列中上述3种氨基酸出现的比例应该为6:4:1。但是,在真实的氨基酸序列中,上述比例并不正确。这说明DNA的编码区域并非随机序列。

假设在一条DNA序列中已经找到所有的ORF,那么,可以利用密码子频率进一步区分编码ORF和非编码ORF。将每个ORF转换为相应的密码子序列,得到一个64个状态的马尔柯夫链。这里,为每个密码子分配一个状态,状态转换概率即为一个密码子跟随在其他密码子后面的概率。利用这种方法,可以计算一个ORF成为编码区域的可能性。

【基因识别相关应用技术举例】

DNA 生物传感器是90 年代的一个新的研究热点。它是将有反应活性的一单股核苷酸(长度在18 ~ 50 个碱基之间)固定在某种支持物(感受器)上作为探针,它可以在含有复杂成分的环境下特异地识别出某一靶子底物,并通过换能装置转换为电信号。

设计DNA 传感器涉及两个关键技术:一是有效地将DNA 探针在固体基质表面的固定技术;二是在传感器-液相界面对于靶基因的测定技术。

DNA固定化技术是使具有分子识别能力的物质得以利用之基础。固定核酸探针要考虑使寡核苷酸探针能有效地连接于支持物并保持其与待测分子的特异性结合活性。

生物传感器另一个重要组成部分是信号转换装置,它与分子识别基质可以是同一器件,

第9页

【基因识别技术综述】

也可为不同器件。其作用是感知DNA 与待测物质特异性结合产生的微小变化,并把这种变化转变为可记录的信号。

——摘自 [1]林琳, 江龙. DNA分子识别及传感技术[J].化学通报, 2001, 64(5).【万

方】

【关于应用技术的一点思考】

其实在查阅各种科学文献资料中,我就发现了这样一个事实:基因领域是生物领域很庞大的一个分支,关于它的应用数不胜数,即使仅仅针对“认证、识别”这一方面来说,应用的方面也是一般人难以想象的!这里提到的DNA生物传感器看似与身份认证无关,但其实它蕴含了利用基因进行生物认证的基本科学原理,“传感”体现出的就是“识”,当然“别”则是建立在“识”之上的!

【基因识别方法个人理解】

在查阅了学校图书馆数据库中的相关内容之后,基本上我认为识别的方法可以归纳为两大类:间接识别法和从头计算法。

不少资料中都认为“间接识别”这种方法虽然不足够精确,但是在应用场合不要求特别严格的情况下是很好的一种选择,它很大的一个优势在于无论从逻辑上还是从科学技术手段的角度上来说都是相对而言容易理解和实现的。

在间接识别法中,人们利用已知的mRNA或蛋白质序列为线索在DNA序列中搜寻所对应的片段(这就是为什么这种方法称之为“间接”的原因)。由给定的mRNA序列确定

第10页

【基因识别技术综述】

唯一的作为转录源的DNA序列;而由给定的蛋白质序列,也可以由密码子反转确定一簇可能的DNA序列。因此,在线索的提示下搜寻工作相对较为容易,搜寻算法的关键在于提高效率,并能够容忍由于测序不完整或者不精确所带来的误差。

相较而言,从头计算这一类的方法就显得非常精准(虽然理论上是最好的,可是对技术手段、系统资源等方面却要求得很高)。

简单地说,从头计算法是仅仅由DNA序列信息预测蛋白质编码基因的,换句话说它并不依靠其他“相关”的信息(这就是“从头计算”的含义所在)。一般意义上基因具有两种类型的特征,一类特征是“信号”,由一些特殊的序列构成,通常预示着其周围存在着一个基因;另一类特征是“内容”,即蛋白质编码基因所具有的某些统计学特征,并且高级的基因识别算法常使用更加复杂的概率论模型!

【基因识别领域的发展前景】

我记得以前看报纸的时候有这样一则新闻:比尔•盖茨断言:“下

一个超过他的富翁一定出自基因领域。”

经济学家和产业分析师则都认为,在科学迅猛发展的当今时代,全世界以往的任何一个行业都无法与基因生物领域所代表的社会和经济意义相比。对发展而言,基因产业有着其他任何一个产业都前所未有的历史机遇!

在一篇报道“DNA侦测协助破案”的文章结尾,贝尔实验室的科学家们指出,作为本

世纪最富远景的产业,基因产业已经带动了全球

第11页

【基因识别技术综述】

生物技术产业的火热发展!作为一个印证,如大家所知,中国的基因产业也正处于急剧扩张阶段。

美、英、德、法等政府作为推进主力支持者基因产业的快速发展;而在亚洲,各国政府也将基因产业视为未来经济发展的战略中心,严密谋划。我国主要有基因检测、亲子鉴定、个体识别及相关遗传咨询等有关基因方面的服务进入了产业领域。

之前我提到过,基因是一个广泛的领域,那么相关的产业也是异常宽泛的,而我们一直在讨论的“识别技术”则是非常重要的一部分(因为只要提及基因,一般都不得不提到“遗传”、“特异性”、“鉴别”、“侦测”这些关键词),识别技术的应用不仅仅如前面所说的DNA生物传感器,现在“基因身份证”这个概念已经被提出,许多国家的科研人员都对这一方面的研究与发展饶有兴趣,由此可见,其发展前景是一片海阔天空的!

【综述小结】

正如我之前的综述中所谈到的一样,生物识别技术已经不再是一个新鲜的词儿了,其概念在很早以前已经提出,然而,我们目前为止所认识与开发(研究)以及得到应用的部分只是冰山一角而已。

无论是前面提及到的“指纹识别”、“虹膜识别”或者类似的“掌纹识别”、“视网膜识别”还是我们才谈论的“基因识别”,这些技术提出概念已经很久,也在不少产业领域得到了应用,可是其发展尚未达到巅峰时刻,所谓“前景海阔天空”也就是说可以发展的空间还有很多很多,我认为我们应该在学习生物识别这方面的知识,开拓新的识别技术的同时,也应该注重对已有的识别技术进行更新换代与扩充,紧紧围绕“唯一/特异性”、“稳定性”、“可靠性”、“可行性”等几个关键原则进行研究,相信这方面的应用不仅越来越多而且会

第12页

【基因识别技术综述】

越来越实用越来越强大!

第13页

因篇幅问题不能全部显示,请点此查看更多更全内容

Top