- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人类基因PolyA位点预测.pdf
第31卷第6期 计 算 机 学 报 v01.31No.6
2008
2008年6月 CHINESE OFCOMPUTERS June
JOURNAL
人类基因PolyA位点预测
廖 垄 段江波 周艳红
(华中科技大学生物信息与分子成像湖北省重点实验室武汉430074)
摘 要mRNA3’端的多聚腺苷酸化是真核细胞内mRNA转录后处理的三个最主要步骤之一.对DNA序列上发
生多聚腺苷酸化的位置即PolyA位点的识别,对于理解mRNA的形成机制以及进行基因结构预测具有重要作用.
本研究利用机器学习方法对PolyA位点进行预测,其实现过程分为以下三个步骤:特征的生成、特征的筛选、特征
的综合分析聚类.首先,我们采取统计k阶核苷酸频率的方法来生成初始的特征;然后,通过信息学知识来对特征
Vector
进行筛选;最后,使用SVM(SupportMachines,支持向量机)的方法进行特征的综合分析,确定参数,建立预
测模型.在独立的测试数据集上进行测试,当敏感度(Sn)固定为60%时,在内含子水平和外显子水平上的特异
性(Sp)分别为71.67%和80.77%,在内含子水平上的预测精度明显优于国际上的同类软件.
关键词PolyA信号;机器学习;熵}支持向量机
中图法分类号TPl8
Predictionof inHumanGene
Polyadenylation Sequences
LIAOKunDUAN ZHOU
Jiang—Bo Yan—Hong
(Hubei andMolecular Science
Imaging of and 430074)
Bioinformatics KeyLaboratory,HuazhongUniversity Technology,Wuhan
Abstract intuRNA3’endisoneofthethreemain of
P01yadenylation(PolyA)Occurs steps
and
of sitesinhumanDNA
eukaryoticpre—mRNAprocessing.Thepredictionpolyadenylation
mRNA is for the and of
sequencesveryimportantrealizingpre—mRNAprocessingpredictiongene
structure.This a machine methodto
paperpresents learning predict signals
polyadenylation
humanDNAandmRNA methodconsistsofthree offeature
(PA
文档评论(0)