- 1、本文档共39页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
天津师范大学硕士学位论文
摘 要
近年来,随着生物信息技术的发展,单细胞测序技术应用在越来越多的场景
中,并随之产生了大量单细胞RNA测序数据。然而由于单细胞测序技术的限制,
单细胞RNA测序数据表现出很大的缺失性,其表现为RNA测序数据中存在超过70%
的缺失值(零值)。这些缺失值可能真的是未表达的“真零”,同时也有大量计数
在细胞中本应具有低、中表达,但由于测序失败导致了这种“假零”计数现象。
后一种由测序失败导致的零被称作“漏失” (dropout ) 现象。针对“dropout” 现象,
基于不同的原理和模型,已经存在几种不同的数据插补算法,但普遍效果并不理
想,甚至一些基于深度学习的插补算法准确度低于非深度学习算法。
本文通过对图像修复技术和单细胞插补算法的综合研究和分析,提出一种具
有较高插补精确度且运算速度较快的基于深度学习的单细胞插补算法。由于单细
胞下游分析(包括细胞分型、轨迹推断、差异表达等)都是基于高可变基因的,
算法首先将基因表达矩阵进行标准化,随后进行基因过滤,保留高可变基因,这
一过程可以使基因表达矩阵规模减小,进而提升后续算法的执行效率;接着将矩
阵每个含有全部高可变基因的细胞转化为图像;同时,我们使用Numpy类库批量
随机生成大量掩码(mask )数据集,用以覆盖基因表达矩阵部分数据,创造对照
组以方便后续数据训练;而后将细胞图像送入U-Net架构的部分卷积神经网络进行
训练,U-Net架构中的全卷积神经网络改良成带有mask更新的部分卷积神经网络,
每一层网络都会对mask 区域进行更新填充, mask 区域最终会被全部赋值;训练
结束后对原始细胞图像进行修复,这一过程中只对原始数据中的dropout区域进行
修复,而没有发生dropout事件的区域不再进行修复;最后,将所有图像重塑成表
达向量并整合在一起完成修复。为了提升算法效率,我们使用PyTorch进行了GPU
的并行化编程,极大地优化了算法的运行时间。
相比于基于概率统计的经典插补算法和深度学习插补算法,通过实验分析,
本文算法针对单细胞RNA测序的基因表达矩阵的插补具有更高的准确度及速度,
可以很好的针对dropout事件进行修复,并且可以有效地提升下游分析的结果。
关键词:插补算法;单细胞RNA 测序;基因表达数据;U-Net 网络;深度学习
I
天津师范大学硕士学位论文
目 录
第一章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状2
1.3 本文研究内容与创新点3
1.4 本文章节安排4
第二章 单细胞RNA测序与相关插补算法6
2.1 单细胞RNA测序技术6
2.1.1 细胞捕获技术6
2.2.2 定量方法7
2.2.3 测序平台7
2.2.4 单细胞RNA测序的基因表达矩阵8
2.2 单细胞插补方法介绍8
2.2.2 非深度学习插补方法9
2.2.3 深度学习插补方法 10
2.2.4 插补方法之间的比较 11
2.3 本章小结 12
第三章 U-Net网络架构及应用 13
3.1 U-Net框架的概念 13
3.2 U-Net 网络的经典模型及其变体 14
3.2.1 U-Net 14
3.2.2 Res-UNet 14
3.3 本章小结 15
第四章 基于U-Net的单细胞RNA测序数据插补算法 17
4.1 算法设计思路 17
4.2 算法核心步骤 17
4.2.1 数据预处理 17
4.2.2 分割基因表达矩阵重塑成灰度图 18
4.2.3 生成随机mask掩码图像 19
4.2.4
您可能关注的文档
- 基于GAN的红外与可见光图像融合算法研究.pdf
- 基于HPS落实科学本质观的高中化学教学现状及实践研究.pdf
- 基于PBL的初中数学“综合与实践”的教学研究.pdf
- 基于SOLO分类理论的高中地理“专题复习”实践研究.pdf
- 基于STEAM教育的《石油化工》校本课程资源开发研究.pdf
- 基于“认识思路”的高中化学单元教学研究——以“物质的量”为例.pdf
- 基于TOPSIS-RSR法对32届东京奥运会中国女篮与对手前锋攻防能力对比分析.pdf
- 基于二值神经网络的轻量化文字识别方法研究.pdf
- 基于上下文特征表达的短文本分类方法研究.pdf
- 基于修正KMV模型的企业信用违约风险研究——以蛋壳公寓为例.pdf
最近下载
- Odrive使用和开发技术资料-Odrive3.6-56V原理图.pdf
- 《伊川县志》(1986~2021)出版发行.docx
- 《新媒体文案写作(微课版)》全套教学课件.pptx
- 护理诊断及护理措施128条护理诊断护理措施 .pdf VIP
- 《生产经营单位应急能力评估规范》.pdf
- 临床微生物学检验理论课:16放线菌属、诺卡菌属、分枝杆菌属检验.pptx
- 医用粘胶相关皮肤损伤MARSI-★.pptx VIP
- 大学毕设论文__汽车雨刮器的设计与动力学分析.doc
- 2023年ABBVD4真空断路器安装手册配CL操动机构及EP固封极柱.pdf
- 3.2.2 共价晶体 (课件)高二化学(人教版2019选择性必修2).pptx
文档评论(0)