- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
内容和运动方向感知计算模型
中国科学 C 辑 :生命科学 2008 年 第 38 卷 第 4 期 : 386 ~ 397
SCIENCE IN CHINA PRESS
内容和运动方向感知计算模型
①②* ①* ①
杨文璐 , 张丽清 , 麻立波
① 上海交通大学计算机科学与工程系, 上海 200240;
② 上海海事大学电子工程系, 上海 200135
* 联系人, E-mail: wenluyang@; zhang-lq@
收稿日期: 2007-07-30; 接受日期: 2007-12-26
国家重点基础研究发展计划(批准号: 2005CB724301)和国家高技术研究发展计划(批准号: 2006AA01Z125)资助项目
摘要 对视野中的物体及运动方向进行感知是视觉感知的基本问题之一, 较高级 关键词
视皮层从V1 区的简单细胞开始分为两个通路: “What 通路”和“Where 通路”. 前者对 视觉感知
物体的形状、颜色、纹理等内容感知, 后者对空间运动速度和方向等感知. 本文利用 运动感知
仿脑视觉信息处理计算结构, 研究视觉内容和运动方向上的感知计算模型、计算机理 计算模型
和学习算法. 该计算模型是一个三层的神经网络, 第一层是视觉信号输入层, 用于接 视皮层
收外界图像刺激. 第二层是神经信息内部表象层, 与第一层的网络联结是通过神经 感受野
元稀疏表象原理自适应形成神经元的感受野. 为此, 引入Kullback_ Leibler 散度描述 简单细胞
神经元响应的独立性, 极小化该代价函数导出网络联结权值的学习算法. 从自然图 复杂细胞
像块中学习得到图像基函数, 这些基函数具有局部性、朝向性和带通滤波性. 这些性
质与生理实验结果中的V1 区简单细胞感受野特征相吻合. 将这些基函数作为神经元
的感受野, 并在第三层对较高级视皮层的内容感知和运动感知神经元进行建模. 在
理想刺激中加入一定量的噪声后, 该模型对内容和运动方向的感知仍有较高的准确
率和较好的鲁棒性. 最后给出的实验仿真结果说明模型的可行性和学习算法的简单
有效性.
人类的视觉系统在对外界信息的感知过程中扮 直到内部的颞皮层(TE 区), 呈现信息的分层处理机
演着非常重要的角色. 由于自然图像中包含着物体 制. 从 V1 区开始, 较高级皮层感受野越来越大, 如
的形状、颜色、纹理及空间运动速度和方向等复杂信 V1(1.5°), V4(4°)和 TE (26°×26°)[1]. 这表明信息处理
息, 视皮层在长时间的进化过程中为适应对各种信 由局部特征逐渐过渡到全局特征.
息的感知需要逐渐分离出许多功能区, 这些功能区 Where 通路从 V1 的4Cα后至 4B, 然后直接地或
形成两个主要的功能通路: 腹侧通路(What 通路)和 间接地经V2, V3 到达 V5(MT 区). MT 内的大部分细
背脊通路(Motion 或 Where 通路), 如图 1 所示. 前者 胞对刺激的运动方向、运动速度和双眼视差敏感, 侧
通过物体的形状、颜色和纹理等对物体进行识别, 后 重分析在视空间中物体运动的三维轨迹, 而不理会
者对物体的空间运动速度和方向进行响应. What 通 物体的形状. 虽然 MT 是在皮层分级中选择性地着重
路对物体特征的处理开始于初级视皮层(V1 区)细胞 运动分析的最低一级区域, 但是, 最根本的对方向、
的简单空间滤波, 经次级视皮层(V2), 高级视区(V4) 速度和视差的敏感的神经元在 V1 和 V2 亦占了相当
386
文档评论(0)