研究分析数据挖掘技术在监狱再犯率预测中的运用.doc

下载文档 降价啦

12
0
约2.72万字
约 35页
2017-08-20 发布于湖北
举报
版权申诉
保障服务

研究分析数据挖掘技术在监狱再犯率预测中的运用.doc

1、本文档共35页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数据挖掘技术在监狱再犯率预测中的运用五角场监狱章际新周飞摘要我国预防犯罪的社会综合治理工作和对罪犯进行的卓有成效的改造工作在世界上获得了很大的声誉。我国的犯罪率和刑释人员的再犯率之低也令世界上绝大多数国家惊羡。然而，众所周知，刑满释放人员的重新违法犯罪率远高于社会一般成员，刑释人员的重新犯罪状况仍是严重的社会问题。以上海市为例，近年来，每年新收入狱的犯人中有12%-18%是重新犯罪者。而且，司法实践表明，刑释人员犯罪的恶性程度远高于初次犯罪者。因此，遏制和预防刑释人员重新犯罪，对于降低犯罪率，维护社会治安，推进我国的现代化建设有着十分重要的意义。同时，随着监狱工作的不间断展开，在日常的工作中积累了大量的历史数据，但由于分析手段的缺乏，使得决定罪犯再犯率的依据不是基于数据库中丰富的数据，而是基于监狱警察的直觉。因此提高数据分析能力，同时建立一个基于相关数据的决策支持系统就变的十分重要。而数据挖掘技术作为近几年发展起来的数据组织和分析技术，在这一过程中无疑将发挥重要作用。最大熵模型作为一个比较成熟的统计模型，具有计算模型独立于特定的任务的特点，具有简洁、通用和易于移植等优点。但在最近几年的研究中只是被应用在关于自然语言处理的领域。本文将尝试如何将最大熵模型应用在再犯预测领域。本文首先介绍了目前数据挖掘技术的研究背景，重点对OLAP和分类规则进行了介绍。在此基础上，介绍了最大熵模型的理论基础和算法。再通过数据仓库的建立过程分析了再犯预测对数据挖掘的需求。本文的重点工作是将最大熵方法应用于再犯预测中，提出了基于最大熵的罪犯过滤系统的基本框架；通过罪犯数据的不同特征相结合的方法，将罪犯数据表示成特征向量，并对使用不同特征集情况下的过滤性能进行了对比实验；提出了过滤模型的自适应调整和学习算法，以适应罪犯特征变化，满足个性化过滤要求；将最大熵方法与其它常用的过滤方法（如贝叶斯方法）进行了性能比较，实验结果表明，这种方法在正确率等方面表现出了良好的过滤性能，解决了依据历史数据对罪犯予以分类的工作。、关键词再犯预测，最大熵模型，数据挖掘，特征选取，罪犯分类第一章绪论 1.1 论文的研究背景46.8%，日本的重新犯罪率为57.2%。而我国大陆地区的刑释人员释放后3年内又受到刑罚或劳教惩处的比率要低得多。其中上海市监狱管理局、上海市社区矫正工作办公室开展的《关于2009年度上海籍刑释人员改造质量的调查报告》，对2009年度上海籍刑释（含假释）人员回归社会以后的重犯罪情况进行了统计，其中重新犯罪的225人，重新犯罪率为8.56（重新犯罪率＝重新犯罪人数÷刑释人员总数）%[73]。因此，如何对刑释人员进行分类，将其中重新犯罪可能性较大的成员从刑释人员中鉴别出来，予以重点教育和防范，就成为一项重要任务。要完成这项任务必须对服刑人员个体重新犯罪的可能性进行准确的预测。如能准确预测犯罪者个体将来重新犯罪的可能性大小，则不仅在他们回归社会时可以根据预测结果在他们中确定进行教育和控制防范的重点对象，在狱中也可以根据预测决定哪些罪犯不宜假释、提前释放或保外就医，甚至在法院对他们判决时，也可以把预测结果作为判别哪些被告人不宜宣告缓刑或可以不施以自由刑的依据，其对于预防犯罪的意义和作用无疑是非常重大的。因此，各国的犯罪学家很早就开始对犯罪者进行再犯预测的研究，他们创造了各种各样的预测方法，并不断予以改进。自1950年起陆续召开的各届国际犯罪学会议和国际刑法和监狱法会议上，犯罪人的未来行为预测问题一直成为广受关注的重要议题。 1.2 本文的内容和意义随着现代信息技术、通讯技术、数据库技术、网络技术、数字化图书馆和计算机技术的高速发展及数据库管理系统的广泛应用，数据库存储的数据量急剧增大，据统计，全球的信息量每20个月翻一番。传统的信息系统大部分是查询驱动的，数据库作为历史知识库对于一般的查询过程是有效的，但当数据和数据库的规模急剧增长时，传统的数据库管理系统的查询检索机制和统计分析方法己远远不能满足现实的需求，它迫切要求能够自动、智能和快速地从数据库中挖掘出有用的信息和知识。如何迅速、准确、有效但适量地提供用户所需的信息，发现信息之间潜在的联系，支持管理决策就是数据挖掘和数据仓库要解决的课题。但是，罪犯再犯率中的数据挖掘技术的应用更多的还处于研究阶段，再犯预测领域真正实现数据挖掘系统的案例并不是很多。本文的目的是为了进一步探索数据挖掘在再犯预测的应用，具体以再犯预测中再犯率高低的问题为例，研究利用现有的数据挖掘工具得到关于罪犯信息的相关特征值，然后引入最大熵原理来构建相关模型。需要再犯预测的部门可以利用该模型更好地对罪犯进行分析。本论文的学术意义主要有以下几点：（1）通过实例来证明最大熵模型在再犯预测中的作用。（2）