- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最简状态后缀自动机 顾名思义,就是状态数最少的后缀自动机,在后面可以证明它的大小是线性的,我们先来看一些性质。 假如我们得到了这个最简状态后缀自动机SAM。 我们令ST(str)表示trans(init,str)。就是初始状态开始读入字符串str之后,能到达的状态。 分析 分析 分析 分析 状态数的线性证明 状态数的线性证明 状态数的线性证明 一些性质 一些性质 关于子串的性质 由于每个子串都必然包含在SAM的某个状态里。 那么一个字符串s是S的子串,当且仅当,ST(s)!=null 那么我们就可以用SAM来解决子串判定问题。 同时也可以求出这个子串的出现个数,就是所在状态Right集合的大小。 关于子串的性质 在一个状态中直接保存Right集合会消耗过多的空间,我们可以发现状态的Right就是它Parent树中所有孩子Right集合的并集,进一步的话,就是Parent树中它所有后代中叶子节点的Right集合的并集。 那么如果按dfs序排列,一个状态的right集合就是一段连续的区间中的叶子节点的Right集合的并集,那么我们也就可以快速求出一个子串的所有出现位置了。 树的dfs序列:所有子树中节点组成一个区间。 线性构造算法 我们的构造算法是Online的,也就是从左到右逐个添加字符串中的字符。依次构造SAM。 这个算法实现相比后缀树来说要简单很多,尽管可能不是非常好理解。 让我们先回顾一下性质 定义和性质的回顾 状态s,转移trans,初始状态init,结束状态集合end。 母串S,S的后缀自动机SAM(Suffix Automaton的缩写)。 Right(str)表示str在母串S中所有出现的结束位置集合。 一个状态s表示的所有子串Right集合相同,为Right(s)。 Parent(s)表示使得Right(s)是Right(x)的真子集,并且Right(x)的大小最小的状态x。 Parent函数可以表示一个树形结构。不妨叫它Parent树。 定义的回顾 一个Right集合和一个长度定义了一个子串。 对于状态s,使得Right(s)合法的子串长度是一个区间,为|[Min(s),Max(s)] Max(Parent(s)) = Min(s)-1。 SMA的状态数量和边的数量,都是O(N)的。 不妨令trans(s,ch)==null表示从s出发没有标号为ch的边, 定义的回顾 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 每个阶段 接下来考虑节点nq,在转移的过程中,结束位置L+1是不起作用的,所以trans(nq)就跟原来的trans(q)是一样的,拷贝即可。 每个阶段 每个阶段 自此我们圆满的解决了转移的问题。 嘟嘟噜,搞完啦~~ 每个阶段:回顾 我们需要新的算法来解决这个问题 在SPOJ的讨论版中,出题人提到了要使用suffix automaton来解决此题。 * 提到字符串数据结构,大家都会想到这些 * 了解AC自动机的同学都不会陌生, * 如果时间复杂度达到N^2级别,这个数据结构也就没有意义了。 演示插入的过程。 * 说了这么多,如果不能给出一个构造SAM的算法,也没有意义。 * 后缀自动机Suffix Automaton 杭州外国语学校 陈立杰 WJMZBMR 吐槽回答 Q:你是哪里的弱菜?我听都没听说过! A:我是来自杭州外国语学校的陈立杰,确实是弱菜。 Q:Suffix Automaton?我根本就没有听说过这种数据结构。 A:这个还是有点用处的,等下我会讲的,你就当长知识了吧。 Q:呼噜噜~~~~~~ A:睡好。。。 先让我们看SPOJ上的一道题目 1812. Longest Common Substring II 题目大意:给出N(N = 10)个长度不超过100000的字符串,求他们的最长公共连续子串。 时限:SPOJ上的2s 一个简单的做法 二分答案之后使用哈希就可以在O(LlogL)的时间内解决这个问题。这个做法非常经典就不详细讲了。 看起来很简单。。但是。。。 我们可以看到大部分人都TLE了。。为什么呢? SPOJ太慢了 SPOJ太慢了 SPOJ太慢了 SPOJ太慢了 SPOJ太慢了 SPOJ太慢了 SPOJ太慢了 新的算法 OI中使用的字符串处理工具 Suffix Array 后缀数组 Suffix Tree 后缀树 Aho-Corasick Automaton AC自动机 Hash 哈希 什么是自动机 有限状态自动机的功能是识别字符串,令一个自动机A,若它能识别字符串S,就记为A(S)=
您可能关注的文档
- 卡耐基演讲与口才训练试卷.ppt
- 开发报建流程及细则试卷.doc
- 开发部岗位说明书试卷.doc
- 开发建设项目可行性试卷.doc
- 中键培训(一)研究.ppt
- 习作八《假如我会变》写作指导研究.ppt
- 中阶管理培训研究.ppt
- 习作四说说心里话研究.ppt
- 中经原油知识研究.ppt
- 2012.10.29有限空间培训1研究.ppt
- 吉安县公开招聘专职文明实践员笔试备考试题及答案解析.docx
- 2025重庆枫叶国际学校招聘教师笔试备考试题及答案解析.docx
- 游机队电玩自制联网教程-tplink.pdf
- 2025重庆新华出版集团招聘1人笔试模拟试题及答案解析.docx
- 2025宜宾高新丽雅城市产业发展有限公司公开招聘笔试模拟试题及答案解析.docx
- 2025云南保山市龙陵县勐糯镇人民政府招聘合同制专职消防员1人笔试模拟试题及答案解析.docx
- 11.1生活中常见的盐 九年级化学人教版下册.pptx
- 6.1法律保护下的婚姻 高二政治《法律与生活》课件(统编版选择性必修2)(新版).pptx
- 文昌市中小学教师校园招聘29人笔试模拟试题及答案解析.docx
- 10.1.5 常见的酸和碱(第5课时)课件-九年级化学人教版下册.pptx
最近下载
- 2024年高考语文复习:修改病句 专项练习题(含答案解析).pdf VIP
- 第1章 勾股定理 大单元教学设计 【 学情分析指导 】 北师大版八年级数学上册.docx VIP
- 2024年全国职业院校技能大赛高职组(烹饪赛项)备赛试题库(含答案).pdf VIP
- 2024年世界职业院校技能大赛中职组“导游服务组”赛项考试题库(含答案).pdf VIP
- 2024年世界职业院校技能大赛高职组“导游服务组”赛项参考试题库(含答案).pdf VIP
- 2024年世界职业院校技能大赛高职组“研学旅行组”赛项参考试题库(含答案).pdf VIP
- 涡喷发动机及其油路结构.pdf VIP
- (一模)临汾市2025年高考考前适应性训练考试(一) 化学试卷(含答案).pdf
- 山西省大同市云冈区重点名校2024届中考冲刺卷数学试题含解析.doc VIP
- 2024年《药物临床试验质量管理规范》(GCP)网络培训题库及答案完整版.pdf VIP
文档评论(0)