1 条题解

  • 0
    @ 2025-8-24 22:17:48

    自动搬运

    查看原文

    来自洛谷,原作者为

    avatar 辰星凌
    时过而不知泪已落 —散华礼弥

    搬运于2025-08-24 22:17:48,当前版本为作者最后更新于2020-03-03 09:54:56,作者可能在搬运后再次修改,您可在原文处查看最新版

    自动搬运只会搬运当前题目点赞数最高的题解,您可前往洛谷题解查看更多

    以下是正文


    【学习笔记】字符串—广义后缀自动机

    My Blog\mathcal{My}\ \mathcal{Blog}

    update 2021.11.27:update\ 2021.11.27: 时隔多年回来补坑,有了额外的发现,并给出证明。
    【离线写法再探】阐述离线 dfs\text{dfs} 错误原因,证明离线 bfs\text{bfs} 正确性;阐述在线写法特判 11 的本质以及离线在线写法的之间联系;修复手绘图的一个小失误。

    update 2020.8.13:update\ 2020.8.13: 这个蒟蒻发现自己傻得不行,明明很简单的东西一直没扯清楚,所以立马来补锅了,顺便思考了如何 hack\text{hack} 盗版。
    更新更细致的复杂度讲解;添加卡掉盗版在线构造的方法,并对空节点性质进行深入研究;调整板块布局。

    updata 2020.7.13:updata\ 2020.7.13: 迫于ezoixx130的淫威跑来修锅啦。
    更新更侑秀的在线构造正确写法;增修文章细节;Latex\text{Latex} 规范化;并添加两道例题。

    update 2020.3.3:update\ 2020.3.3: 发现题库里出现了模板,决定添加两道例题,并对文章细节进行修改。

    一:【前言】

    最近一段时间都在研究 惊(Ren)艳(Lei)无(Zhi)比(Hui)、美(Li)妙(Xing)绝(Yu)伦(Yue) 的自动机,这里引用 bztMinamoto\text{bztMinamoto} 巨佬的一句话来表达此时的心情:

    我感觉我整个人都自动机了…… ——bztMinamotobztMinamoto回文自动机学习笔记

    在此过程中发现网上讲广义 SAM\text{SAM} 的文章很少,而且很多都不正确,所以决定整理一下。

    二:【引理】

    众所周知,SAM\text{SAM} 的一个经典应用是求一个字符串中本质不同子串数量,那么如果改为求一个 Trie\text{Trie} 树呢?(Trie\text{Trie} 中从上到下若干前缀串的本质不同子串)

    大部分可以用后缀自动机处理的字符串的问题均可扩展到 TrieTrie 树上。 ——刘研绎 (20152015 国家队论文《后缀自动机在字典树上的拓展》)

    我们将这种建立在 Trie\text{Trie} 树上的 SAM\text{SAM} 称为广义 SAM\text{SAM} 。在学习之前,首先要确保对单串 SAM\text{SAM} 足够熟悉。

    其实我们通常需要解决的是多模式串问题,即给出多个串让你去统计各种各样的信息(将多个串插入到一棵 Trie\text{Trie} 中,然后依靠这棵 Trie\text{Trie} 构造广义 SAM\text{SAM})。
    可能少部分题目会有直接给出一棵 Trie\text{Trie} 树的情况,但不常见。

    本文主要解决前一类问题,后者仅给出一种构造方法(即 bfsbfs 版离线写法),不详述其应用。

    注意这里两种类型题目中 Trie\text{Trie} 树有不同的性质:
    对于多模式串问题G(T)=O(len)=O(T)G(T)=O(\sum len)=O(|T|)
    对于直接给出的 Trie\text{Trie}G(T)=O(T2)G(T)=O(|T|^2)(如果不理解这个 T2|T|^2 可以看下面那张嫖来的图片)。
    (其中 G(T)G(T)Trie\text{Trie}TT 所有叶节点深度之和,T|T|Trie\text{Trie} 树大小)

    G(T)G(T) 这个东西看起来似乎没啥用处,但它会直接影响构造广义 SAM\text{SAM} 的算法复杂度。

    三:【算法实现】

    1.【离线构造】

    在用广义 SAM\text{SAM} 处理多模式串问题时,网上流传着的主流写法有 33 种:

    (1).(1). 用特殊符号将所有模式串连成一个大串放到一个 SAM\text{SAM} 中,再加一些玄学判断来处理信息。

    (2).(2). 每次插入一个模式串之前,都把 lastlast 设为 11,按照普通 SAM\text{SAM} 一样插入,即每个字符串都从起点 11 开始重新构造。

    (3).(3). 用所有模式串建出一颗 Trie\text{Trie} 树,对其进行 dfs/bfs\text{dfs/bfs} 遍历构建 SAM\text{SAM}insertinsert 时 使 lastlast 为它在 Trie\text{Trie} 树上的父亲,其余和普通 SAM\text{SAM} 一样。

    第一种实用性不高且复杂度危险。第二种机房大佬说是盗版,但因为复杂度依旧为线性、代码简单且在大部分题中都能保证正确性,所以很多人都用的这种(SAM Drawer\text{SAM Drawer} 似乎就是依据这个做法绘的图)。但根据广义 SAM\text{SAM} 的定义,只有第三种中才是正确写法。而且随便抛组数据就能立马发现构造出来的差异。

    dfs\text{dfs} 代码如下:

    //Trie.tr[x]: Trie树的状态转移数组
    //Trie.c[x]: Trie树上节点x的字符
    //pos[x]:Trie上x节点的前缀字符串(路径 根->x 所表示的字符串)在SAM上的对应节点编号
    inline void dfs(Re x){
        for(Re i=0,to;i<26;++i)if(to=T1.tr[x][i])
            pos[to]=insert(T1.c[to],pos[x]),dfs(to);
    }
    inline void build(){pos[1]=1,dfs(1);}//dfs遍历Trie树构造广义SAM(Tire树上的根1在SAM上的位置为根1)
    

    bfsbfs 代码如下:

    //Trie.tr[x]: Trie树的状态转移数组
    //Trie.fa[x]: Trie树上节点x的父节点
    //Trie.c[x]: Trie树上节点x的字符
    //pos[x]:Trie上x节点的前缀字符串(路径 根->x 所表示的字符串)在SAM上的对应节点编号
    inline void build(){//bfs遍历Trie树构造广义SAM
        for(Re i=0;i<C;++i)if(Trie.tr[1][i])Q.push(Trie.tr[1][i]);//插入第一层字符
        pos[1]=1;//Tire树上的根1在SAM上的位置为根1
        while(!Q.empty()){
            Re x=Q.front();Q.pop();
            pos[x]=insert(Trie.c[x],pos[Trie.fa[x]]);//注意是pos[Trie->fa[x]]
            for(Re i=0;i<C;++i)if(Trie.tr[x][i])Q.push(Trie.tr[x][i]);
        }
    }
    

    代码应该不难理解。

    有人表示能理解多模式串插入,但难以想象直接爬 Trie\text{Trie} 树构造自动机维护的到底是啥,其实也是一样的道理:
    其实质是将 Trie\text{Trie} 树上若干条从上到下的路径抽出来分别插入到 SAM\text{SAM}(或者说从 Trie\text{Trie} 树中还原出了若干待插入串)。而 Trie\text{Trie} 本身就压缩了大量的 lcp\text{lcp},这些被压缩的部分不需要多次插入,故遍历 Trie\text{Trie} 即可。

    多模式串插入和直接爬 Trie\text{Trie} 树构造本就是同样的原理,自动机也是一模一样的形态,只是复杂度不同罢了。(不理解这段话的可以先看后面)

    注意:dfs\text{dfs} 遍历的复杂度为 O(G(T))O(G(T))bfs\text{bfs}O(T)O(|T|)
    如果题目给的是若干个待插入串 SS,那么 dfs/bfs\text{dfs/bfs} 可以任选一种,因为此时 O(G(T))=O(S)O(G(T))=O(\sum|S|)
    但要是直接给了一颗 Trie\text{Trie}dfs\text{dfs} 就会被卡。
    关于 G(T)=O(T2)G(T)=O(|T|^2) 的证明,这里嫖一张图: 【图片来源】

    2.【在线构造】

    仅针对于多模式串问题,我们还有另一种构造广义 SAM\text{SAM} 的方法。

    “离线”,顾名思义,对多个模式串离线构造出 Trie\text{Trie} 树,然后依据 Trie\text{Trie} 构造广义 SAM\text{SAM}
    而“在线”就是指不建立 Trie\text{Trie},直接把给出的多个模式串依次插入到广义 SAM\text{SAM} 中(用在线做法写正确的人少得可怜)。

    具体的说,每次插入一个模式串之前,都把 lastlast 设为 11insertinsert 函数在普通 SAM\text{SAM} 的基础上加入特判(注意前面说的盗版写法用的是不加特判的普通 insertinsert)。

    更改后的 insertinsert 代码如下:

    //link[i]: 后缀链接
    //trans[i]: 状态转移数组
    inline int insert(Re ch,Re last){//将ch[now]接到last后面
        if(trans[last][ch]&&maxlen[last]+1==maxlen[trans[last][ch]])return trans[last][ch];
        //已经存在需要的节点(特判1)
        Re x,y,z=++O,p=last,flag=0;maxlen[z]=maxlen[last]+1;
        while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
        if(!p)link[z]=1;
        else{
            x=trans[p][ch];
            if(maxlen[p]+1==maxlen[x])link[z]=x;
            else{//需要拆分x,将len<=maxlen[p]+1的部分复制一个y出来
                if(maxlen[p]+1==maxlen[z]/*或者写:p==last*/)flag=1;(特判2)
                y=++O;maxlen[y]=maxlen[p]+1;
                for(Re i=0;i<C;++i)trans[y][i]=trans[x][i];
                while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                link[y]=link[x],link[z]=link[x]=y;
            }
        }
        return flag?y:z;//注意返回值
        //返回值为:ch[now]插入到SAM中的节点编号,
        //如果now不是某个字符串的最后一个字符,
        //那么这次返回值将作为下一次插入时的last
    }
    

    加入返回值是方便记录 lastlast

    接下来解释一下这两个特判的具体含义:

    (特判1)
    if(trans[last][ch]&&maxlen[last]+1==maxlen[trans[last][ch]])return trans[last][ch];
    
    (特判2)
    if(maxlen[p]+1==maxlen[z]/*或者写:p==last*/)flag=1;
    

    (因为小括号反复嵌套看起来比较头疼,下面直接用方括号表示数组)

    特判 11 比较好理解,我们想要在 lastlast 后面插入一个节点 zz 使得 maxlen[z]=maxlen[last]+1maxlen[z]=maxlen[last]+1,而这个节点已经存在于SAM\text{SAM} 中了,那么就可以直接返回。

    注意:这里返回的这个节点保存了多个模式串的状态,即将多个不同模式串的相同子串信息压缩在了这一个节点内,如果要记录 {endpos}\{endpos\} 大小的话,则需要给每个模式串都单独维护一个 sizsiz 数组依次更新,而不能全部揉成一坨(具体见后面例题)。

    特判 22 的实质是处理 trans[last][ch]NULLtrans[last][ch]\neq NULLmaxlen[last]+1maxlen[trans[last][ch]]maxlen[last]+1\neq maxlen[trans[last][ch]] 的情况。

    我们先来看看单串 SAM\text{SAM}insertinsert 图示(来源于 hihocoder\text{hihocoder}):

    在从 lastlast 开始往前跳 linklink 时,单串 SAM\text{SAM} 中必定存在着 trans[p][ch]=NULLtrans[p][ch]=NULL 的一段(在图中表现为以 uu 节点结尾的最右边那一段),但扩展到多串后可能就没有这一段了,即存在 trans[last][ch]=xtrans[last][ch]=x maxlen[last]+1maxlen[x]maxlen[last]+1\neq maxlen[x](对于 maxlen[last]+1=maxlen[x]maxlen[last]+1=maxlen[x] 的情况在特判 11 时就返回了)。

    显然,此时 没有任何节点的转移函数 transtrans 或后缀链接 linklink 指向最初新建的 zz 节点,同时 它没有记录任何信息,因为 新加入的信息全部储存在了 link[z]=ylink[z]=y 节点上面(即从 xx 中拆分出来的那个点)。也就是说,这个 zz 节点是一个空节点

    (注:下面这段话的意义不大,而且可能会看得一脸懵逼,可以直接略过)
    额外思考:其实上述内容并不是产生空节点 zz 的唯一情况。
    如果 SAM\text{SAM} 已经被空节点污染,且对于前面 trans[p][ch]=NULLtrans[p][ch]=NULL 的段 pp 均为空节点,那么此时 zz 也一定为空。
    比如这个数据 dcab ab,在插入串 abab 的第二个字符 bb 时,lastlast 为上一次 insert(a)insert(a) 时产生的空节点 66,而 66 目前还不存在 transtrans 边(即trans[last=6][ch=b]=NULLtrans[last=6][ch=b]=NULL),但此时新建的 zz(即 88 号节点)仍为空,且之前的空节点 66 有一条指向 88transtrans 边。具体可自行画图加深理解。
    (请到下方例题处抱走std,然后使用代码输出自动机的边再画到纸上,最好把加/不加特判最终产生的各种形态都试一下看看。但不推荐自己模拟绘图,因为工作量大且极易出错)

    回到空节点的问题,一般来讲,这个点不会对答案造成影响,但也有办法能卡掉,具体见下方【关于如何卡掉盗版在线写法】。

    另外,我们也可以用 minlen,maxlenminlen,maxlen 的大小来推导出 zz 为空:

    zzlinklink 会指向 xx拆分节点 yy,而 maxlen[y]=maxlen[last]+1maxlen[y]=maxlen[last]+1,所以 minlen[z]=maxlen[link[z]=y]+1=maxlen[last]+2minlen[z]=maxlen[link[z]=y]+1=maxlen[last]+2,又有 maxlen[z]=maxlen[last]+1<minlen[z]maxlen[z]=maxlen[last]+1<minlen[z],而一个等价类维护的子串长度 [minlen,maxlen]\in [minlen,maxlen],故 zz 为空。

    从另一个角度看,节点 yy 满足 trans[last][ch]=ytrans[last][ch]=ymaxlen[y]=maxlen[last]+1maxlen[y]=maxlen[last]+1,这不正是我们想要的吗(同特判 11)?所以可以返回 yy,并用 yy 作为当前模式串下一次 insertinsertlastlast

    还剩下最后一个问题:前面说的这两个特判能正确地合并好等价类,但没有处理空节点 zz 。为使构造出的自动机节点数与离线做法一致,我们还需进一步改进:当存在 trans[last][ch]trans[last][ch] 时就不新建 zz 节点了,直接从拆分节点开始做(或者在拆分节点之前通过特判 11 返回)。

    代码最终版如下(这次可以打包票说是标准写法了,因为测试了大量的数据,生成的自动机节点个数均与离线 bfs\text{bfs} 做法相同):

    inline int insert(Re ch,Re last){
        if(trans[last][ch]){
            Re p=last,x=trans[p][ch];
            if(maxlen[p]+1==maxlen[x])return x;//即最初的特判1
            else{
                Re y=++O;maxlen[y]=maxlen[p]+1;
                for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                link[y]=link[x],link[x]=y;
                return y;//即最初的特判2
            }
        }
        Re z=++O,p=last;maxlen[z]=maxlen[last]+1;//从这里开始就与普通SAM一毛一样了
        while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
        if(!p)link[z]=1;
        else{
            Re x=trans[p][ch];
            if(maxlen[p]+1==maxlen[x])link[z]=x;
            else{
                Re y=++O;maxlen[y]=maxlen[p]+1;
                for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                link[y]=link[x],link[z]=link[x]=y;
            }
        }
        return z;
    }
    

    这里补充下图片,模拟最终版代码构造过程中特判 22 的运作:

    SAM\text{SAM} 根为 11,转移函数 transtrans 为黑边,后缀链接 linklink 为灰边;图片上半部分为串 aabaab 构造结束后的形态,下半部分为插入串 abab 中第二个字符 bb 时的形态变换过程)

    如前面黑体字所说,一个节点可能会储存多个字符串的信息,比如节点 22 :虽然表示的子串都为 {a}\{a\},但 {endpos}\{endpos\} 大小却不相同(sizaab(2)=2,sizab(2)=1siz_{aab}(2)=2,siz_{ab}(2)=1),需要对每个字符串分别记录。

    疑问:在线写法和离线写法有什么不同呢?
    见后文4.【离线写法再探】。

    3.【关于如何卡掉盗版在线写法】

    这里讨论不加特判的在线写法。

    通常情况下,这种写法只是多了一些节点,多了一些 transtrans 边和 linklink 边,它仍是一只正确的自动姬,复杂度也依旧为线性(所以盗版写法才会横行啊......)。
    但这样显然就不符合 SAM\text{SAM}用最少的节点储存所有串信息”这一性质了,具体地说,有以下两种情况:

    • 一个等价类被拆成若干个节点,子串信息被分散。

    • 出现空节点(即 zz)。

    已知后者会在某些情况下产生影响,前者还有待探讨。

    截止 2020.8.132020.8.13,我只找到了两种方案(没有写代码逐个测试,如果您认为分析有误,最好给一下代码和 hack\text{hack}数据说明)。

    先来罗列一下空节点 zz 的性质:

    • (1)(1)transtrans 边指向的节点也一定是空节点(zz 本身就为空了,继续加字符是没有意义的)。

    • (2)(2)linklink 指向 yy,且没有节点的 linklink 指向 zz,故 zzparentparent 树上是叶子节点。

    • (3)(3) maxlen[z]=maxlen[last]+1=maxlen[y],maxlen[z]=maxlen[last]+1=maxlen[y], minlen[z]=maxlen[z]+1minlen[z]=maxlen[z]+1(由 linklink 边的指向推导得到)。

    • (4)(4) 在新建节点时,zzyy 先出现,所以节点编号 z<yz<y

    【方案 1】

    【这里】 因为 pospos 映射到了空节点导致查询 sizsiz 出错。

    这个很好理解,原本某个前缀串应该匹配到 yy 节点处,查询 sizsiz 也应查 yy,但实际的 pospos 却映射到了 zz 处(insertinsert 函数返回值是 zz),而原本应统计的是 yy 子树内 sizsiz 之和,显然会出错。

    如果加了特判 22 则会避免出现这种情况。或者建好自动机后再把所有串拿出来跑匹配记录 pos\text{pos}

    【方案 2】

    【这里】 提到了空节点影响基拍顺序

    这种方案应该是可行的(评论里 alpha1022\text{alpha1022} 也曾提出过这个问题,但当时我没想清楚)。

    具体地说,通常姬排是依靠 maxlenmaxlen 来求出 parentparent 树的拓扑序,maxlenmaxlen 较小的排在前面,然后依次从后往前扫并统计 sizsiz,代码大概是酱紫的:

    for(Re i=1;i<=O;i++)++cnt[maxlen[i]];
    for(Re i=1;i<=O;i++)cnt[i]+=cnt[i-1];
    for(Re i=1;i<=O;i++)Q[cnt[maxlen[i]]--]=i;
    for(Re i=O;i>=1;--i)siz[link[Q[i]]]+=siz[Q[i]];
    

    如果出现了空节点 zz,由于 maxlen[z]=maxlen[y]maxlen[z]=maxlen[y]z<yz<y,在稳定排序下 zz 会排到 yy 的前面。也就是说,zz 的那个 sizsiz 还没有统计到 yy 头上时, yy 就已经用自己的 sizsiz 去更新别人了,这样的后果就是 yyparentparent 树上的祖先节点 sizsiz 都会少 11(这些都是理论分析,不敢说自己完全正确,但有 ICPC\text{ICPC} 那题的例子,应该能实锤)。

    4.【离线写法再探】

    661515 日,ix35\text{ix35} 发布了一篇讨论:悲惨故事 长文警告 关于广义 SAM\text{SAM} 的讨论,在文中提到我的离线写法的错误。当时的我刚高考完,实在是没有心情也没有实力去思考这个问题。

    时至今日,受 Prean\text{Prean} 提醒,我回过头来重拾研究,发现 ix35\text{ix35} 说的是离线 dfs\text{dfs} 写法有问题(评论区也有人提到)。

    我用她给出的数据 iod od进行了测试,发现离线 bfs\text{bfs} 的确是对的,离线 dfs\text{dfs} 有误。

    这里产生了两个问题:
    1.为什么离线 dfs\text{dfs} 有误。
    2.为什么离线 bfs\text{bfs} 没有问题?或者说,实际上有问题但我没有发现?

    (1).【离线 dfs 为何有误】

    注意到 iodod 这两个串没有公共前缀,也就是说,trie\text{trie} 建了个寂寞,在 dfs\text{dfs} 遍历 trie\text{trie} 树的时候,实际上和最开始提到的那个主流写法 (2)\text{(2)} 是一样的(仅针对这种"建了个寂寞"的情况)。
    于是,它看起来就像是一个没有特判 11 也没有特判 22 的在线写法。产生空节点 z\text{z} 也就不难理解了(仅在这种"建了个寂寞"的情况)。
    回顾前文,在讲空节点产生的时候,用的例子是 dcab ab,这个数据和iod od 本质一样。

    (注:以下用“情况 22”代指前面在线写法中特判 22 所针对的特殊情况)

    额外思考: 考虑这里iod od产生的“情况 22”的原因是:开始插入 od 的第一个字母'o'时,lastlast 为根节点 11,此时产生了情况 22
    那么,如果有公共前缀呢?
    举个例子:aiod aod,你会发现此时 dfs\text{dfs} 是正确的(SAM\text{SAM} 结构和离线 bfs\text{bfs} 以及在线写法都一样),这是因为插入第二个串的字符'o'时,trans[last=pos[a]][o]=NULLtrans[last=pos[a]][o]=NULL(这里的 aa 指的是字符'a'所对应的 Trie\text{Trie} 点 )。 由此自然提出一个猜想: 猜想 11:存在公共前缀的两个串在建 SAM\text{SAM} 时不会在某个位置出现情况 22,此时 dfs\text{dfs} 写法正确。
    不过,该猜想随便写一个暴力对拍就能轻松 hack\text{hack}
    反例:ood od(与前面提到的aab ab本质一样)。

    这个反例告诉我们一件事情:情况 22 在离线 dfs\text{dfs} 写法中普遍存在。

    【如何改进?】

    显然我们可以把在线写法里的最终版 insertinsert 直接搬过来。这样做当然是正确的,但是,由这里 “它看起来就像是个没有特判 11、特判 22 的在线写法” 得到启发,我们应该注意到一个很有意思的点:
    猜想 22:在线写法中的特判 11,对应着离线写法中的 Trie\text{Trie} 结构建造。也就是说,只加特判 11 的在线写法和不加任何特判的离线 dfs\text{dfs} 写法类似。(事实上这一直觉是正确的,具体证明见后文)

    注:换句话说,离线 dfs\text{dfs} 其实是介于“离线 bfs\text{bfs}/最终版在线”和“未加任何特判的在线”之间的一种折中写法,一种“特判不全的在线”,它解决了特判 11 的情况(实现 Trie\text{Trie} 结构意义上的压缩节点),但没有解决特判 22 的情况(多串 SAM\text{SAM} 结构中空节点的压缩)。

    这样我们就理解了离线 dfs\text{dfs} 的本质,只需要加特判 22 就可以了,特判 11 是没有意义的(Trie\text{Trie} 结构已经预处理好了)。

    (当然,这只是解决了正确性的问题,复杂度肯定还是不如 bfs\text{bfs} 的)

    离线 dfs\text{dfs} 代码改进版如下:

    inline int insert(Re ch,Re last){//普通SAM添加特判2 
        if(trans[last][ch]){//不存在特判1的情况 
            Re p=last,x=trans[p][ch];
            Re y=++O;maxlen[y]=maxlen[p]+1;
            for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
            while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
            link[y]=link[x],link[x]=y;
            return y;//即最初的特判2
        }
        Re x,y,z=++O,p=last;maxlen[z]=maxlen[last]+1;
        while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
        if(!p)link[z]=1;
        else{
            x=trans[p][ch];
            if(maxlen[p]+1==maxlen[x])link[z]=x;
            else{
                y=++O;maxlen[y]=maxlen[p]+1;
                for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                link[y]=link[x],link[z]=link[x]=y;
            }
        }
        return z;
    }
    

    (2).【bfs 为何正确】

    bfs\text{bfs} 代码也是使用的普通 insertinsert,没加任何特判,为什么它就没有像 dfs\text{dfs} 那样出问题呢?

    关于特判 11 的情况,前面已经讨论过,由 Trie\text{Trie} 结构所解决。

    关于情况 22
    先说一下两个记号表达:
    deep(a)deep(a)Trie\text{Trie}aaTrie\text{Trie} 树上的深度。
    SrootTrie>aS_{root_{Trie}->a}:从 Trie\text{Trie} 树根 rootTrieroot_{Trie}Trie\text{Trie}aa 这一条长为 deep(a)deep(a) 的路径所表示的字符串(即 aaTrie\text{Trie} 上的前缀字符串)。

    引理:对于任何 Trie\text{Trie}aa,一定有 maxlen[pos[a]]=deep(a)maxlen[pos[a]]=deep(a)
    证明
    maxlen[pos[a]]<deep(a)maxlen[pos[a]]<deep(a) 显然不可能,因为 pos[a]pos[a] 这个等价类一定包含 SrootTrie>aS_{root_{Trie}->a},而 SrootTrie>a=deep(a)|S_{root_{Trie}->a}|=deep(a)
    假设 maxlen[pos[a]]>deep(a)maxlen[pos[a]]>deep(a),也就是说,有另一点 bbdeep(b)>deep(a)deep(b)>deep(a)SrootTrie>bS_{root_{Trie}->b} 也在该等价类中,即 pos[b]=pos[a]pos[b]=pos[a]
    但是,我们使用的是普通 insertinsert 代码,每一个 aa 对应的 pos[a]pos[a] 都是新建的点,所以 pos[a]pos[a] 不可能等于 pos[b]pos[b]
    故假设不成立

    bfs\text{bfs} 的特点是一层一层遍历,存在这样一个性质:当前 Trie\text{Trie}aa 的深度 deep(a)=deep(faTrie(a))+1deep(a)=deep(fa_{Trie}(a))+1 为目前所遍历过的最深的深度。
    在准备将 Trie\text{Trie}aa 插入 SAM\text{SAM} 的时,lastlastpos[faTrie(a)]pos[fa_{Trie}(a)]
    此时一定有如下结论:

    结论trans[last][ch]=NULLtrans[last][ch]= NULL
    证明假设存在 x=trans[last][ch]NULLx=trans[last][ch]\neq NULL,则有 maxlen[x]>maxlen[last]maxlen[x]> maxlen[last](转移边指出去的点的长度不可能小于等于自身)。
    又由引理得:maxlen[x]>maxlen[last]=deep(faTrie(a))maxlen[x]> maxlen[last]=deep(fa_{Trie}(a)) ——①
    在等价类 xx 中取最长的那个字符串 smaxlen(x)s_{maxlen}(x)Trie\text{Trie} 上对应的末节点 aa'(显然 smaxlen(x)s_{maxlen}(x) 就是 SrootTrie>aS_{root_{Trie}->a'}),有 pos[a]=xpos[a']=x
    由引理及①得:$deep(a')=maxlen[pos[a']]=maxlen[x]>deep(fa_{Trie}(a))$,
    则必满足 maxlen[x]=deep(a)=deep(faTrie(a))+1maxlen[x]=deep(a')=deep(fa_{Trie}(a))+1 ——②(目前最深的点深度只能是这么大),
    所以 deep(a)=deep(a)deep(a')=deep(a)
    注意我们是沿着 SrootTrie>faTrie(a)S_{root_{Trie}->fa_{Trie}(a)} 的每一个字符在自动机上一路走到 lastlast 的,smaxlen(last)s_{maxlen}(last) 即为 SrootTrie>faTrie(a)S_{root_{Trie}->fa_{Trie}(a)},且字符串 SS=smaxlen(last)+chSS=s_{maxlen}(last)+ch 必定在等价类 xx 中。
    这里的 SSSS 实际上等于 SrootTrie>aS_{root_{Trie}->a},所以 SS=deep(a)=deep(a)=SrootTrie>a|SS|=deep(a)=deep(a')=|S_{root_{Trie}->a'}|,由于字符串 SrootTrie>aS_{root_{Trie}->a'} 也在该等价类中,所以 SrootTrie>a=SS=SrootTrie>aS_{root_{Trie}->a'}=SS=S_{root_{Trie}->a}(同一等价类里一种长度只对应一种字符串)。
    由于此时 aa 目前还在准备插入阶段,实际还没有对应的 SAM\text{SAM} 的点,所以 aa' 与 a 为不同的 Trie\text{Trie} 点。也就是说,Trie\text{Trie} 树上出现了两个不同的点对应着完全相同的前缀字符串,这是 Trie\text{Trie} 结构所不允许的。
    故假设不成立
    另外,由引理及②可得 maxlen[x]=deep(faTrie(a))+1=maxlen[last]+1maxlen[x]=deep(fa_{Trie}(a))+1=maxlen[last]+1,发现我们的假设其实就是特判 11 所判断的情况。
    所以,前文所说的“特判 11Trie\text{Trie} 结构所解决”也得到了证明

    由此证明离线 bfs\text{bfs} 不需要写上述两个特判。

    四:【广义SAM的复杂度】

    T|T|Trie\text{Trie} 树大小,A|A| 为字符集大小(可视为常数),G(T)G(T)Trie\text{Trie} 树所有叶节点深度之和。

    • 状态数(节点数)为线性 O(2T)O(2|T|)

    • 转移函数(边数)上界为 O(TA)O(|T||A|)

    • 离线时间复杂度为 O(TA+T)O(|T||A|+|T|)

    • 在线时间复杂度为 O(TA+G(T))O(|T||A|+G(T))

    上述性质在刘研绎的论文都中有严谨证明,这里不赘述。

    有趣的是,实际运行效率在线构造(即使是不够侑秀的写法)要比离线快得多。

    五:【例题】

    (由于代码较多,可能会显得较冗长,但广义 SAM\text{SAM} 的写法具有争议,在各种题目中都能见到一些奇怪的做法,所以我还是把代码放出来供大家参考一下)

    1.【广义 SAM 模板】

    传送门:【模板】广义后缀自动机(广义 SAM\text{SAM}[P6139]\text{[P6139]}

    【题目描述】

    求多个字符串的本质不同子串个数。

    【分析】

    随便选一种方式建好自动机,答案为:maxlen[i]maxlen[link[i]]\sum maxlen[i]-maxlen[link[i]]

    【Code (离线)】

    #include<algorithm>
    #include<cstdio>
    #include<queue>
    #define Re register int
    #define LL long long
    using namespace std;
    const int N=2e6+5,M=1e6+3;
    int n,t;char ch[N];
    inline void in(Re &x){
        int fu=0;x=0;char c=getchar();
        while(c<'0'||c>'9')fu|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=fu?-x:x;
    }
    struct Trie{
        int O,c[M],fa[M],tr[M][26];
        //fa[x]: Trie树上x的父节点
        //c[x]: Trie树上x的颜色
        Trie(){O=1;}//根初始化为1
        inline void insert(char ch[]){
            Re p=1;
            for(Re i=1;ch[i];++i){
                Re a=ch[i]-'a';
                if(!tr[p][a])tr[p][a]=++O,fa[O]=p,c[O]=a;
                p=tr[p][a];
            }
        }
    }T1;
    struct Suffix_Automaton{
        int O,pos[N],link[N],maxlen[N],trans[N][26];queue<int>Q;
        //pos[x]:Trie上的x节点(路径1->x所表示的字符串)在SAM上的对应节点编号
        //link[i]: 后缀链接
        //trans[i]: 状态转移数组
        Suffix_Automaton(){O=1;}//根初始化为1
        inline int insert(Re ch,Re last){//和普通SAM一样
            Re x,y,z=++O,p=last;maxlen[z]=maxlen[last]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])link[z]=x;
                else{
                    y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[z]=link[x]=y;
                }
            }
            return z;
        }
        inline void build(){//bfs遍历Trie树构造广义SAM 
            for(Re i=0;i<26;++i)if(T1.tr[1][i])Q.push(T1.tr[1][i]);//插入第一层字符
            pos[1]=1;//Tire树上的根1在SAM上的位置为根1
            while(!Q.empty()){
                Re x=Q.front();Q.pop();
                pos[x]=insert(T1.c[x],pos[T1.fa[x]]);//注意是pos[Trie->fa[x]]
                for(Re i=0;i<26;++i)if(T1.tr[x][i])Q.push(T1.tr[x][i]);
            }
        }
        inline void sakura(){
            LL ans=0;
            for(Re i=2;i<=O;++i)ans+=maxlen[i]-maxlen[link[i]];
            printf("%lld\n",ans);
        }
    }SAM;
    int main(){
    //    freopen("123.txt","r",stdin);
        in(n);
        for(Re i=1;i<=n;++i)scanf("%s",ch+1),T1.insert(ch);
        SAM.build(),SAM.sakura();
    }
    

    【Code (在线)】

    #include<algorithm>
    #include<cstdio>
    #include<queue>
    #define Re register int
    #define LL long long
    using namespace std;
    const int N=2e6+5;
    int n;char ch[N];
    inline void in(Re &x){
        int fu=0;x=0;char c=getchar();
        while(c<'0'||c>'9')fu|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=fu?-x:x;
    }
    struct Suffix_Automaton{
        int O,link[N],maxlen[N],trans[N][26];
        //link[i]: 后缀链接
        //trans[i]: 状态转移数组
        Suffix_Automaton(){O=1;}//根初始化为1
        inline int insert(Re ch,Re last){
            if(trans[last][ch]){
                Re p=last,x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])return x;//即最初的特判1
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[x]=y;
                    return y;//即最初的特判2
                }
            }
            Re z=++O,p=last;maxlen[z]=maxlen[last]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                Re x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])link[z]=x;
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[z]=link[x]=y;
                }
            }
            return z;
        }
        inline void sakura(){
            LL ans=0;
            for(Re i=2;i<=O;++i)ans+=maxlen[i]-maxlen[link[i]];
            printf("%lld\n",ans);
        }
    }SAM;
    int main(){
    //    freopen("123.txt","r",stdin);
        in(n);
        for(Re i=1;i<=n;++i){
            scanf("%s",ch+1);Re last=1;
            for(Re j=1;ch[j];++j)last=SAM.insert(ch[j]-'a',last);
        }
        SAM.sakura();
    }
    

    2.【分别维护不同串的 siz】

    传送门:找相同字符 [P3181]\text{[P3181]}

    【题目描述】

    求两个字符串的相同子串数量。

    【分析】

    如上黑体字所说,两个串的 endpos|endpos| 要分开计算,可以开一个二维数组,用 siz[x][id]siz[x][id] 表示节点 xx 在串 idid 上的 {endpos}\{endpos\} 大小。

    则答案为:$\sum siz[i][0]\times siz[i][1]\times (maxlen[i]-maxlen[link[i]])$ 。

    【Code (离线)】

    sizsiz 用离线做法貌似会麻烦一点,要在 Trie\text{Trie} 树上记录不同字符串的信息,等啥时候心情好了有空了再回来填坑吧。

    【Code (在线)】

    #include<algorithm>
    #include<cstdio>
    #include<queue>
    #define Re register int
    #define LL long long
    using namespace std;
    const int N=8e5+5;
    char ch[200003];LL ans;
    inline void in(Re &x){
        int fu=0;x=0;char c=getchar();
        while(c<'0'||c>'9')fu|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=fu?-x:x;
    }
    struct Suffix_Automaton{
        int O,ru[N],link[N],maxlen[N],siz[N][2],trans[N][26];queue<int>Q;
        //siz[x]: |endpos[x]| 即节点x的endpos大小
        Suffix_Automaton(){O=1;}
        inline int insert(Re ch,Re last,Re id){
            if(trans[last][ch]){
                Re p=last,x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x]){siz[x][id]=1;return x;} 
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[x]=y;
                    siz[y][id]=1;return y;
                }
            }
            Re z=++O,p=last;maxlen[z]=maxlen[last]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                Re x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])link[z]=x;
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[z]=link[x]=y;
                }
            }
            siz[z][id]=1;
            return z;
        }
        inline void sakura(){
            for(Re i=2;i<=O;++i)++ru[link[i]];
            for(Re i=1;i<=O;++i)if(!ru[i])Q.push(i);
            while(!Q.empty()){
                Re x=Q.front();Q.pop();
                siz[link[x]][0]+=siz[x][0];//分开更新
                siz[link[x]][1]+=siz[x][1];
                if(!(--ru[link[x]]))Q.push(link[x]);
            }
            for(Re i=2;i<=O;++i)//统计答案
                ans+=(LL)siz[i][0]*siz[i][1]*(maxlen[i]-maxlen[link[i]]);
            printf("%lld\n",ans);
        }
    }SAM;
    int main(){
    //    freopen("123.txt","r",stdin);
        for(Re i=0;i<2;++i){
            scanf("%s",ch+1);Re last=1;
            for(Re j=1;ch[j];++j)last=SAM.insert(ch[j]-'a',last,i);
        }
        SAM.sakura();
    }
    

    3.【线段树合并维护 siz】

    传送门:Forensic Examination\text{Forensic Examination} [CF666E]\text{[CF666E]}

    【题目描述】

    给出主串 SS 以及 mm 个字符串 T[1..m]T[1..m] 。有若干次询问,每次查询 SS 的子串 S[pl..pr]S[p_l..p_r]T[l..r]T[l..r] 中的哪个串 TiT_{i} 里的出现次数最多,输出 ii 以及出现次数,有多解则取最靠前的那一个。

    【分析】

    先把所有字符串都插入到广义 SAM\text{SAM} 中,对于每个节点开一颗下标为 [1,m][1,m] 的动态开点线段树维护 sizsiz(注意插入 SS 时就不要在线段树上进行修改操作了)。由于 sizsiz 的维护是统计子树和,所以插入结束后要在 parentparent 树上跑一下线段树合并。

    查询时先在 parentparent 树上倍增找到包含子串 S[pl,pr]S[p_l,p_r] 的等价类状态节点,然后在该点的线段树上查询区间 [l,r][l,r] 中的最大值,顺便维护下最大值所处位置即可。

    【Code (离线)】

    同上,需要记录 sizsiz 的离线做法先咕着。

    【Code (在线)】

    #include<algorithm>
    #include<iostream>
    #include<cstring>
    #include<cstdio>
    #include<string>
    #define LL long long
    #define Re register int
    using namespace std;
    const int N=5e5+3,M=5e4+3,logN=21;
    int n,m,x,y,l,r,T,pos[N];char s[N],ch[M];
    inline void in(Re &x){
        int f=0;x=0;char c=getchar();
        while(c<'0'||c>'9')f|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=f?-x:x;
    }
    struct QWQ{
        int x,id;QWQ(Re X=0,Re ID=0){x=X,id=ID;}
        inline bool operator>(const QWQ &O)const{return x!=O.x?x>O.x:id<O.id;}
    };
    inline QWQ max(QWQ A,QWQ B){return A>B?A:B;}
    int pt[N+M<<1];
    struct Segment_Tree{
        #define pl (tr[p].lp)
        #define pr (tr[p].rp)
        #define mid ((L+R)>>1)
        int O;
        struct QAQ{int lp,rp;QWQ ans;}tr[(M<<1)*30];
        inline void pushup(Re p){
            tr[p].ans=max(tr[pl].ans,tr[pr].ans);
        }
        inline void change(Re &p,Re L,Re R,Re x){
            if(!p)p=++O;
            if(L==R){++tr[p].ans.x,tr[p].ans.id=L;return;}
            if(x<=mid)change(pl,L,mid,x);
            else change(pr,mid+1,R,x);
            pushup(p);
        }
        inline int merge(Re p,Re q,Re L,Re R){
            if(!p||!q)return p+q;
            Re x=++O;
            if(L==R){tr[x]=tr[p],tr[x].ans.x+=tr[q].ans.x;return x;}
            tr[x].lp=merge(pl,tr[q].lp,L,mid);
            tr[x].rp=merge(pr,tr[q].rp,mid+1,R);
            pushup(x);return x;
        }
        inline QWQ ask(Re p,Re L,Re R,Re l,Re r){
            if(!p)return QWQ(0,m+1);
            if(l<=L&&R<=r)return tr[p].ans;
            QWQ ans=QWQ(0,m+1);
            if(l<=mid)ans=max(ans,ask(pl,L,mid,l,r));
            if(r>mid)ans=max(ans,ask(pr,mid+1,R,l,r));
            return ans;
        }
    }TR;
    struct Suffix_Automaton{
        int O,link[N+M<<1],maxlen[N+M<<1],trans[N+M<<1][26];
        Suffix_Automaton(){O=1;}
        inline int insert(Re ch,Re last,Re id){
            if(trans[last][ch]){
                Re p=last,x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x]){if(id)TR.change(pt[x],1,m,id);return x;}
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[x]=y;
                    if(id)TR.change(pt[y],1,m,id);
                    return y;
                }
            }
            Re z=++O,p=last;maxlen[z]=maxlen[p]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                Re x=trans[p][ch];
                if(maxlen[x]==maxlen[p]+1)link[z]=x;
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<26;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[x]=link[z]=y;
                }
            }
            if(id)TR.change(pt[z],1,m,id);
            return z;
        }
        int o,deep[N+M<<1],head[N+M<<1],ant[N+M<<1][23];
        struct QAQ{int to,next;}a[N+M<<1];
        inline void add(Re x,Re y){a[++o].to=y,a[o].next=head[x],head[x]=o;}
        inline void dfs(Re x,Re fa){
            deep[x]=deep[ant[x][0]=fa]+1;
            for(Re i=1;(1<<i)<=deep[x];++i)ant[x][i]=ant[ant[x][i-1]][i-1];
            for(Re i=head[x],to;i;i=a[i].next)
                dfs(to=a[i].to,x),pt[x]=TR.merge(pt[x],pt[to],1,m);
        }
        inline void build(){
            for(Re i=2;i<=O;++i)add(link[i],i);dfs(1,0);
        }
        inline int get(Re x,Re len){
            Re p=pos[x];
            for(Re i=logN;i>=0;--i)if(ant[p][i]&&maxlen[ant[p][i]]>=len)p=ant[p][i];
            return p;
        }
        inline void sakura(Re l,Re r,Re x,Re y){
            QWQ ans=TR.ask(pt[get(y,y-x+1)],1,m,l,r);
            if(ans.x==0)ans.id=l;
            printf("%d %d\n",ans.id,ans.x);
        }
    }SAM;
    int main(){
    //    freopen("123.txt","r",stdin);
        scanf("%s",s+1),n=strlen(s+1),in(m);
        for(Re i=1;i<=m;++i){
            scanf("%s",ch+1);Re last=1;
            for(Re j=1;ch[j];++j)last=SAM.insert(ch[j]-'a',last,i);
        }
        for(Re i=1,last=1;i<=n;++i)pos[i]=last=SAM.insert(s[i]-'a',last,0);
        SAM.build(),in(T);
        while(T--)in(l),in(r),in(x),in(y),SAM.sakura(l,r,x,y);
    }
    

    4.【树上本质不同路径数】

    传送门:诸神眷顾的幻想乡 [ZJOI2015] [P3346]\text{[ZJOI2015] [P3346]} [Bzoj3926]\text{[Bzoj3926]}

    【题目描述】

    给出一颗叶子结点不超过 2020 个的无根树,每个节点上都有一个不超过 1010 的数字,求树上本质不同的路径个数(两条路径相同定义为:其路径上所有节点上的数字依次相连组成的字符串相同)。

    【分析】

    首先有一个很麻烦的地方是路径可以拐弯(即两端点分别在其 lcalca 两个不同儿子节点的子树中),而 Trie\text{Trie} 树和各种自动机在“接受”字符串时都是以根为起点从上往下径直走到底(什么?跳 parentparent 树?你跳任你跳,跳完还是直的)

    所以要想办法把路径捋直,瞎 yyyy 可能不太容易想出来,这里直接抛结论:

    一颗无根树上任意一条路径必定可以在以某个叶节点为根时,变成一条从上到下的路径(利于广义 SAM\text{SAM} 的使用)。

    注意到题目中说叶节点不超过 2020 个,这意味着什么?

    暴力枚举每一个叶节点作为根节点遍历整棵树啊!

    将一共 cntleafcnt_{leaf} 颗树中的所有前缀串都抽出来建立广义 SAM\text{SAM},然后直接求本质不同的子串个数。 其中前缀串定义为从根节点(无根树的某个叶子结点)到任意一个节点的路径所构成的字符串(实际上就是将 cntleafcnt_{leaf}Trie\text{Trie} 树合在了一起跑广义 SAM\text{SAM})。

    注意数组大小和空间限制。

    【Code (离线)】

    (本题 Trie\text{Trie} 树的构造方法与其他相比较为特别)

    #include<algorithm>
    #include<cstring>
    #include<cstdio>
    #include<queue>
    #define Re register int
    #define LL long long
    using namespace std;
    const int N=4e6+5,N20=2e6+3,Nn=1e5+3;
    int n,m,o,x,y,t,C,du[Nn],co[Nn],head[Nn];LL ans;
    struct QAQ{int to,next;}a[Nn<<1];
    inline void add(Re x,Re y){a[++o].to=y,a[o].next=head[x],head[x]=o;}
    inline void in(Re &x){
        int fu=0;x=0;char c=getchar();
        while(c<'0'||c>'9')fu|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=fu?-x:x;
    }
    struct Trie{
        int O,c[N20],fa[N20],tr[N20][10];
        Trie(){O=1;}
        inline int insert(Re p,Re ch){//在p后面插入一个ch
            if(!tr[p][ch])tr[p][ch]=++O,c[O]=ch,fa[O]=p;
            return tr[p][ch];
        }
    }T1;
    struct Suffix_Automaton{    
        int O,pos[N],link[N],trans[N][10],maxlen[N];queue<int>Q;
        Suffix_Automaton(){O=1;}
        inline int insert(Re ch,Re last){
            Re x,y,z=++O,p=last;maxlen[z]=maxlen[last]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])link[z]=x;
                else{
                    y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<C;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[z]=link[x]=y;
                }
            }
            return z;
        }
        inline void build(){ 
            for(Re i=0;i<C;++i)if(T1.tr[1][i])Q.push(T1.tr[1][i]);
            pos[1]=1;
            while(!Q.empty()){
                Re x=Q.front();Q.pop();
                pos[x]=insert(T1.c[x],pos[T1.fa[x]]);
                for(Re i=0;i<C;++i)if(T1.tr[x][i])Q.push(T1.tr[x][i]);
            }
        }
        inline void sakura(){
            for(Re i=2;i<=O;++i)ans+=maxlen[i]-maxlen[link[i]];
            printf("%lld\n",ans); 
        }
    }SAM;
    inline void dfs(Re x,Re fa,Re fap){//遍历构造Trie树 
        Re xp=T1.insert(fap,co[x]);//记录在Trie树上的位置,方便下次直接使用
        for(Re i=head[x],to;i;i=a[i].next)
            if((to=a[i].to)!=fa)dfs(to,x,xp);
    }
    int main(){
    //  freopen("123.txt","r",stdin);
        in(n),in(C),m=n-1;
        for(Re i=1;i<=n;++i)in(co[i]);
        while(m--)in(x),in(y),add(x,y),add(y,x),++du[x],++du[y];
        for(Re i=1;i<=n;++i)if(du[i]==1)dfs(i,0,1);//依次把每个叶子节点作为根插入Trie树
        SAM.build(),SAM.sakura();
    }
    

    【Code (在线)】

    #include<algorithm>
    #include<cstring>
    #include<cstdio>
    #include<queue>
    #define Re register int
    #define LL long long
    using namespace std;
    const int N=4e6+5,N20=2e6+3,Nn=1e5+3;
    int n,m,o,x,y,t,C,du[Nn],co[Nn],head[Nn];LL ans;
    struct QAQ{int to,next;}a[Nn<<1];
    inline void add(Re x,Re y){a[++o].to=y,a[o].next=head[x],head[x]=o;}
    inline void in(Re &x){
        int fu=0;x=0;char c=getchar();
        while(c<'0'||c>'9')fu|=c=='-',c=getchar();
        while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
        x=fu?-x:x;
    }
    struct Suffix_Automaton{
        int O,link[N],trans[N][10],maxlen[N];
        Suffix_Automaton(){O=1;}
        inline int insert(Re ch,Re last){
            if(trans[last][ch]){
                Re p=last,x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])return x;
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<10;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[x]=y;
                    return y;
                }
            }
            Re z=++O,p=last;maxlen[z]=maxlen[last]+1;
            while(p&&!trans[p][ch])trans[p][ch]=z,p=link[p];
            if(!p)link[z]=1;
            else{
                Re x=trans[p][ch];
                if(maxlen[p]+1==maxlen[x])link[z]=x;
                else{
                    Re y=++O;maxlen[y]=maxlen[p]+1;
                    for(Re i=0;i<10;++i)trans[y][i]=trans[x][i];
                    while(p&&trans[p][ch]==x)trans[p][ch]=y,p=link[p];
                    link[y]=link[x],link[z]=link[x]=y;
                }
            }
            return z;
        }
        inline void sakura(){
            for(Re i=2;i<=O;++i)ans+=maxlen[i]-maxlen[link[i]];
            printf("%lld\n",ans); 
        }
    }SAM;
    inline void dfs(Re x,Re fa,Re fap){//遍历在线构造SAM
        Re xp=SAM.insert(co[x],fap);//记录x在SAM上的位置,方便下次直接使用
        for(Re i=head[x],to;i;i=a[i].next)
            if((to=a[i].to)!=fa)dfs(to,x,xp);
    }
    int main(){
    //  freopen("123.txt","r",stdin);
        in(n),in(C),m=n-1;
        for(Re i=1;i<=n;++i)in(co[i]);
        while(m--)in(x),in(y),add(x,y),add(y,x),++du[x],++du[y];
        for(Re i=1;i<=n;++i)if(du[i]==1)dfs(i,0,1);//依次把每个叶子节点作为根插入Trie树
        SAM.sakura();
    }
    

    5.【卡空间常数的例子(减少无用节点)】

    传送门:Cyclical Quest\text{Cyclical Quest} [CF235C]\text{[CF235C]}

    给出主串 SSnn 个询问串。对于每个询问串,求出它的所有循环同构在主串中的出现次数总和。

    做法见 题解 by asuldb\text{by asuldb}

    由于是暴力非正解,需要疯狂卡空间,如果使用在线做法不加特判 1,21,2(即之前列举出来的盗版做法)会喜获 MLE\text{MLE} 。加了特判但不处理无用节点 zz 可以 476Mb476Mb 的好成绩 AC\text{AC}。使用最终版代码当然也可以过,但多用了一丢丢空间,或许是评测姬波动?可 CF666E\text{CF666E} 亦是如此。可能.....无用 zz 的个数比较少吧.......

    六:【后记】

    初学时我在网上找了很久(当时傻乎乎的,看不懂论文),只发现了一篇细讲广义 SAM\text{SAM} 复杂度和正确性的博客(也就是这个),所以无条件相信了里面写的所有东西,并凭借本篇博客又误导了许多其他初学者,深感惭愧。

    我们嘤该学会独立思考,不要盲目相信别人博客里写的东西啊......(咳咳,本篇也不一定完全正确,若发现有误希望及时指正)

    七:【参考文献】

    • 1

    【模板】广义后缀自动机(广义 SAM)

    信息

    ID
    5173
    时间
    1000ms
    内存
    512MiB
    难度
    6
    标签
    递交数
    0
    已通过
    0
    上传者