2016年3月4日 星期五

[POJ 3415]Common Substrings (題解二)

請先參考題解一

上一篇有提到我們讓$B$在$A$的後綴自動機裡面進行轉移時,每走一步就要往失配邊回溯直到$max\_len<K$為止
那我們能不能把這個過程加速呢?

我們可以套用$O(\log N)$尋找$LCA$ ($Lowest\ Common\ Ancestor$) 的思想
考慮使用倍增的方法,我們對於每個點預先算好往失配邊走$1$步、走$2$步、走$4$步、走$8$步......會答案加多少
然後就可以盡量跨大步,同時維持$max\_len>=K$
這樣最多跨$\log\left|A\right|$步,形同在$O(\log\left|A\right|)$的時間複雜度內走完失配邊!
注意,還需要做一些加加減減的小細節才是要求的答案

預處理可以做到$O(\left|A\right|\log\left|A\right|)$
我的作法是先將所有失配邊反向形成的樹建出來,然後用$dfs$的方式以類似$LCA$的預處理方式算出需要的資料

這樣就做完了嗎?
好像還沒耶

注意到這裡的字元集大小是$52$ (題目沒說會全部小寫)!
這樣最多會需要$2*10^{5}*52$的時間和空間來初始化並建立後綴自動機
對這題的時限來說實在太大了

因此必須使用更省時間空間的方案
我自己實作了$list$

時間複雜度:$O(\left|A\right|\log\left|A\right|+\left|B\right|\log\left|A\right|)$

code:
#include<cstdio>
#include<vector>
#include<algorithm>
using namespace std;
const int MAX_EDGE=2000000;
void assert(bool valid){if(valid)return;for(;;);int *a=NULL;for(;;)delete a--;}
typedef long long LL;
struct SuffixAutomaton
{
    int HEAD[200000],NEXT[MAX_EDGE],VALUE[MAX_EDGE],NSZ;
    char CHAR[MAX_EDGE];
    int GREEN[200000],MAX_LEN[200000],COUNT[200000];
    int N;
    void Clear()
    {
        N=NSZ=0;
        NewNode(0);
    }
    void NewNode(const int max_len)
    {
        HEAD[N]=-1;
        GREEN[N]=-1,MAX_LEN[N]=max_len;
        COUNT[N]=0;
        N++;
    }
    int GetChild(const int u,const char c)
    {
        for(int cur=HEAD[u];cur!=-1;cur=NEXT[cur])if(CHAR[cur]==c)return VALUE[cur];
        return 0;
    }
    void AddChild(const int u,const char c,const int val)
    {
        NEXT[NSZ]=HEAD[u];
        HEAD[u]=NSZ;
        CHAR[NSZ]=c;
        VALUE[NSZ]=val;
        NSZ++;
    }
    bool SetChild(const int u,const char c,const int target_val,const int val)
    {
        for(int cur=HEAD[u];cur!=-1;cur=NEXT[cur])if(CHAR[cur]==c)
        {
            if(VALUE[cur]==target_val){VALUE[cur]=val;return true;}
            return false;
        }
        return false;
    }
    void Extend(int &last,const char c)
    {
        int cur=last;NewNode(MAX_LEN[last]+1);last=N-1;
        for(;cur!=-1&&!GetChild(cur,c);cur=GREEN[cur])AddChild(cur,c,last);
        if(cur==-1)GREEN[last]=0;
        else
        {
            const int pg=GetChild(cur,c);
            if(MAX_LEN[pg]==MAX_LEN[cur]+1)GREEN[last]=pg;
            else
            {
                NewNode(MAX_LEN[cur]+1);
                const int wish=N-1;
                for(;cur!=-1&&SetChild(cur,c,pg,wish);cur=GREEN[cur]);
                for(cur=HEAD[pg];cur!=-1;cur=NEXT[cur])AddChild(wish,CHAR[cur],VALUE[cur]);
                GREEN[wish]=GREEN[pg];
                GREEN[pg]=wish;
                GREEN[last]=wish;
            }
        }
        COUNT[last]++;
    }
    vector<int>ET[200000],PARENTS[200000];
    vector<LL>COSTS[200000];
    int DEPTH[200000];
    void BuildTree(const int u,const int parent,const int depth,int &counter)
    {
        counter++;
        DEPTH[u]=depth;
        PARENTS[u].clear(),COSTS[u].clear();
        if(parent!=-1)
        {
            int cur=parent;
            LL cost=(LL)COUNT[cur]*(MAX_LEN[cur]-(cur==0?-1:MAX_LEN[GREEN[cur]]));
            for(int i=0;;cost+=COSTS[cur][i],cur=PARENTS[cur][i],i++)
            {
                PARENTS[u].push_back(cur);
                COSTS[u].push_back(cost);
                if((1<<i)>DEPTH[cur])break;
            }
        }
        for(vector<int>::iterator nxt=ET[u].begin();nxt!=ET[u].end();nxt++)BuildTree(*nxt,u,depth+1,counter);
    }
    void Build(const char *str)
    {
        Clear();
        for(int i=0,u=0;str[i];i++)Extend(u,str[i]);
        for(int i=0;i<N;i++)ET[i].clear();
        for(int i=1;i<N;i++)ET[GREEN[i]].push_back(i);
        static int q[200000],l,r;l=0,r=-1;
        static int degree[200000];
        for(int i=0;i<N;i++)degree[i]=ET[i].size();
        for(int i=0;i<N;i++)if(!degree[i])q[++r]=i;
        while(l<=r)
        {
            const int u=q[l++];
            if(GREEN[u]!=-1)
            {
                COUNT[GREEN[u]]+=COUNT[u];
                if(!--degree[GREEN[u]])q[++r]=GREEN[u];
            }
        }
        for(int i=0;i<N;i++)assert(!degree[i]);
        int counter=0;
        BuildTree(0,-1,0,counter);
        assert(counter==N);
    }
    LL GetCostSum(int cur,const int max_len,const int low_limit)
    {
        if(max_len<low_limit)return 0;
        assert(GREEN[cur]!=-1);
        if(MAX_LEN[GREEN[cur]]<low_limit)return (LL)COUNT[cur]*(max_len-low_limit+1);
        LL ans=0;
        ans+=(LL)COUNT[cur]*(max_len-MAX_LEN[GREEN[cur]]);
        for(int i=30;i>=0;i--)if((1<<i)<=DEPTH[cur]&&MAX_LEN[PARENTS[cur][i]]>=low_limit)
        {
            ans+=COSTS[cur][i];
            cur=PARENTS[cur][i];
        }
        ans-=(LL)COUNT[cur]*((low_limit-1)-(MAX_LEN[GREEN[cur]]+1)+1);
        return ans;
    }
    LL Match(const char *str,const int low_limit)
    {
        LL ans=0;
        for(int i=0,u=0,len=0;str[i];i++)
        {
            while(u&&!GetChild(u,str[i]))u=GREEN[u],len=MAX_LEN[u];
            if((u=GetChild(u,str[i]))!=0)len++;
            ans+=GetCostSum(u,len,low_limit);
        }
        return ans;
    }
}SAM;
int K;
char A[100001],B[100001];
int main()
{
//    assert(0);
//    freopen("in.txt","r",stdin);
    while(scanf("%d",&K)==1&&K)
    {
        scanf("%s%s",A,B);
        SAM.Build(A);
        printf("%lld\n",SAM.Match(B,K));
    }
    return 0;
}

沒有留言:

張貼留言

歡迎留言或問問題~
若您的留言中包含程式碼,請參考這篇
如果留言不見了請別慌,那是因為被google誤判成垃圾留言,小莫會盡快將其手動還原

注意:只有此網誌的成員可以留言。