30.多项式与生成函数

多项式与生成函数

生成函数

母函数(又翻为生成函数),是求解递推关系巧妙的数学方法,他通过代数手段解决组合计数问题

先思考一个简单的问题:从数字 1,2,3,4 中取出一个或多个相加(每个数字最多只能用一次)能组合成几个数?每个数有几种组合?

image.png

我们构造一个多项式,把他展开

(1+x)(1+x2)(1+x3)(1+x4)=1+x+x2+2x3+2x4+2x5+2x6+2x7+x8+x9+x10

惊人的发现,每个数的组合数量和系数一样

母函数的作用就是这样:把组合问题的加法与幂级数的乘幂对应起来

普通母函数的定义:对于序列 h0,h1,h2,, 构造函数 g(x)=h0+h1x+h2x2,称 g(x) 为序列 h0,h1,h2, 的母函数

母函数的实质是无限可微分函数的泰勒计数,有:

11x=1+x+x2+11x2=1+x2+x4+

利用母函数的泰勒计数表达,有时可以简单的演算组合计数问题

在袋子中装 n 个水果,要求苹果是偶数个,香蕉数是 5 的倍数,句子最多 4 个,梨有 0 个或 1 个,给出 n,共有多少种情况?

写出生成函数:

g(x)=(1+x2+x4+)(1+x5+x10+)(1+x+x2+x3+x4)(1+x)=11x211x51x51x(1+x)=1(1x)2=k=0(n+1)xn

最后一步根据牛顿二项式定理得到

幂级数

形式幂级数之间可以有一些运算:

A(x)=i0aixi,B(x)=i0bixi

我们发现,乘法和多项式乘法有共同之处

形式幂级数

记形式幂级数(或多项式)A(x)xn 项的系数为 [xn]A(x)

形式幂级数的本质是序列,幂级数的本质是极限

形式幂级数的逆元

常见的逆:

形式幂级数的求导

假设 f(x)=a0+a1x+a2x2++anxn+

定义 f(x) 的导数为 a1+2a2x++(n+1)an+1xn+ 记作 f(x)df(x)dx

形式幂级数的积分

假设 f(x)=a0+a1x+a2x2++anxn+

定义 f(x) 的积分为 a0x+a12x2++an1nxn+ 记作 f(x)dx

形式幂级数的复合

假设 f(x)=a1x++anxn+g(x)=b0+b1x++bnxn+

g 复合 f 定义为 c0+c1x++cnxn+,满足 c0=b0,cn=k=1nbki1+i2++ik=nai1ai2aik,记为 g(f(x))

image-20241031172927051

形式幂级数的其他运算

image-20241031173838965

常生成函数

一个数列 {an} 对应的常数生成函数为 A(x)=n0anxn

例: 有两种物品,其中取 i 个第 1 种物品的方案数为 ai,取 j 个第二种物体的方案数为 bj,求取 k 个物体的方案数

A(x)=i0aixi,B(x)=j0bjxj

答案为 C(x)=A(x)B(x)

递推关系

斐波那契数列满足 a0=0,a1=1,an=an1+an2(n2),求其生成函数

A(x)=n0anxn

A(x)=a0+a1x+a2x2+=0+x+(a0+a1)x2+(a1+a2)x3++(an2+an1)xn+=x+(a1x2+a2x3+a3x4+)+(a1x3+a2x4+)=x+xA(x)+x2A(x)

解得 A(x)=x1xx2

我们可以通过这个常生成函数来求数列的第 n

把分数拆开,有:

A(x)=x1xx2=x(c1ax+d1bx)

那么: [xn]A(x)=can+dbn

上面的 a,b,c,d 可以使用待定系数法求解

指数生成函数

一个数列 {an} 对应的指数生成函数为 A(x)=n0anxnn!

有两个物体,其中取 i 个第 1 种物品的方案数为 ai,取 j 个第二种物体的方案数为 bj,求取 k 个物体并排成一列的方案数

A(x)=i0aixii!,B(x)=j0bjxjj!

ck=i=0k(ki)aibki=i=0kk!i!(ki)!aibkickk!=i=0kaii!bki(ki)!C(x)=A(x)B(x)

所以答案为 C(x)=A(x)B(x)

image.png

使用 exp 函数就可以实现生成函数之间的运算了,比如 exp(a)exp(b)=exp(a+b)

FFT

朴素多项式乘法,求逆,开根号等的复杂度为 O(n2)

FFT / NTT 可以 O(nlogn) 内实现两个 n 次多项式的乘积

多项式的表示形式

假设 f(x) 是一个 n 次多项式,则 f(x) 的系数表示为 f(x)=anxn+an1xn1++a0

f(x) 的点值表示为 (x0,f(x0)),(x1,f(x1)),,(xn,f(xn))

那么也就是说 n+1 个点值可以表示一个 n 次多项式

在点值表示下 n 次多项式的乘法复杂度为 O(n)

复数与单位根

复数的指数形式

a+bi=reiθ,其中 t=a2+b2tan(θ)=ba

单位根

xn=1 在复数域上的根称为 n 次单位根。n 次单位根有 n 个,形式为 wnk=ei2kπn

单位根的性质:

快速傅里叶变换

DFT(离散傅里叶变换)

将多项式 A(x)=a0+a1x++an1xn1 转化为其点值形式
(wnk,A(wnk)),(k=0,1,,n1)

这里如何求这个 A(wnk)=dk

这里有傅里叶变换的公式:

dk=i=0n1ai×wnik

由于这个式子是一个线性的,所以我们能写成矩阵的形式

(d0d1d2dn1)=(wn0×0wn0×1wn0×2wn0×(n1)wn1×0wn1×1wn1×2wn1×(n1)wn2×0wn2×1wn2×2wn2×(n1)wn(n1)×0wn(n1)×1wn(n1)×2wn(n1)×(n1))(a0a1a2an1)

但是我们暴力求 {d} 也是 O(n2) 的,现在考虑一种分治做法

我们有:A(x)=a0+a1x++an1xn1

A(x) 拆成奇数项和偶数项:A(x)=(a0+a2x2++an2xn2)+(a1x+a3x3+a5x5++an1xn1)

B(x)=a0+a2x++an2xn/21C(x)=a1+a3x++an1xn/21

A(x)=B(x2)+xC(x2)

A(wnk)=B(wn2k)+wnkC(wn2k)=B(wn/2k)+wnkC(wn/2k)

不妨把 k 减小 n/2 继续把 k 控制在 0k<n/2 的范围内

A(wnk+n/2)=B(wn2k+n)+wnk+n/2C(wn2k+n)=B(wn2k)+wnk+n/2C(wn2k)=B(wn/2k)+wnk+n/2C(wn/2k)=B(wn/2k)wnkC(wn/2k)

IDFT(逆离散傅里叶变换)

将多项式的点值表示 (wnk,bk), (k=0,1,,n1) 转化为其系数表示 A(x)=a0+a1x++an1xn1

我直接给出逆变换的公式 ai=1nk=0n1bkwnik

但是现在要思考如何理解这个公式

对于上面那个 DFT 的变换的矩阵

AΩ=D

现在相当于已知 ΩDA,那么只需要求出 Ω1 即可

尝试构造 Ω1,我们尝试共轭矩阵 Ω

ΩΩ=P=(wn0×0wn0×1wn0×2wn0×(n1)wn1×0wn1×1wn1×2wn1×(n1)wn2×0wn2×1wn2×2wn2×(n1)wn(n1)×0wn(n1)×1wn(n1)×2wn(n1)×(n1))(wn0×0wn0×1wn0×2wn0×(n1)wn1×0wn1×1wn1×2wn1×(n1)wn2×0wn2×1wn2×2wn2×(n1)wn(n1)×0wn(n1)×1wn(n1)×2wn(n1)×(n1))

观察答案矩阵 P 的第 i 行 第 i

P=k=0n1wni×kwnk×j=k=0n1wn(ij)×k

我们发现这是一个公差为 wnij 的等差数列求和,根据等差数列求和公式

k=0n1wn(ij)×k={n, i=j1(wnij)n1wnij=0, ij

得出答案矩阵为:

(n0000n0000n0000n)=nI

ΩΩ=nIΩ1=1nΩ

这样就可以求出 D=1nΩA,也就是我们上面的公式

ai=1nk=0n1bkwnik

现在我们已知了 DFT 和 IDFT 的公式,那么我们就可以进行 FFT 了

image.png

直接来看代码实现

首先,我们需要一个复数类,尽管 C++ 有复数类,常数太大了

struct Complex {
    double x, y;
    Complex (double x = 0, double y = 0) : x(x), y(y) {}
};

Complex operator + (Complex a, Complex b) { return Complex(a.x + b.x, a.y + b.y); }
Complex operator - (Complex a, Complex b) { return Complex(a.x - b.x, a.y - b.y); }
Complex operator * (Complex a, Complex b) { return Complex(a.x * b.x - a.y * b.y, a.x * b.y + a.y * b.x); }

递归实现 FFT

#include <bits/stdc++.h>
using namespace std;

const int MAXN = 1 << 22;
const double eps = 1e-6, pi = acos(-1);

complex<double> a[MAXN], b[MAXN], c[MAXN];
int n, m;

void FFT(complex<double> *a, int n, int inv) { // inv 为 1 时为 FFT, inv 为 -1 时为 IFFT
    if (n == 1) return;
    int mid = n >> 1;
    complex<double> A1[mid + 1], A2[mid + 1];
    for (int i = 0; i <= n; i += 2) {
        A1[i >> 1] = a[i];
        A2[i >> 1] = a[i + 1];
    }
    FFT(A1, mid, inv); FFT(A2, mid, inv);
    complex<double> w0(1, 0), wn(cos(2 * pi / n), inv * sin(2 * pi / n));
    for (int i = 0; i < mid; i++, w0 *= wn) {
        a[i] = A1[i] + w0 * A2[i];
        a[i + mid] = A1[i] - w0 * A2[i];
    }
}

int main() {
    scanf("%d %d", &n, &m);
    for (int i = 0; i <= n; i++) {double x; scanf("%lf", &x); a[i].real(x);}
    for (int i = 0; i <= m; i++) {double x; scanf("%lf", &x); b[i].real(x);}
    int len = 1 << max((int)ceil(log2(n + m)), 1); //由于FFT需要项数为2的整数次方倍,所以多项式的次数len为第一个大于 n+m 的二的正整数次方
    FFT(a, len, 1); FFT(b, len, 1);
    for (int i = 0; i < len; i++) c[i] = a[i] * b[i];
    FFT(c, len, -1);
    for (int i = 0; i <= n + m; i++)
        printf("%.0f ",(c[i].real() / len + eps));
    return 0;
}

蝴蝶变换

image-20241011235630473

观察原序列和后序列的二进制之后,惊奇的发现,其实际上就是把二进制翻转了,我们可以用 O(32n) 来实现

实际上可以用 O(n) 的递推式来实现,定义 R(n) 表示 n 二进制反转后对应的值,有递推式:

R(n)=R(n/2)+(n&1)×n2

通过这个递推式能求出 R(n)

void change(complex<double> A[], int n) {
    for (int i = 0; i < n; i++)
        R[i] = (R[i >> 1] >> 1) + ((i & 1) ? n >> 1 : 0);
    for (int i = 0; i < n; i++)
        if (i < R[i]) swap(A[i], A[R[i]]); // 只需要换一次
}

然后有了这个思路,就可以直接构造出最后一层的下标然后从下往上模拟递归合并的过程了

image.png
#include <bits/stdc++.h>
using namespace std;

const int MAXN = 1 << 22;
const double eps = 1e-6, pi = acos(-1);

complex<double> a[MAXN], b[MAXN], c[MAXN];
int R[MAXN];
int n, m;

void change(complex<double> A[], int n) {
    for (int i = 0; i < n; i++)
        R[i] = (R[i >> 1] >> 1) + ((i & 1) ? n >> 1 : 0);
    for (int i = 0; i < n; i++)
        if (i < R[i]) swap(A[i], A[R[i]]);
}

void FFT(complex<double> *a, int n, int inv) { // inv 为 1 时为 FFT, inv 为 -1 时为 IFFT
    change(a, n);
    for (int m = 2; m <= n; m <<= 1) {
        complex<double> w1(cos(2 * pi / m), inv * sin(2 * pi / m));
        for (int i = 0; i < n; i += m) {
            complex<double> wk(1, 0);
            for (int j = 0; j < m / 2; j++, wk *= w1) {
                auto x = a[i + j], y = wk * a[i + j + m / 2];
                a[i + j] = x + y; a[i + j + m / 2] = x - y;
            }
        }
    }
}

int main() {
    scanf("%d %d", &n, &m);
    for (int i = 0; i <= n; i++) {double x; scanf("%lf", &x); a[i].real(x);}
    for (int i = 0; i <= m; i++) {double x; scanf("%lf", &x); b[i].real(x);}
    int len = 1 << max((int)ceil(log2(n + m)), 1); //由于FFT需要项数为2的整数次方倍,所以多项式的次数len为第一个大于 n+m 的二的正整数次方
    FFT(a, len, 1); FFT(b, len, 1);
    for (int i = 0; i < len; i++) c[i] = a[i] * b[i];
    FFT(c, len, -1);
    for (int i = 0; i <= n + m; i++)
        printf("%.0f ",(c[i].real() / len + eps));
    return 0;
}

NTT

原根

欧拉定理

若正整数 m,a,满足 gcd(a,m)=1,则 aφ(n)1(modm)

若正整数 m,a,满足 gcd(a,m)=1,则 ak1(modm) 的最小正整数 k 称为 a 对模 m 的阶,记作 δm(a)

δm(a)=φ(m),则称 am 的一个原根

阶的性质

假设 (a,m)=1,δ=δm(a),则

原根的存在与判定

只有模 2,4,pa,2pa 存在原根(p 是奇质数)

原根的判定定理

m>1g 为正整数且 (g,m)=1。则 gm 的原根当且仅当对于任意 φ(m) 的质因子 qigφ(m)qi1(modm)

如何寻找原根,假设这里我们需要寻找 p 的原根,那么有 g0,g1,,gφ(p)1 在模 p 意义下各不相同,如果 p 是一个质数,那么这里有 φ(p)=p1

一个数原根的个数为 φ(φ(p)) 但是第一个原根往往不是特别大,所以从小到大枚举 rt 然后 O(p) 去 check

rt 不是原根,那么一定存在 0i<jφ(n)1 使得 gigj(modp) 那么有 gji1(modp) ,所以说如果出现一个 0<d=ji<φ(p) 使得 gd1(modp),那么就说明 rt 不是原根

int rt = 1; // P 是一个质数
while (true) {
    bool ok = true;
    int v = 1;
    for (int i = 1; i < P - 1; i++) {
        v = v * rt % P;
        if (v == 1) {
            ok = false;
            break;
        }
    }
    if (ok) break;
    rt += 1;
}

d=ji,又有 gφ(n)1(modp),所以有 d|φ(n)

于是,我们只需要预处理出 φ(n) 的的因数 {e},对于一个 rt 如果存在一个 rtei1(modp) 那么 rt 就不是原根

指标

对于质数 p,假设 gp 的一个原根,则 g0,g1,gp2 在模 p 意义下是 1,2,,p1 的一个排列。假设对于 1xp1gcx(modp) 则称 x 的指标为 c,记作 ind(x)=c

指标有着非常优秀的性质,也被称为离散对数:1x,y<p,ind(xy)ind(x)+ind(y)(modφ(p)))

如何求一个 ind(x) 可以使用 BSGS 算法

求所有的 ind(x) 可以使用 O(n) 的递推

vector<ll> lg(P, 0);
for (int i = 0, v = 1; i < P - 1; i++) {
    lg[v] = i;
    v = v * rt % P;
}

NTT 实现

假设质数 p=r2l+1gp 的原根,和 FFT 类似,我们用 gn=gp1n 代替 wn

我们发现,这样子去选取 gn 一样满足一些性质:

和 FFT 类似,只不过这里用原根来替换单位根,来进行一个模意义下的运算,FFT 中的 DFT,IDFT,依然成立

下面有些常见的模数:

非递归的 NTT

//NTT

int rev[MAXN], limit, bit;

void NTT (vector<ll> &a, int op) {
    for (int i = 0; i < limit; i++)
        if (i < rev[i]) swap(a[i], a[rev[i]]);
    
    for (int m = 2; m <= limit; m <<= 1) {
        ll gn = qpow(3, (MOD - 1) / m); 
        if (op == -1) gn = qpow(gn, MOD - 2);
        for (int i = 0; i < limit; i += m) {
            ll gk = 1;
            for (int j = 0; j < m / 2; j++) {
                ll x = a[i + j], y = gk * a[i + j + m / 2] % MOD;
                a[i + j] = (x + y) % MOD;
                a[i + j + m / 2] = (x - y + MOD) % MOD;
                gk = gk * gn % MOD;
            }
        }
    }
}

void convolution(vector<ll> A, vector<ll> B, vector<ll> &C) {
    int n = A.size() - 1, m = B.size() - 1;
    limit = 1, bit = 0;
    while (limit <= n + m) limit <<= 1, bit += 1;
    for (int i = 0; i < limit; i++)
        rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (bit - 1));

    A.resize(limit), B.resize(limit); C.resize(limit);
    for (int i = n + 1; i < limit; i++) A[i] = 0;
    for (int i = m + 1; i < limit; i++) B[i] = 0;
    
    NTT(A, 1), NTT(B, 1);


    for (int i = 0; i < limit; i++)
        C[i] = A[i] * B[i] % MOD;
    NTT(C, -1);
    ll inv = qpow(limit, MOD - 2);
    for (int i = 0; i < limit; i++)
        C[i] = C[i] * inv % MOD;
}

牛顿迭代

给定多项式 g(x),求满足 g(f(x))=0(modxn) 的形式幂级数 f(x)

n=1 时,[x0]g(f(x))=0 可以求出

假设现在已经得到了 (modxn2) 的解 f0(x)

有递归式:

f(x)f0(x)g(f0(x))g(f0(x))(modxn)

多项式求逆

给定函数 h(x),有方程

g(f(x))=1f(x)h(x)0(modxn)

应用牛顿迭代可得:

f(x)f9(x)1f0(x)h(x)1f02(x)2f0(x)f02(x)h(x)

于是,我们就得到了 f(x) 的递推是

根据主定理,时间复杂度为 O(nlogn)

多项式开方

设给定函数为 h(x) 有方程:

g(f(x))=f2(x)h(x)0(modxn)

应用牛顿迭代可得:

f(x)f0f02(x)h(x)2f0(x)(modxn)f02(x)+h(x)2f0(x)(modxn)

时间复杂度 O(nlogn)

多项式 exp

给定函数 h(x),有方程:

g(f(x))=lnf(x)h(x)(modxn)

应用牛顿迭代可得:

f(x)f0(x)lnf0(x)h(x)1f0(x)(modxn)f0(x)(1lnf0(x)+h(x))(modxn)

时间复杂度为 O(nlogn)

拉格朗日差值

n 个点值 (xi,yi), (1in),满足 xixj, (ij),它们唯一确定一个 n1 次多项式 f(x)

f(x)=i=1nyijixxjxixj

拉格朗日差值定理用于点值表示转化成多项式形式,我们需要构造出一个多项式,满足 f(xi)=yi

首先,把 f(x) 拆成 n 个函数相加的形式 f(x)=f1(x)+f2(x)++fn(x)

特别的,我们可以令 fi(x) 当且仅当在 x=xif(xi)=yi,其他时候都为 0

那么很显然可以构造出 fi(x)=Aij(xxj),其中 A 是一个系数,我们把 fi(xi)=yi 带入

fi(xi)=Aij(xixj)=yi A=yiij(xixj)

回代:

fi(x)=yiij(xxj)ij(xxj)=yiijxxjxixj

则:

f(x)=i=1nfi(x)=i=1nyijixxjxixj

考虑计算

只需要求一个 f(x0),那么暴力 O(n2) 算即可

只需要求一个 f(xo),并且满足 xi=i,是可以优化到 O(n)