고등학교에서 배우는 이항정리란 자연수 \(n\)에 대하여 등식 \[ (a+b)^n =\sum_{k=0}^n \binom{n}{k}a^{n-k}b^k \tag{1}\label{eq:1}\]가 성립한다는 정리이다. 여기서 기호 \(\binom{n}{k}\)는 \(\binom{n}{k}={}_n\mathrm{C}_r=\frac{n(n-1)\cdots (n-k+1)}{k!}\)를 나타내며, 이 글에서는 편의상 이 기호를 고등학교에서 많이 쓰는 기호인 \({}_n\mathrm{C}_r\)를 대신하여 사용하기로 한다. 식 (1)의 좌변에 \(a=1, b=x\)를 대입하면 다음 등식을 얻는다. \[ (1+x)^n =\sum_{k=0}^n \binom{n}{k}x^k \] 이 식은 이항정리의 특별한 경우로 각 변이 다항함수의 형태이다1. 이 등식을 일반화한 정리가 바로 이 글에서 소개하고자 하는 일반화된 이항정리(generalized binomial theorem)이다.
1. 일반화된 이항계수와 몇 가지 보조정리
이 글의 목표는 일반화된 이항정리를 증명하는 것이다. 일반화된 이항정리를 기술하기 전에 일반화된 이항계수를 정의하고 증명을 위해 필요한 보조정리를 살펴본다.
Definition (일반화된 이항계수).
실수 \(\alpha\)와 음이 아닌 정수 \(k\)에 대하여 \(\binom{\alpha}{k}\)를 \[ \binom{\alpha}{k}=\left\lbrace \begin{array}{lc} \displaystyle \frac{\alpha(\alpha -1)(\alpha -2)\cdots (\alpha -k+1)}{k!}, & k\neq 0 \\ 1, & k=0 \end{array} \right. \]로 정의한다.
위의 정의에서 \(\alpha \in \mathbb{N}\)인 경우는 이미 알고 있는 기존의 이항계수의 식과 동일한 것을 알 수 있다. 이제 증명을 위해 필요한 보조정리를 살펴본다. 이항정리의 증명에만 관심이 있는 독자는 이 부분을 생략하고 2절 혹은 3절을 바로 읽으면 된다. 첫 번째 보조정리는 이항계수와 관련된 정리이다. 확장된 이항계수가 아닌 기존의 이항계수에 대해서는 조합론적인 아주 간단한 증명을 할 수 있지만 지금은 확장된 이항계수에 대한 증명이 필요하므로 다소 기교적인 증명을 소개한다.
Lemma 1.
임의의 두 실수 \(\alpha, \beta\)와 음이 아닌 정수 \(k\)에 대하여 다음이 성립한다. \[ \sum_{j=0}^k \binom{\alpha}{k-j}\binom{\beta}{j} = \binom{\alpha+\beta}{k} \]
증명
\(\alpha\)와 \(\beta\)가 임의의 실수라하자. \(k\)가 \(0, 1\)일 때 주어진 식이 성립하는 것은 자명하다. 귀납법을 이용해 임의의 음이아닌 정수 \(k\)에 대해 주어진 식이 성립함을 보이자. \(k\geq 1\)인 자연수 \(k\)에 대하여 주어진 등식이 성립한다고 가정하자. 그러면 \begin{align*} \binom{\alpha+\beta}{k+1} & = \binom{\alpha+\beta}{k}\frac{\alpha+\beta-k}{k+1} \\ & = \sum_{j=0}^k\binom{\alpha}{k-j}\binom{\beta}{j}\left( \frac{\alpha-k+j}{k+1}+\frac{\beta-j}{k+1}\right) \\ & = \sum_{j=0}^k\left\lbrace \binom{\alpha}{k-j}\binom{\beta}{j} \frac{\alpha-k+j}{k+1}+\binom{\alpha}{k-j}\binom{\beta}{j}\frac{\beta-j}{k+1}\right\rbrace \\ & = \sum_{j=0}^k\left\lbrace\left( \frac{k-j+1}{k+1}\right) \binom{\alpha}{k-j+1}\binom{\beta}{j}+\left(\frac{j+1}{k+1}\right)\binom{\alpha}{k-j}\binom{\beta}{j+1}\right\rbrace \\ & = \sum_{j=0}^k\left\lbrace\frac{k-j+1}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace +\sum_{j=0}^k\left\lbrace \frac{j+1}{k+1}\binom{\alpha}{k-j}\binom{\beta}{j+1}\right\rbrace \\ & = \binom{\alpha}{k+1}+\sum_{j=1}^k\left\lbrace\frac{k-j+1}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace +\sum_{j=1}^{k+1}\left\lbrace \frac{j}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace \\ & = \binom{\alpha}{k+1}+\sum_{j=1}^k\left\lbrace\left(\frac{k-j+1}{k+1}+\frac{j}{k+1}\right)\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace+\binom{\beta}{k+1} \\ & =\sum_{j=0}^{k+1}\binom{\alpha}{k+1-j}\binom{\beta}{j} \end{align*}가 성립한다. 따라서 수학적 귀납법에 의해 주어진 등식은 임의의 음이 아닌 정수 \(k\)에 대하여 성립한다.
Lemma 2.
양의 실수 \(r\)에 대하여 두 멱급수 \(f(x)=\sum_{k=0}^\infty a_kx^k, g(x)=\sum_{k=0}^\infty b_kx^k\)가 구간 \((-r, r)\)위에서 수렴한다고 하자. 그러면 \[ c_k=\sum_{j=0}^ka_jb_{k-j},\quad k=0, 1, 2, \cdots \]라 할때, 멱급수 \(\sum_{k=0}^\infty c_kx^k\)는 구간 \((-r, r)\) 위에서 \(f(x)g(x)\)로 수렴한다.
증명
\(x\in (-r, r)\)를 고정하고 각 자연수 \(n\)에 대하여 \(f_n(x), g_n(x), h_n(x)\)를 \[ f_n(x)=\sum_{k=0}^na_kx^k,\quad g_n(x)=\sum_{k=0}^nb_kx^k,\quad h_n(x)=\sum_{k=0}^nc_kx^k \]로 두자. 이제 \(h_n(x)\)에 대하여 유한합의 순서를 다음과 같이 (기막히게) 바꿔주면, \begin{align*} h_n(x) & = \sum_{k=0}^n\sum_{j=0}^ka_jb_{k-j}x^jx^{k-j} =\sum_{k=0}^n\left(\sum_{j=0}^k a_jx^jb_{k-j}x^{k-j}\right) \\ & = (a_0x^0b_0x^0)+(a_0x^0b_1x^1+a_1x^1b_0x^0)+(a_0x^0b_2x^2+a_1x^1b_1x^1+a_2x^2b_0x^0) + \\ &\hspace{1.7in} \cdots +(a_0x^0b_nx^n+a_1x^1b_{n-1}x^{n-1}+\cdots +a_nx^nb_0x^0) \\ & = a_0x^0\left( \sum_{k=0}^n b_kx^k\right) + a_1x^1\left( \sum_{k=0}^n b_{k-1}x^{k-1}\right) + \cdots + a_nx^n\left( \sum_{k=n}^n b_{k-n}x^{k-n}\right) \\ & =\sum_{j=0}^na_jx^j\left( \sum_{k=j}^nb_{k-j}x^{k-j}\right) = \sum_{j=0}^na_jx^j\left( g_{n-j}(x)\right) \\ & = \sum_{j=0}^na_jx^j\left( g_{n-j}(x)-g(x)+g(x) \right) =g(x)f_n(x)+\sum_{j=0}^na_jx^j\left(g_{n-j}(x)-g(x)\right) \end{align*}를 얻는다. 따라서 \[ \lim_{n\rightarrow\infty}\sum_{j=0}^n a_jx^j\left( g_{n-j}(x)-g(x)\right)=0 \]을 보이면 증명이 끝남을 알 수 있다.
이제 \(\varepsilon >0\)이 임의의 양수라 하자. \(f(x)\)가 절대수렴하고 \(g_n(x)\)도 수렴하므로 \[ \sum_{k=0}^\infty \vert a_kx^k\vert < M\]과 \[ \text{\(n > j > 0\)인 모든 정수 \(n, j\)에 대하여}\quad \vert g_{n-j}(x)-g(x)\vert\leq M \]를 만족시키는 양수 \(M\)이 존재한다. 또한 \(\ell >N\)인 모든 \(\ell\)에 대하여 \[ \vert g_\ell (x)-g(x)\vert <\frac{\varepsilon}{2M}\quad \text{and}\quad \sum_{j=N+1}^\infty \vert a_jx^j\vert <\frac{\varepsilon}{2M} \]을 성립하게 하는 적당한 자연수 \(N\)이 존재하는 것도 쉽게 확인 된다. 이제 \(n>2N\)이라하면 \begin{align*} \left\vert \sum_{j=0}^na_jx^j \left(g_{n-j}(x) -g(x)\right)\right\vert & = \left\vert \sum_{j=0}^N a_jx^j\left(g_{n-j}(x)-g(x)\right)+\sum_{j=N+1}^n a_jx^j\left(g_{n-j}(x)-g(x)\right)\right\vert \\ & < \frac{\varepsilon}{2M}\sum_{j=0}^N\vert a_jx^j\vert+M\sum_{j=N+1}^n\vert a_jx^j\vert < \frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \end{align*} 가 성립한다. 즉 \[ \lim_{n\rightarrow \infty}\sum_{j=0}^n a_jx^j\left( g_{n-j}(x)-g(x)\right) =0 \]이다.
이항정리를 증명하기 위해 필요한 마지막 보조정리로 특정한 조건을 만족시키는 함수에 대한 정리를 소개한다.
Lemma 3.
연속함수 \(f : \mathbb{R}\rightarrow \mathbb{R}\)가 임의의 두 실수 \(x, y\)에 대하여 \(f(x+y)=f(x)f(y)\)를 만족시키고 \(f(0)\neq 0\)이면 , 적당한 양수 \(a\)에 대하여 \[f(x)=a^x,\quad \forall x\in \mathbb{R}\] 가 성립한다.
증명
\(f(0)=f(0)f(0)\)이고 \(f(0)\neq 0\)이므로 \(f(0)=1\)이다. 또한 임의의 \(x\in \mathbb{R}\)에 대하여 \(1=f(0)=f(x-x)=f(x)f(-x)\)이므로 \(f(-x)=\frac{1}{f(x)}\)이다. \(x\)를 고정했을 때, 귀납법을 이용하면 \[f(nx)=f(x+x+\cdots +x)=(f(x))^n,\quad \forall n\in\mathbb{N}\]이 성립하는 것을 쉽게 알 수 있다. 따라서 자연수 \(m\)에 대하여 \(f(x)=f\left(m\cdot\frac{x}{m}\right)=\left( f\left(\frac{x}{m}\right) \right)^m\)이 성립한다. 특히 \(m=2\)일 때를 생각하면 \(f(x)>0, \forall x\in\mathbb{R}\)이 성립한다는 것도 알 수 있다. 즉 \[ f\left( \frac{x}{m}\right)=\sqrt[m]{f(x)} \]이다. 따라서 임의의 유리수 \(q=\frac{n}{m}\)에 대하여 \[ f(qx)=f\left(\frac{n}{m}x\right)=\left( f\left(\frac{x}{m}\right)\right)^n =\left(\left(f(x)\right)^{1/m}\right)^n=\left(f(x)\right)^{\frac{n}{m}}=\left( f(x)\right)^q \]가 성립한다. 특히 임의의 유리수 \(q\)에 대하여 \(f(q)=(f(1))^q\)가 성립한다. 이제 \(f\)가 연속함수 인것을 생각하자.2 \(a=f(1)\)로 두자. \(f\)는 연속함수이고 지수함수 \(y=a^x\)도 연속함수이므로, \(x\)로 수렴하는 유리수열 \(\langle q_n\rangle, q_n\in\mathbb{Q}\)를 잡으면, \[ f(x)=f\left(\lim_{n\rightarrow \infty}q_n\cdot 1\right)=\lim_{n\rightarrow\infty}f(q_n\cdot 1)=\lim_{n\rightarrow\infty}\left(f(1)\right)^{q_n}=\lim_{n\rightarrow\infty}a^{q_n}=a^x \]를 얻는다.
2. 일반화된 이항정리의 첫 번째 증명
Theorem (이항정리). 실수 \(\alpha\)와 \(\vert x\vert < 1\)인 실수 \(x\)에 대하여 다음 등식이 성립한다. \[ (1+x)^\alpha =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \]
증명
\(\vert x\vert<1\)인 실수 \(x\)를 고정하고 급수 \(F(\alpha):=\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)를 생각하자. 임의의 실수 \(\alpha\)에 대하여 \[ \lim_{k\rightarrow\infty} \left\vert \frac{\displaystyle \binom{\alpha}{k+1}x^{k+1}}{\displaystyle \binom{\alpha}{k}x^k}\right\vert =\lim_{k\rightarrow\infty} \left\vert \frac{\alpha-k}{k+1}\right\vert \vert x\vert =\vert x\vert <1 \]이므로 비판정법에 의해 \(F\)는 절대수렴 및 균등수렴하며 \(F\)는 연속함수임이 확인된다. 그리고 임의의 두 실수 \(\alpha, \beta\)에 대하여 lemma 1과 lemma 2에 의해 \begin{align*} F(\alpha)F(\beta) & =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \sum_{k=0}^\infty \binom{\beta}{k}x^k \\ & = \sum_{k=0}^\infty \sum_{j=0}^k \binom{\alpha}{k-j}\binom{\beta}{j}x^k \\ & =\sum_{k=0}^\infty \binom{\alpha+\beta}{k}x^k =F(\alpha+\beta) \end{align*}가 성립한다. 따라서 lemma 3에 의해 \(F(\alpha)=F(1)^\alpha\)가 성립한다. 이때, \[ F(1)=\sum_{k=0}^\infty \binom{1}{k}x^k =1+x \]이므로 결국 \(F(\alpha)=(1+x)^\alpha\)가 성립한다. 즉 \(\vert x\vert <1\)인 임의의 \(x\)와 임의의 실수 \(\alpha\)에 대하여 \[ (1+x)^\alpha =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \]가 성립한다.
3. 일반화된 이항정리의 두 번째 증명
아마도 해석학을 공부해본 적이 없는 독자는 앞선 증명이 꽤 난해하였을 것이다. 이제 미적분학 수준으로 할 수 있는 다른 증명을 소개한다.
증명
\(\vert x\vert <1\)일 때, 급수 \(\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)이 수렴하는 것은 비판정법을 이용하면 쉽게 확인할 수 있다. 이제 \(f(x)=\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)로 두고 이 식의 양변을 \(x\)에 대해 미분하면 \[f'(x)=\frac{d}{dx}\sum_{k=0}^\infty \binom{\alpha}{k}x^k=\sum_{k=1}^\infty k\binom{\alpha}{k}x^{k-1}\]이므로 \begin{align*} (1+x)f'(x) & =\sum_{k=1}^\infty k\binom{\alpha}{k}x^{k-1}+\sum_{k=1}^\infty k\binom{\alpha}{k}x^k \\ & = \sum_{k=0}^\infty (k+1)\binom{\alpha}{k+1}x^k +\sum_{k=1}^\infty k\binom{\alpha}{k}x^k \\ & = \sum_{k=0}^\infty \left\lbrace (k+1)\binom{\alpha}{k+1}+k\binom{\alpha}{k}\right\rbrace x^k \\ & = \sum_{k=0}^\infty \alpha\binom{\alpha}{k}x^k =\alpha f(x) \end{align*}를 얻는다. 즉 함수 \(f\)는 \((1+x)f'(x)=\alpha f(x)\)를 만족시킨다. 이제 \(g(x)=\frac{f(x)}{(1+x)^\alpha}\)로 두자. 그러면 \begin{align*} \frac{d}{dx}g(x) & =\frac{d}{dx}\frac{f(x)}{(1+x)^\alpha} \\ & = \frac{f'(x)(1+x)^\alpha -f(x)\alpha(1+x)^{\alpha-1}}{(1+x)^{2\alpha}}=\frac{\alpha f(x)(1+x)^{\alpha-1}-f(x)\alpha (1+x)^{\alpha-1}}{(1+x)^{2\alpha}}=0 \end{align*} 이므로 \(g\)는 상수함수이다. 즉 \(\frac{f(x)}{(1+x)^{\alpha}}=C\)이다. 그런데 \(f(0)=1\)이므로 \(C=1\)이다. 즉 \(\frac{f(x)}{(1+x)^\alpha}=1\)이고 따라서 \[ f(x)=(1+x)^\alpha \]이다.
첨언
지금까지 일반화된 이항정리의 두 가지 증명을 살펴보았다. 생각해보건대 두 번째 증명이 첫 번째 증명보다 훨씬 이해하기 쉽고, 간결한 증명임이 분명하다. 즉 두 번째 증명이 더 좋은 증명이라 생각한다. 그럼에도 불구하고 첫 번째 증명을 먼저 소개한 이유는 이 증명은 적어도 내게 있어서는 공부 할 거리를 주는 좋은 증명이었기 때문이다. 조합론의 유명한 등식을 생각해볼 수 있었고, 수렴하는 멱급수의 곱에 대한 생각을 할 수 있었다. 또한 여러 증명과정에서 등장하는 기교적인 식의 계산은 이해하기 위해 애를 써야 했다. 가우스는 \(\alpha\)가 복소수일 때도 이 정리가 유효하다는 것을 증명하였다고 하지만 이에 대해서는 아직 깊게 생각해보지 못했다.
한편 일반화된 이항정리는 이산수학에서 생각하는 생성함수를 다룰 때 유용하게 써먹을 수도 있다. 해서 종종 올림피아드 교재에도 증명 없이 소개되곤 한다. 세상에, 중고등학생이 생성함수를 접하다니! 생각해보니 뭐 못할 것도 없을 것 같다. 생성함수를 이용한 counting은 아주 좋은 심화학습 주제인 것 같다. 기회가 된다면 우리학생들과도 counting을 주제로 동아리 활동을 해보고 싶다.
참고 문헌
- William R. Wade(2004), An Introduction to Analysis, Third Ed Pearson, Prentice Hall
- Iseulbee(2013), 맛있는 해석학, 4판, 수학 나라의 앨리스
- 이 등식에서와 같이 멱급수로 정의된 함수에서는 \(k=0\) 이면서 \(x=0\)일 때, 편의상 \(0^0=1\)로 생각한다. 이는 표기의 편리함을 위함이지 일반적으로 \(0^0=1\)로 생각하는 것은 아니다. \(0^0\)은 정의하지 않는다.
- 사실 \(f\)가 \(x=0\)일때 연속이라는 조건만 있어도 \(f\)가 실수전체에서 연속임을 다음과 같이 보일 수 있다.
\(x\)로 수렴하는 수열 \(\langle x_n \rangle\)이 있을 때, \[\lim_{n\rightarrow\infty} f(x_n-x)=f(0)=1\]이다. 따라서 \begin{align*} \lim_{n\rightarrow \infty}(f(x_n)-f(x)) & =\lim_{n\rightarrow \infty}f(x)\left( \frac{f(x_n)}{f(x)}-1\right) \\ & =\lim_{n\rightarrow \infty}f(x)\left( f(x_n)f(-x)-1\right)=\lim_{n\rightarrow \infty}f(x)(f(x_n-x)-1)=0 \end{align*}이다.