일반화된 이항정리의 두 가지 증명

by Lee Yeohyeon
1177 views

고등학교에서 배우는 이항정리란 자연수 \(n\)에 대하여 등식 \[ (a+b)^n =\sum_{k=0}^n \binom{n}{k}a^{n-k}b^k \tag{1}\label{eq:1}\]가 성립한다는 정리이다. 여기서 기호 \(\binom{n}{k}\)는 \(\binom{n}{k}={}_n\mathrm{C}_r=\frac{n(n-1)\cdots (n-k+1)}{k!}\)를 나타내며, 이 글에서는 편의상 이 기호를 고등학교에서 많이 쓰는 기호인 \({}_n\mathrm{C}_r\)를 대신하여 사용하기로 한다. 식 (1)의 좌변에 \(a=1, b=x\)를 대입하면 다음 등식을 얻는다. \[ (1+x)^n =\sum_{k=0}^n \binom{n}{k}x^k \] 이 식은 이항정리의 특별한 경우로 각 변이 다항함수의 형태이다1. 이 등식을 일반화한 정리가 바로 이 글에서 소개하고자 하는 일반화된 이항정리(generalized binomial theorem)이다.

1. 일반화된 이항계수와 몇 가지 보조정리

이 글의 목표는 일반화된 이항정리를 증명하는 것이다. 일반화된 이항정리를 기술하기 전에 일반화된 이항계수를 정의하고 증명을 위해 필요한 보조정리를 살펴본다.

Definition (일반화된 이항계수).

실수 \(\alpha\)와 음이 아닌 정수 \(k\)에 대하여 \(\binom{\alpha}{k}\)를 \[ \binom{\alpha}{k}=\left\lbrace \begin{array}{lc} \displaystyle \frac{\alpha(\alpha -1)(\alpha -2)\cdots (\alpha -k+1)}{k!}, & k\neq 0 \\ 1, & k=0 \end{array} \right. \]로 정의한다.

위의 정의에서 \(\alpha \in \mathbb{N}\)인 경우는 이미 알고 있는 기존의 이항계수의 식과 동일한 것을 알 수 있다. 이제 증명을 위해 필요한 보조정리를 살펴본다. 이항정리의 증명에만 관심이 있는 독자는 이 부분을 생략하고 2절 혹은 3절을 바로 읽으면 된다. 첫 번째 보조정리는 이항계수와 관련된 정리이다. 확장된 이항계수가 아닌 기존의 이항계수에 대해서는 조합론적인 아주 간단한 증명을 할 수 있지만 지금은 확장된 이항계수에 대한 증명이 필요하므로 다소 기교적인 증명을 소개한다.

Lemma 1.

임의의 두 실수 \(\alpha, \beta\)와 음이 아닌 정수 \(k\)에 대하여 다음이 성립한다. \[ \sum_{j=0}^k \binom{\alpha}{k-j}\binom{\beta}{j} = \binom{\alpha+\beta}{k} \]

증명

\(\alpha\)와 \(\beta\)가 임의의 실수라하자. \(k\)가 \(0, 1\)일 때 주어진 식이 성립하는 것은 자명하다. 귀납법을 이용해 임의의 음이아닌 정수 \(k\)에 대해 주어진 식이 성립함을 보이자. \(k\geq 1\)인 자연수 \(k\)에 대하여 주어진 등식이 성립한다고 가정하자. 그러면 \begin{align*} \binom{\alpha+\beta}{k+1} & = \binom{\alpha+\beta}{k}\frac{\alpha+\beta-k}{k+1} \\ & = \sum_{j=0}^k\binom{\alpha}{k-j}\binom{\beta}{j}\left( \frac{\alpha-k+j}{k+1}+\frac{\beta-j}{k+1}\right) \\ & = \sum_{j=0}^k\left\lbrace \binom{\alpha}{k-j}\binom{\beta}{j} \frac{\alpha-k+j}{k+1}+\binom{\alpha}{k-j}\binom{\beta}{j}\frac{\beta-j}{k+1}\right\rbrace \\ & = \sum_{j=0}^k\left\lbrace\left( \frac{k-j+1}{k+1}\right) \binom{\alpha}{k-j+1}\binom{\beta}{j}+\left(\frac{j+1}{k+1}\right)\binom{\alpha}{k-j}\binom{\beta}{j+1}\right\rbrace \\ & = \sum_{j=0}^k\left\lbrace\frac{k-j+1}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace +\sum_{j=0}^k\left\lbrace \frac{j+1}{k+1}\binom{\alpha}{k-j}\binom{\beta}{j+1}\right\rbrace \\ & = \binom{\alpha}{k+1}+\sum_{j=1}^k\left\lbrace\frac{k-j+1}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace +\sum_{j=1}^{k+1}\left\lbrace \frac{j}{k+1}\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace \\ & = \binom{\alpha}{k+1}+\sum_{j=1}^k\left\lbrace\left(\frac{k-j+1}{k+1}+\frac{j}{k+1}\right)\binom{\alpha}{k-j+1}\binom{\beta}{j}\right\rbrace+\binom{\beta}{k+1} \\ & =\sum_{j=0}^{k+1}\binom{\alpha}{k+1-j}\binom{\beta}{j} \end{align*}가 성립한다. 따라서 수학적 귀납법에 의해 주어진 등식은 임의의 음이 아닌 정수 \(k\)에 대하여 성립한다.

Lemma 1에서 \(\alpha\)와 \(\beta\)가 모두 자연수일 때, 그 식을 '주세걸-반데몬드의 항등식'이라고 부르기도 한다. 이 경우의 등식은 [\(\alpha\)명의 남자와 \(\beta\)명의 여자가 있을 때, 이들 중 \(k\)명의 대표를 뽑는 방법의 수]를 생각하여 조합론적으로 증명할 수 있다. 이제 멱급수와 관련된 다음 보조정리를 증명한다.

Lemma 2.

양의 실수 \(r\)에 대하여 두 멱급수 \(f(x)=\sum_{k=0}^\infty a_kx^k, g(x)=\sum_{k=0}^\infty b_kx^k\)가 구간 \((-r, r)\)위에서 수렴한다고 하자. 그러면 \[ c_k=\sum_{j=0}^ka_jb_{k-j},\quad k=0, 1, 2, \cdots \]라 할때, 멱급수 \(\sum_{k=0}^\infty c_kx^k\)는 구간 \((-r, r)\) 위에서 \(f(x)g(x)\)로 수렴한다.

증명

\(x\in (-r, r)\)를 고정하고 각 자연수 \(n\)에 대하여 \(f_n(x), g_n(x), h_n(x)\)를 \[ f_n(x)=\sum_{k=0}^na_kx^k,\quad g_n(x)=\sum_{k=0}^nb_kx^k,\quad h_n(x)=\sum_{k=0}^nc_kx^k \]로 두자. 이제 \(h_n(x)\)에 대하여 유한합의 순서를 다음과 같이 (기막히게) 바꿔주면, \begin{align*} h_n(x) & = \sum_{k=0}^n\sum_{j=0}^ka_jb_{k-j}x^jx^{k-j} =\sum_{k=0}^n\left(\sum_{j=0}^k a_jx^jb_{k-j}x^{k-j}\right) \\ & = (a_0x^0b_0x^0)+(a_0x^0b_1x^1+a_1x^1b_0x^0)+(a_0x^0b_2x^2+a_1x^1b_1x^1+a_2x^2b_0x^0) + \\ &\hspace{1.7in} \cdots +(a_0x^0b_nx^n+a_1x^1b_{n-1}x^{n-1}+\cdots +a_nx^nb_0x^0) \\ & = a_0x^0\left( \sum_{k=0}^n b_kx^k\right) + a_1x^1\left( \sum_{k=0}^n b_{k-1}x^{k-1}\right) + \cdots + a_nx^n\left( \sum_{k=n}^n b_{k-n}x^{k-n}\right) \\ & =\sum_{j=0}^na_jx^j\left( \sum_{k=j}^nb_{k-j}x^{k-j}\right) = \sum_{j=0}^na_jx^j\left( g_{n-j}(x)\right) \\ & = \sum_{j=0}^na_jx^j\left( g_{n-j}(x)-g(x)+g(x) \right) =g(x)f_n(x)+\sum_{j=0}^na_jx^j\left(g_{n-j}(x)-g(x)\right) \end{align*}를 얻는다. 따라서 \[ \lim_{n\rightarrow\infty}\sum_{j=0}^n a_jx^j\left( g_{n-j}(x)-g(x)\right)=0 \]을 보이면 증명이 끝남을 알 수 있다.

이제 \(\varepsilon >0\)이 임의의 양수라 하자. \(f(x)\)가 절대수렴하고 \(g_n(x)\)도 수렴하므로 \[ \sum_{k=0}^\infty \vert a_kx^k\vert < M\]과 \[ \text{\(n > j > 0\)인 모든 정수 \(n, j\)에 대하여}\quad \vert g_{n-j}(x)-g(x)\vert\leq M \]를 만족시키는 양수 \(M\)이 존재한다. 또한 \(\ell >N\)인 모든 \(\ell\)에 대하여 \[ \vert g_\ell (x)-g(x)\vert <\frac{\varepsilon}{2M}\quad \text{and}\quad \sum_{j=N+1}^\infty \vert a_jx^j\vert <\frac{\varepsilon}{2M} \]을 성립하게 하는 적당한 자연수 \(N\)이 존재하는 것도 쉽게 확인 된다. 이제 \(n>2N\)이라하면 \begin{align*} \left\vert \sum_{j=0}^na_jx^j \left(g_{n-j}(x) -g(x)\right)\right\vert & = \left\vert \sum_{j=0}^N a_jx^j\left(g_{n-j}(x)-g(x)\right)+\sum_{j=N+1}^n a_jx^j\left(g_{n-j}(x)-g(x)\right)\right\vert \\ & < \frac{\varepsilon}{2M}\sum_{j=0}^N\vert a_jx^j\vert+M\sum_{j=N+1}^n\vert a_jx^j\vert < \frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \end{align*} 가 성립한다. 즉 \[ \lim_{n\rightarrow \infty}\sum_{j=0}^n a_jx^j\left( g_{n-j}(x)-g(x)\right) =0 \]이다.

이항정리를 증명하기 위해 필요한 마지막 보조정리로 특정한 조건을 만족시키는 함수에 대한 정리를 소개한다.

Lemma 3.

연속함수 \(f : \mathbb{R}\rightarrow \mathbb{R}\)가 임의의 두 실수 \(x, y\)에 대하여 \(f(x+y)=f(x)f(y)\)를 만족시키고 \(f(0)\neq 0\)이면 , 적당한 양수 \(a\)에 대하여 \[f(x)=a^x,\quad \forall x\in \mathbb{R}\] 가 성립한다.

증명

\(f(0)=f(0)f(0)\)이고 \(f(0)\neq 0\)이므로 \(f(0)=1\)이다. 또한 임의의 \(x\in \mathbb{R}\)에 대하여 \(1=f(0)=f(x-x)=f(x)f(-x)\)이므로 \(f(-x)=\frac{1}{f(x)}\)이다. \(x\)를 고정했을 때, 귀납법을 이용하면 \[f(nx)=f(x+x+\cdots +x)=(f(x))^n,\quad \forall n\in\mathbb{N}\]이 성립하는 것을 쉽게 알 수 있다. 따라서 자연수 \(m\)에 대하여 \(f(x)=f\left(m\cdot\frac{x}{m}\right)=\left( f\left(\frac{x}{m}\right) \right)^m\)이 성립한다. 특히 \(m=2\)일 때를 생각하면 \(f(x)>0, \forall x\in\mathbb{R}\)이 성립한다는 것도 알 수 있다. 즉 \[ f\left( \frac{x}{m}\right)=\sqrt[m]{f(x)} \]이다. 따라서 임의의 유리수 \(q=\frac{n}{m}\)에 대하여 \[ f(qx)=f\left(\frac{n}{m}x\right)=\left( f\left(\frac{x}{m}\right)\right)^n =\left(\left(f(x)\right)^{1/m}\right)^n=\left(f(x)\right)^{\frac{n}{m}}=\left( f(x)\right)^q \]가 성립한다. 특히 임의의 유리수 \(q\)에 대하여 \(f(q)=(f(1))^q\)가 성립한다. 이제 \(f\)가 연속함수 인것을 생각하자.2 \(a=f(1)\)로 두자. \(f\)는 연속함수이고 지수함수 \(y=a^x\)도 연속함수이므로, \(x\)로 수렴하는 유리수열 \(\langle q_n\rangle, q_n\in\mathbb{Q}\)를 잡으면, \[ f(x)=f\left(\lim_{n\rightarrow \infty}q_n\cdot 1\right)=\lim_{n\rightarrow\infty}f(q_n\cdot 1)=\lim_{n\rightarrow\infty}\left(f(1)\right)^{q_n}=\lim_{n\rightarrow\infty}a^{q_n}=a^x \]를 얻는다.

2. 일반화된 이항정리의 첫 번째 증명

Theorem (이항정리). 실수 \(\alpha\)와 \(\vert x\vert < 1\)인 실수 \(x\)에 대하여 다음 등식이 성립한다. \[ (1+x)^\alpha =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \]

증명

\(\vert x\vert<1\)인 실수 \(x\)를 고정하고 급수 \(F(\alpha):=\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)를 생각하자. 임의의 실수 \(\alpha\)에 대하여 \[ \lim_{k\rightarrow\infty} \left\vert \frac{\displaystyle \binom{\alpha}{k+1}x^{k+1}}{\displaystyle \binom{\alpha}{k}x^k}\right\vert =\lim_{k\rightarrow\infty} \left\vert \frac{\alpha-k}{k+1}\right\vert \vert x\vert =\vert x\vert <1 \]이므로 비판정법에 의해 \(F\)는 절대수렴 및 균등수렴하며 \(F\)는 연속함수임이 확인된다. 그리고 임의의 두 실수 \(\alpha, \beta\)에 대하여 lemma 1과 lemma 2에 의해 \begin{align*} F(\alpha)F(\beta) & =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \sum_{k=0}^\infty \binom{\beta}{k}x^k \\ & = \sum_{k=0}^\infty \sum_{j=0}^k \binom{\alpha}{k-j}\binom{\beta}{j}x^k \\ & =\sum_{k=0}^\infty \binom{\alpha+\beta}{k}x^k =F(\alpha+\beta) \end{align*}가 성립한다. 따라서 lemma 3에 의해 \(F(\alpha)=F(1)^\alpha\)가 성립한다. 이때, \[ F(1)=\sum_{k=0}^\infty \binom{1}{k}x^k =1+x \]이므로 결국 \(F(\alpha)=(1+x)^\alpha\)가 성립한다. 즉 \(\vert x\vert <1\)인 임의의 \(x\)와 임의의 실수 \(\alpha\)에 대하여 \[ (1+x)^\alpha =\sum_{k=0}^\infty \binom{\alpha}{k}x^k \]가 성립한다.

3. 일반화된 이항정리의 두 번째 증명

아마도 해석학을 공부해본 적이 없는 독자는 앞선 증명이 꽤 난해하였을 것이다. 이제 미적분학 수준으로 할 수 있는 다른 증명을 소개한다.

증명

\(\vert x\vert <1\)일 때, 급수 \(\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)이 수렴하는 것은 비판정법을 이용하면 쉽게 확인할 수 있다. 이제 \(f(x)=\sum_{k=0}^\infty \binom{\alpha}{k}x^k\)로 두고 이 식의 양변을 \(x\)에 대해 미분하면 \[f'(x)=\frac{d}{dx}\sum_{k=0}^\infty \binom{\alpha}{k}x^k=\sum_{k=1}^\infty k\binom{\alpha}{k}x^{k-1}\]이므로 \begin{align*} (1+x)f'(x) & =\sum_{k=1}^\infty k\binom{\alpha}{k}x^{k-1}+\sum_{k=1}^\infty k\binom{\alpha}{k}x^k \\ & = \sum_{k=0}^\infty (k+1)\binom{\alpha}{k+1}x^k +\sum_{k=1}^\infty k\binom{\alpha}{k}x^k \\ & = \sum_{k=0}^\infty \left\lbrace (k+1)\binom{\alpha}{k+1}+k\binom{\alpha}{k}\right\rbrace x^k \\ & = \sum_{k=0}^\infty \alpha\binom{\alpha}{k}x^k =\alpha f(x) \end{align*}를 얻는다. 즉 함수 \(f\)는 \((1+x)f'(x)=\alpha f(x)\)를 만족시킨다. 이제 \(g(x)=\frac{f(x)}{(1+x)^\alpha}\)로 두자. 그러면 \begin{align*} \frac{d}{dx}g(x) & =\frac{d}{dx}\frac{f(x)}{(1+x)^\alpha} \\ & = \frac{f'(x)(1+x)^\alpha -f(x)\alpha(1+x)^{\alpha-1}}{(1+x)^{2\alpha}}=\frac{\alpha f(x)(1+x)^{\alpha-1}-f(x)\alpha (1+x)^{\alpha-1}}{(1+x)^{2\alpha}}=0 \end{align*} 이므로 \(g\)는 상수함수이다. 즉 \(\frac{f(x)}{(1+x)^{\alpha}}=C\)이다. 그런데 \(f(0)=1\)이므로 \(C=1\)이다. 즉 \(\frac{f(x)}{(1+x)^\alpha}=1\)이고 따라서 \[ f(x)=(1+x)^\alpha \]이다.

첨언

지금까지 일반화된 이항정리의 두 가지 증명을 살펴보았다. 생각해보건대 두 번째 증명이 첫 번째 증명보다 훨씬 이해하기 쉽고, 간결한 증명임이 분명하다. 즉 두 번째 증명이 더 좋은 증명이라 생각한다. 그럼에도 불구하고 첫 번째 증명을 먼저 소개한 이유는 이 증명은 적어도 내게 있어서는 공부 할 거리를 주는 좋은 증명이었기 때문이다. 조합론의 유명한 등식을 생각해볼 수 있었고, 수렴하는 멱급수의 곱에 대한 생각을 할 수 있었다. 또한 여러 증명과정에서 등장하는 기교적인 식의 계산은 이해하기 위해 애를 써야 했다. 가우스는 \(\alpha\)가 복소수일 때도 이 정리가 유효하다는 것을 증명하였다고 하지만 이에 대해서는 아직 깊게 생각해보지 못했다.

한편 일반화된 이항정리는 이산수학에서 생각하는 생성함수를 다룰 때 유용하게 써먹을 수도 있다. 해서 종종 올림피아드 교재에도 증명 없이 소개되곤 한다. 세상에, 중고등학생이 생성함수를 접하다니! 생각해보니 뭐 못할 것도 없을 것 같다. 생성함수를 이용한 counting은 아주 좋은 심화학습 주제인 것 같다. 기회가 된다면 우리학생들과도 counting을 주제로 동아리 활동을 해보고 싶다.

참고 문헌

  1. William R. Wade(2004), An Introduction to Analysis, Third Ed Pearson, Prentice Hall
  2. Iseulbee(2013), 맛있는 해석학, 4판, 수학 나라의 앨리스

  1. 이 등식에서와 같이 멱급수로 정의된 함수에서는 \(k=0\) 이면서 \(x=0\)일 때, 편의상 \(0^0=1\)로 생각한다. 이는 표기의 편리함을 위함이지 일반적으로 \(0^0=1\)로 생각하는 것은 아니다. \(0^0\)은 정의하지 않는다.
  2. 사실 \(f\)가 \(x=0\)일때 연속이라는 조건만 있어도 \(f\)가 실수전체에서 연속임을 다음과 같이 보일 수 있다.
    \(x\)로 수렴하는 수열 \(\langle x_n \rangle\)이 있을 때, \[\lim_{n\rightarrow\infty} f(x_n-x)=f(0)=1\]이다. 따라서 \begin{align*} \lim_{n\rightarrow \infty}(f(x_n)-f(x)) & =\lim_{n\rightarrow \infty}f(x)\left( \frac{f(x_n)}{f(x)}-1\right) \\ & =\lim_{n\rightarrow \infty}f(x)\left( f(x_n)f(-x)-1\right)=\lim_{n\rightarrow \infty}f(x)(f(x_n-x)-1)=0 \end{align*}이다.

Leave a Comment