Rambler's Top100 Service
Поиск   
 
Обратите внимание!   Обратите внимание!
 
  Наука >> Математика >> Математическое образование | Популярные статьи
 Написать комментарий  Добавить новое сообщение
Next: Лев Генрихович Шнирельман, антиподы Up: Советская математика 30-х годов Previous: Содержание Contents: Содержание

Александр Осипович Гельфонд и седьмая проблема Гильберта

Комплексное число называется алгебраическим, если оно является корнем некоторого многочлена с целыми коэффициентами. Таково, например, число $\sqrt{2}$, являющееся корнем уравнения $x^2-2=0$. Еще в далекой античности было доказано, что $\sqrt{2}$ не является рациональным числом. Числа, не являющиеся алгебраическими, называются трансцендентными. Лейбниц упоминает, что число $2^{\sqrt{2}/2}$ "интерцендентно", не определяя это понятие. Явное указание на то, что $a^{\sqrt{n}}$ трансцендентно, если $a$ - рациональное, а $n$ - натуральное, не являющееся квадратом, содержится у Эйлера.

Первый пример трансцендентных чисел построил Ж.Лиувилль в 1844 г. Он доказал, что алгебраическое число не может "слишком хорошо" аппроксимироваться рациональными [6]. Так называемое "число Лиувилля" $\sum_{n=1}^\infty 10^{-n!}$, имеющее в десятичной записи единицы на позициях с номерами 1, 2, 6, 24, $\dots$ и нули на остальных, "слишком хорошо" приближается своими "начальными кусками" и потому (как доказал Лиувилль) трансцендентно. Существование трансцендентных чисел вытекает также из результатов Кантора: множество ${\mathbb{A}}$ алгебраических чисел счетно, в то время как множество ${\mathbb{R}}$ действительных чисел несчетно. Метод Кантора дает и алгоритм построения трансцендентных чисел. Но естественно возник вопрос о том, являются ли трансцендентными всем известные числа $e$ и $\pi$. Вопрос о трансцендентности $\pi$ был особо актуален, ибо от ответа на него во многом зависело решение одной из известнейших задач античной математики - задачи о квадратуре круга. Трансцендентность числа $e$ доказал Эрмит в 1873 г. Через девять лет, в 1882 г., Линдеман доказал трансцендентность чисел вида $e^\alpha $, где $\alpha \ne 0$ - алгебраическое. Отсюда вытекает, что $\pi$ трансцендентно (ибо $e^{\pi i}=-1$). Тем самым была решена (в отрицательном смысле) проблема квадратуры круга.

(Говорят, Линдеман получил этот выдающийся результат в день своего тридцатилетия. Кто-то из друзей, пришедших на празднование дня рождения, сказал ему: "Ты выглядишь таким счастливым, как будто решил проблему квадратуры круга!" Линдеман отвечал, что так оно и есть. В последующие годы Линдеман был ректором университета в Мюнхене и пытался решить проблему Ферма - говорят, под давлением жены, которая требовала от мужа не останавливаться на достигнутом.)

Среди 23 математических проблем, которые Гильберт сформулировал в своем знаменитом докладе на парижском конгрессе 1900 г., седьмая проблема посвящена трасцендентным числам. Гильберт спрашивает, всегда ли трансцендентно число вида $\alpha ^\beta$, где $\alpha $ и $\beta$ алгебраические, $\alpha $ отлично от 0 и 1, а $\beta$ не является рациональным. В частности, Гильберт указывает конкретные числа $2^{\sqrt{2}}$ и $e^\pi=i^{-2i}$ и предлагает доказать, что они трансцендентны.

Поясним равенство $e^\pi=i^{-2i}$. Если $\alpha $ не является положительным вещественным числом, выражение $\alpha ^\beta$ определено неоднозначно. По определению $\alpha ^\beta=e^{\beta \log \alpha }$, где $e^z=\sum z^n/n!$, a $\log \alpha $ - какое-либо решение уравнения $e^x=\alpha $. Последнее уравнение имеет бесконечно много решений, отличающихся между собой на целое кратное числа $2\pi i$. Если $\beta$ не является рациональным, отсюда получается бесконечное множество значений для выражения $\alpha ^\beta$. Так как $e^{\pi i/2}=i$, одним из значений для $\log i$ является $\pi i/2$, а одним из значений для $i^{-2i}$ является $e^{-2i\pi i/2}=e^\pi$.

Гильберт считал свою седьмую проблему очень трудной. Он полагал, что ее решение принадлежит еще более далекому будущему, чем решение проблем Римана и Ферма. Но здесь он ошибся.

Первое частичное решение седьмой проблемы было получено А.О.Гельфондом в 1929 г. и Р.О.Кузьминым в 1930 г. В 1934 г. Гельфонд получил окончательное решение. Несколько позже решение седьмой проблемы независимо получил немецкий математик Т.Шнейдер.

Александр Осипович Гельфонд родился 24 (11) октября 1906 г. в Петербурге в семье врача. Окончив среднюю школу, он поступил в училище им. Баумана, но вскоре перевелся на физико-математический факультет Московского Университета. Студенческие и аспирантские годы Александра Осиповича прошли под руководством В.В.Степанова и А.Я.Хинчина. Решение седьмой проблемы Гильберта принесло ему всемирную известность. В 1935 г. Гельфонду без защиты диссертации была присвоена ученая степень доктора физико-математических наук, а в 1939 г. он был избран членом-корреспондентом АН СССР. С 1933 г. А.О.Гельфонд был старшим научным сотрудником Математического института им. В.А.Стеклова АН СССР, с 1938 г. - заведующим кафедрой теории чисел механико-математического факультета МГУ. А.О.Гельфонд умер 7 ноября 1968 г.

Приведем решение седьмой проблемы Гильберта. Основные понятия и определения, связанные с алгебраическими числами, мы предполагаем известными; найти их, например, можно в книгах [2,6].

Теорема Гельфонда - Шнейдера. Пусть $\alpha $ - алгебраическое число, отличное от $0$ и $1$, а $\beta$ - алгебраическое число, не являющееся рациональным. Тогда каждое значение выражения $\alpha ^\beta$ трансцендентно.

Гельфонд был приглашен принять участие в Международном конгрессе в Осло в 1932 году. Но он не получил разрешения на выезд. Контакты между советскими математиками и математиками остального мира в те годы фактически прекратились. Кандидатуры советских математиков на соискание международных премий не рассматривались. Но нет никакого сомнения в том, что решение седьмой проблемы Гильберта могло бы претендовать на филдсовскую медаль в 1936 году.

Из теоремы Гельфонда - Шнейдера вытекает, в частности, трансцендентность чисел $2^{\sqrt{2}}$ (это предполагали еще Лейбниц и Эйлер!) и $e^{\pi\beta}\relax =i^{-2i\beta}$, где $\beta\ne 0$ вещественное алгебраическое. Отметим, что до сих пор неизвестно, являются ли трансцендентными (или хотя бы иррациональными!) числа $e+\pi$ и $e\pi$.

Доказательство теоремы Гельфонда - Шнейдера можно найти в [1], [4], [6]. Весьма общий результат о значениях функций, удовлетворяющих алгебраическим дифференциальным уравнениям, из которого вытекает как теорема Гельфонда - Шнейдера, так и теорема Линдемана, доказан в добавлении к [2]. Наше изложение заимствовано из статьи А.И.Галочкина [1] (где теорема Линдемана также доказана на сходных идеях).

Общий замысел доказательства таков. Допустим, что $\alpha ^\beta$ алгебраическое. Для каждого натурального $n>1$ мы построим ненулевую функцию $f\relax =f_n$ вида
\begin{displaymath}
f(z)=\sum_{k=0}^{n-1} \sum_{l=0}^{n-1} a_{kl} e^{(k+l\beta) z},%%\tag{1}
\end{displaymath} (1)

имеющую нуль высокого порядка (точнее, порядка $\ge [n^{3/2}]$) в точке $z=0$. При этом коэффициенты функции $f_n$ - целые числа, которые "не слишком быстро" растут с ростом $n$: справедлива оценка $\vert a_{kl}\vert<n^{\gamma _1 n}$, где $\gamma _1$ - не зависящая от $n$ положительная константа (в дальнейшем аналогичный смысл имеют $\gamma _2$, $\gamma _3,\dots$). Тогда на любом круге $\vert z\vert\le R$ функции $f_n$ быстро сходятся к нулю вместе со всеми своими производными. С другой стороны, для натуральных $x$ и $t$ значение производной $f_n^{(t)}$ в точке $x\log \alpha $ есть многочлен с целыми коэффициентами от алгебраических чисел $\alpha $, $\beta$ и $\alpha ^\beta$. Отсюда выводится оценка снизу на $\vert f_n^{(t)}(x\log \alpha )\vert$, противоречащая оценке сверху на скорость сходимости последовательности $(f_n)$ к нулю.

Предположим, что для каждого $n$ функция $f_n$ с указанными свойствами уже построена. Покажем, как получаются упомянутые оценки.

Обозначим через $\operatorname{ord}_{z=a}F(z)$ порядок нуля функции $F$ в точке $z=a$.

Лемма 1.   Пусть $\omega _1,\dots,\omega _m$ - различные комплексные числа,

\begin{displaymath}
g_m(z)=a_1e^{\omega _1z}+\dots+a_me^{\omega _mz},
\end{displaymath}

где коэффициенты $a_k$ не все равны нулю. Тогда

\begin{displaymath}
\operatorname{ord}_{z=0} g_m(z)< m.
\end{displaymath}

Доказательство. Индукция по $m$. Производная

\begin{displaymath}
g_{m-1}(z)=(e^{-\omega _mz}g_m(z))'
\end{displaymath}

имеет вид

\begin{displaymath}
g_{m-1}(z)=b_1e^{(\omega _1-\omega _m)z}+\dots+b_{m-1}e^{(\omega _{m-1}-\omega _m)z}.
\end{displaymath}

$\operatorname{ord}_{z=0}g_{m-1}(z)<m-1$, откуда вытекает требуемое заключение.

Пусть $m$, $m_1$ и $m_2$ - степени алгебраических чисел $\beta$, $\alpha $ и $\alpha ^\beta$ соответственно. Положим $X=3mm_1m_2+6$. Зафиксируем какое-нибудь значение $\log \alpha $. Из леммы 1 вытекает, что $\operatorname{ord}_{z=0} f(z)<n^2$. Таким образом,

\begin{displaymath}
N=\min_{0\le x\le X}\operatorname{ord}_{z=x\log\alpha }f(z)<n^2.
\end{displaymath}

Лемма 2.   Для любого $R>0$ при достаточно больших $n$ справедливо неравенство

\begin{displaymath}
\max_{\vert z\vert\le R}\vert f^{(N)}(z)\vert <n^{-1/3 n^{3/2}-1/3(X-6)N}.
\end{displaymath}

Доказательство. Функция

\begin{displaymath}
g(z)=f(z)z^{-[n^{3/2}]}(z-\log\alpha )^{-N}\cdot\ldots\cdot(z-X\log\alpha )^{-N}
\end{displaymath}

имеет только устранимые особенности и может рассматриваться как всюду определенная целая функция. Применим к этой функции принцип максимума. Пусть $n$ таково, что $R+1<\sqrt{n}$. Тогда

\begin{displaymath}
\max_{\vert z\vert\le R+1}\vert g(z)\vert\le \max_{u=\sqrt{n}}\vert g(u)\vert,
\end{displaymath}

откуда
\begin{displaymath}
\begin{split}
M&=\max_{\vert z\vert\le R+1}\vert f(z)\vert\l...
...-X\log\alpha }{u-X\log\alpha }\right)^N\right\vert.
\end{split}\end{displaymath} (2)

Первый сомножитель в правой части не превосходит $n^2n^{\gamma _1n}e^{(1+\vert\beta\vert)n^{3/2}}$ (здесь $n^2$ - число слагаемых в (1), $n^{\gamma _1n}$ - верхняя оценка для коэффициентов $a_{kl}$), и для любого $\varepsilon >0$ второй сомножитель не превосходит

\begin{displaymath}
n^{-(1/2-\varepsilon )(n^{3/2}+XN)}
\end{displaymath}

при больших $n$. Отсюда
\begin{displaymath}
M\le n^{-1/3n^{3/2}-1/3XN}.%%\tag{3}
\end{displaymath} (3)

Далее,

\begin{displaymath}
f^{(N)}(z)=\frac{N!}{2\pi i}
\int\limits_{\vert\zeta-z\vert=1}{\frac{f(\zeta)d\zeta}{(\zeta-z)^{N+1}}},
\end{displaymath}

поэтому для любого $z$ c $\vert z\vert\le R$ имеем

\begin{displaymath}
\vert f^{(N)}(z)\vert\le (N!)M\le N^NM\le n^{2N}M,
\end{displaymath}

и из (3) следует утверждение леммы.

Из леммы 2 вытекает, что при больших $n$ выполняется
\begin{displaymath}
\vert f^{(N)}(x\log\alpha )\vert<n^{-1/3 n^{3/2}-mm_1m_2N}, \quad x=0,\dots, X.%%\tag{4}
\end{displaymath} (4)

Теперь установим оценку снизу на $f^{(N)}(x\log\alpha )$, несовместимую с (4). Эта оценка основана на следующей лемме.

Назовем длиной многочлена $P$ сумму модулей его коэффициентов. Обозначим длину многочлена $P$ через $L(P)$.

Лемма 3.   Пусть $\alpha _1,\dots,\alpha _s$ - алгебраические числа степеней соответственно $m_1,\dots,m_s$. Тогда существует такая положительная постоянная $C=C(\alpha _1,\dots,\alpha _s)$, что для любого многочлена $P(x_1,\dots,x_s)\relax \in {\mathbb{Z}}[x_1,\dots,x_s]$ либо $P(\alpha _1,\dots,\alpha _s)=0$, либо выполняется $\vert P(\alpha _1,\dots,\alpha _s)\vert\relax \ge L^{1-m_1\cdot\ldots\cdot m_s}C^{-d}$, где $d$ и $L$ - соответственно степень и длина многочлена $P(x_1,\dots,x_s)$.

Доказательство. Пусть $a$ - такое натуральное число, что все числа $a\alpha _1,\dots,a\alpha _s$ целые алгебраические. Тогда целым алгебраическим является и $\beta=a^dP(\alpha _1,\dots,\alpha _s)$. Предположим, что $\beta\ne 0$. Минимальный многочлен $B(x)$ числа $\beta$ имеет целые коэффициенты. Пусть

\begin{displaymath}
B(x)=x^n+b_{n-1}x^{n-1}+\ldots+b_0=(x-\beta_1)\cdot\ldots\cdot(x-\beta_n),
\end{displaymath}

где $\beta=\beta_1$. Тогда
\begin{displaymath}
\vert\beta\beta_2\cdot\ldots\cdot\beta_n\vert=\vert b_0\vert\ge1.%%\tag{5}
\end{displaymath} (5)

Пусть $\alpha _{i1},\dots,\alpha _{im_i}$ - числа, сопряженные с алгебраическим числом $\alpha _i$ $(1\le i\le s)$, $C_1=a\max_{i,j}(1,\vert\alpha _{i,j}\vert)$. Каждое $\beta_i$ сопряжено с $\beta$ и имеет вид $a^dP(\alpha _{1r_1},\dots,\alpha _{sr_s})$, поэтому
\begin{displaymath}
\vert\beta_i\vert=\vert a^dP(\alpha _{1r_1},\dots,\alpha _{sr_s})\vert\le C_1^dL. %%\tag{6}
\end{displaymath} (6)

Из (5) и (6) вытекает

\begin{displaymath}
1\le \vert\beta\vert\cdot\vert\beta_2\cdot\ldots\cdot\beta_n\vert\le
a^d\vert P(\alpha _1,\dots,\alpha _s\vert(C_1^dL)^{n-1}.
\end{displaymath}

Так как $n\le m_1\cdot\ldots\cdot m_s$, то из этого неравенства следует утверждение леммы с $C=aC_1^{m_1\cdot\ldots\cdot m_s-1}$.

По определению числа $N$ найдется такое целое $x$, $0\le x\le X$, что $f^{(N)}(x\log\alpha )\ne 0$. Так как

\begin{displaymath}
f^{(N)}(z)=\sum_{k,l=0}^{n-1}a_{kl}(k+l\beta)^Ne^{(k+l\beta)z},
\end{displaymath}

то

\begin{displaymath}
f^{(N)}(x\log\alpha )=\sum_{k,l=0}^{n-1}a_{kl}(k+l\beta)^N\alpha ^{xk}(\alpha ^\beta)^{xl}
=P(\beta,\alpha ,\alpha ^\beta),
\end{displaymath}

где $P$ - многочлен с целыми коэффициентами. При этом

\begin{displaymath}
L(P)\le n^2n^{\gamma _1n}(2n)^N, \quad \deg P\le N+2nX.
\end{displaymath}

Из леммы 3 получаем, что при достаточно больших $n$
\begin{align*}
f^{(N)}(x\log\alpha )&= P(\beta,\alpha ,\alpha ^\beta)\ge
(L(P))^...
...n^{-\gamma _2n}(2n)^{N(1-mm_1m_2)}C^{-N}>
n^{-\gamma _2n-mm_1m_2N}.
\end{align*}
При больших $n$ это противоречит (4).

Остается построить функцию $f(z)=\sum_{k=0}^{n-1} \sum_{l=0}^{n-1} a_{kl} e^{(k+l\beta) z}$, такую, что $\operatorname{ord}_{z=0}f(z)\ge [n^{3/2}]$ и $\vert a_{kl}\vert<n^{\gamma _1 n}$.

Лемма 4. (Зигель)   Пусть $a_{ij}\in{\mathbb{Z}}$, $\vert a_{ij}\vert\le A$, $\xi=(x_1,\dots,x_q)$ и

\begin{displaymath}
L_i(\xi)=\sum_{j=1}^q a_{ij}x_j, \quad 1\le i\le p, \quad p<q.
\end{displaymath}

Тогда система уравнений

\begin{displaymath}
L_i(\xi)=0, \quad 1\le i \le p
\end{displaymath}

имеет ненулевое решение $(x_1,\dots,x_q)\in {\mathbb{Z}}^q$, для которого $\max_j\vert x_j\vert\le 1\relax +(qA)^{{p}/({q-p})}$.

Доказательство. Рассмотрим нашу систему как линейное уравнение $L(\xi)=0$, где $L=(L_1,\dots,L_p)$ - линейное отображение ${\mathbb{Z}}^q\to {\mathbb{Z}}^p$. Для всякого целого положительного числа $B$ обозначим через ${\mathbb{Z}}^q(B)$ множество таких векторов $\xi$ из ${\mathbb{Z}}^q$, что $\vert\xi\vert=\max_j \vert x_j\vert\le B$. Тогда $L$ отображает ${\mathbb{Z}}^q(B)$ в ${\mathbb{Z}}^p(qBA)$. Число элементов в ${\mathbb{Z}}^q(B)$ равно $(2B+1)^q$. Найдем значение $B$, для которого существуют два различных элемента $\xi,\eta$ из ${\mathbb{Z}}^q(B)$, имеющих один и тот же образ $L(\xi)=L(\eta)$. Для этого достаточно, чтобы выполнялось неравенство $(2B+1)^q>(2qBA+1)^p$. Это неравенство выполняется при $B=[(1+(qA)^{{p}/({q-p})})/2]$, так как тогда $2B+1>(qA)^{{p}/({q-p})}$ и $(2B+1)^{q-p}>(qA)^{p}\ge((2qAB+1)/(2B+1))^p$. В качестве решения нашей системы берем вектор $\xi-\eta$, для которого $\vert\xi-\eta\vert\le 2B\le 1+(qA)^{{p}/({q-p})}$. $\phantom{blank line}$

Лемма 5.   Пусть $\beta$ - целое алгебраическое число,

\begin{displaymath}
\beta^m=b_{m-1}\beta^{m-1}+\ldots+b_1\beta+b_0, \quad b_j\in{\mathbb{Z}},
\quad \vert b_j\vert\le B.
\end{displaymath}

Если $k$ и $l$ - неотрицательные целые числа, не превосходящие $n$, то для всякого натурального $t$

\begin{displaymath}
(k+l\beta)^t=c_{m-1}\beta^{m-1}+\ldots+c_1\beta+c_0, \quad c_j\in{\mathbb{Z}},
\quad \vert c_j\vert\le (B+2)^tn^t.
\end{displaymath}

Доказательство. Для начала заметим, что для всякого натурального $t$ выполняется

\begin{displaymath}
\beta^t=b_{t,m-1}\beta^{m-1}+\ldots+b_{t,1}\beta+b_{t,0},\quad
b_{t,j}\in{\mathbb{Z}}, \quad \vert b_{t,j}\vert\le (B+1)^t.
\end{displaymath}

Это верно при $t\le m$, а равенство

\begin{displaymath}
\beta^{t+1}=b_{t,m-1}(b_{m-1}\beta^{m-1}+\ldots+b_0)+
b_{t,m-2}\beta^{m-1}+\ldots+b_{t,0}\beta
\end{displaymath}

позволяет сделать переход от $t$ к $t+1$.

Теперь из равенства

\begin{displaymath}
(k+l\beta)^t=\sum_{s=0}^t C_t^sk^{t-s}l^s\sum_{j=0}^{m-1}b_{sj}\beta^j
\end{displaymath}

следует, что коэффициенты при $\beta^j$ не превосходят

\begin{displaymath}
\sum_{s=0}^t C_t^sk^{t-s}l^s(B+1)^s=(k+l(B+1))^t\le (B+2)^tn^t.
\end{displaymath}

У нас все готово для завершения доказательства теоремы Гельфонда - Шнейдера. Мы можем считать, что $\beta$ - целое алгебраическое число. Иначе $k\beta$ является целым алгебраическим для некоторого целого $k>0$, и если мы докажем, что $\alpha ^{k\beta}$ трансцендентно, то таково же и $\alpha ^\beta$.

Мы хотим построить ненулевую функцию

\begin{displaymath}
f(z)=\sum_{k=0}^{n-1} \sum_{l=0}^{n-1} a_{kl} e^{(k+l\beta) z}
\end{displaymath}

с коэффициентами $a_{kl}\in{\mathbb{Z}}$, такую, что $\vert a_{kl}\vert<n^{\gamma _1 n}$ и $f^{(t)}(0)=0$, $0\le t\relax \le [n^{3/2}]-1$. Так как

\begin{displaymath}
f^{(t)}(0)=\sum_{k,l=0}^{n-1}a_{kl}(k+l\beta)^t=
\sum_{k,l=0}^{n-1}\sum_{s=0}^{m-1}B_{t,k,l,s}\beta^sa_{kl},
\end{displaymath}

нам надо найти целочисленное решение системы линейных уравнений
\begin{displaymath}
\sum_{k,l=0}^{n-1}B_{t,k,l,s}a_{kl}=0,\quad 0\le t\le [n^{3/2}]-1,
\quad 0\le s\le m-1,%%\tag{7}
\end{displaymath} (7)

состоящей из $p=m[n^{3/2}]$ уравнений относительно $q=n^2$ неизвестных $a_{kl}$. По лемме 5

\begin{displaymath}
\vert B_{t,k,l,s}\vert\le (B+2)^tn^t<n^{\gamma _3n^{3/2}}
\end{displaymath}

(мы воспользовались тем, что $t<n^{3/2}$). Согласно лемме 4, система (7) имеет такое ненулевое целочисленное решение $(a_{kl})$, что все числа $a_{kl}$ по модулю не превосходят $1+(qn^{\gamma _3n^{3/2}})^{p/(q-p)}< n^{\gamma _4n^{3/2}n^{3/2}/(n^2-m[n^{3/2}])}<
n^{\gamma _1n}$. Это завершает доказательство теоремы Гельфонда - Шнейдера.


Next: Лев Генрихович Шнирельман, антиподы Up: Советская математика 30-х годов Previous: Содержание Contents: Содержание


Написать комментарий
 Copyright © 2000-2015, РОО "Мир Науки и Культуры". ISSN 1684-9876 Rambler's Top100 Яндекс цитирования