Книга 286551 устарела и заменена на исправленную
«Выдающийся ученый современности, активно работающий в различных областях математики, общей теории относительности и квантовой теории; автор теории твисторов. Р. Пенроуз возглавляет кафедру математики Оксфордского университета, а также является почетным профессором многих зарубежных университетов и академий. Он является членом Лондонского королевского общества. Среди его наград — премия Вольфа (совместно с С. Хокингом), медаль Дирака, премия Альберта Эйнштейна и медаль Королевского общества. В 1994 г. за выдающиеся заслуги в развитии науки королевой Англии ему был присвоен титул сэра.»[2]
«…фигура Адама в прологе и эпилоге этой книги в определенном смысле служит символом зарождения разума входе неторопливого развития осознающей себя жизни. В нем я тоже вижу Пенроуза — мальчика, сидящего в третьем ряду, позади признанных корифеев в области ИИ, — который не боится высказать им вслух свое мнение, что их „КОРОЛИ-ТО ГОЛЫЕ“».Мартин Гарднер[3]
Посвящаю эту книгу светлой памяти моей дорогой матери, почившей прежде, чем эта книга увидела свет
Мартин Гарднер
Роджер Пенроуз Сентябрь 1998
Каждое мыслящее устройство прошло тщательное тестирование по Тьюрингу группой наших экспертовдействительно является правдой. Несмотря на очевидную абсурдность некоторых аспектов рассматриваемого вопроса (в частности, моральных), мне кажутся достаточно обоснованными доводы в пользу того, что успешно пройденный тест Тьюринга есть указание на присутствие мысли, интеллекта, понимания или сознания. В самом деле, на чем еще могут основываться наши убеждения в присутствии этих качеств у других людей, кроме как на беседе с ними? Строго говоря, другие критерии тоже существуют: выражение лица человека, движения его тела и, вообще, его действия могут оказать на нас весьма сильное влияние. Не будет ничего сверхъестественного, если (возможно, в недалеком будущем) появится робот, который сможет удачно имитировать человеческую мимику и жесты. Тогда необходимость прятать робота и человека от опрашивающей отпадет, но критерии теста, которые будут у нее в распоряжении, останутся неизменными. Лично я готов к тому, чтобы значительно упростить тест Тьюринга. Мне кажется, что требовать от компьютера идеального подражания человеку так, чтобы стать неотличимым от него в каких-то существенных вопросах, это требовать от компьютера больше, чем надо. Мне бы хватило, чтобы наша проницательная опрашивающая по ответам на свои вопросы просто убедилась, что имеет дело с сознательным разумом, пусть даже чужеродным. Вот то, что реально недостижимо во всех созданных на сей день компьютерных системах. Предвижу, однако, вероятность того, что после разоблачения компьютера у опрашивающей может возникнуть (возможно, подсознательное) нежелание приписать ему разумные качества даже тогда, когда она способна эти качества различить. Или наоборот, у нее может создаться впечатление «присутствия чужеродного разума», и она станет подыгрывать компьютеру, даже если «чужеродного разума» и нет. Поэтому исходный вариант теста Тьюринга гораздо предпочтительней в силу большей объективности, и ниже я обычно буду придерживаться той схемы. Присущая ей «несправедливость» по отношению к компьютеру, о которой говорилось выше (чтобы пройти тест, компьютер должен уметь все, что и человек, а человек не обязан иметь способности компьютера), не смущает сторонников теста Тьюринга, считающих этот тест точным испытанием на способность мыслить, чувствовать и т. д. Во всяком случае, многие из сторонников теста придерживаются той точки зрения, что до того, как компьютер будет способен в действительности пройти тест, ждать осталось недолго — скажем, до 2010 года. (По прогнозам самого Тьюринга, 30 %-ное успешное прохождение теста с опрашивающим «средних» способностей и всего с 5-минутным ограничением на продолжительность опроса могло бы быть реализовано к 2000 году.) Они уверены, что даже такая «предубежденность» не способна существенно отодвинуть эту дату! Все вышеизложенное становится важным, коль скоро ставится вопрос по сути: дает ли операционалистская схема приемлемый набор критериев, позволяющих судить о присутствии или отсутствии мыслительных способностей у объекта? По мнению некоторых, — нет, не дает. Имитация, какой бы искусной она ни была, не должна быть с необходимостью тем же, что и оригинал. Я занимаю в этом отношении скорее промежуточную позицию. Общий принцип, к которому я склоняюсь, состоит в том, что любая, даже самая искусная, имитация всегда должна быть обнаружима достаточно тщательным тестированием. Хотя, конечно, это скорее вопрос веры (или научного оптимизма), чем доказанный факт. Таким образом, в целом я готов принять тест Тьюринга как грубо адекватный в том контексте, в котором он определяется. То есть, если компьютер действительно окажется способен ответить на все заданные вопросы в точности так же, как на них ответил бы человек, и тем самым последовательно и честно[24]) надуть нашу проницательную опрашивающую, то в отсутствие свидетельств об обратном моим предположением было бы то, что компьютер действительно думает, чувствует и т. д. Использование мною слов «свидетельство», «действительно» и «предположение» подразумевает, что когда я говорю о мышлении, чувствах, понимании, или, в частности, сознании, я не отношусь к этим понятиям как к элементам общепринятой лексики, а имею в виду конкретные и объективные «вещи», присутствие или отсутствие которых в физических телах есть то, в чем мы хотели бы удостовериться. И это я считаю ключевым моментом. Пытаясь уловить присутствие данных качеств, мы делаем предположения на основании всех доступных нам свидетельств. (В принципе, точно так же действует астроном, пытаясь вычислить массу далекой звезды.) Какие же свидетельства об обратном принимать во внимание? Наперед заданные правила установить сложно. Однако, я сразу подчеркну: тот факт, что компьютер может состоять из транзисторов и проводов, а не нейронов и кровеносных сосудов, сам по себе не является аргументом, который я рассматривал бы как свидетельство об обратном. Меня не покидает мысль, что когда-нибудь будет построена удовлетворительная теория сознания — удовлетворительная в смысле логической последовательности и физической приемлемости, чудесной согласованности с другим физическим знанием. Ее предсказания будут в точности соотноситься с представлениями человека об уровне и условиях существования его собственного сознания, — и такая теория может оказаться в действительности плодотворной в разрешении проблемы предполагаемого наличия сознания у нашего компьютера. Можно даже пофантазировать о «детекторе сознания», сконструированном по принципам такой теории — абсолютно надежном в случае человека, но дающем расходящиеся с тестом Тьюринга результаты в случае компьютера. Интерпретация результатов тестов Тьюринга тогда потребует особой осторожности. По моему мнению, отношение к вопросу о пригодности теста Тьюринга отчасти зависит от предположений о том, как будет развиваться наука и техника. Ниже нам еще придется вернуться к некоторым из этих рассуждений.
рис 2.1Нужно заметить, что на схеме эта процедура не до конца разбита на простейшие составляющие, поскольку мы неявным образом предположили, что нам уже «известно», как выполнять необходимую базовую операцию получения остатка от деления двух произвольных натуральных чисел А и В. Эта операция, в свою очередь, также алгоритмична и выполняется при помощи хорошо знакомой нам со школы процедуры деления. Эта процедура, на самом деле, сложнее, чем все остальные части алгоритма Евклида, но и она может быть представлена в виде блок-схемы. Основное затруднение здесь возникает из-за использования привычной «десятичной» записи натуральных чисел, что вынуждает нас выписывать все таблицы умножения, учитывать перенос и т. п. Если бы для представления некоторого числа n мы использовали последовательность из n каких-нибудь одинаковых знаков, например, пяти звездочек (*****) для обозначения пятерки, то определение остатка свелось бы к совершенно элементарной алгоритмической операции. Для того чтобы получить остаток от деления А на В, достаточно просто убирать из записи числа А последовательность знаков, представляющих В, до тех пор, пока на некотором этапеоставшееся число знаков в записи А не станет недостаточным для выполнения следующего шага. Эта последовательность знаков и даст требуемый ответ. Например, желая получить остаток от деления 17 на 5, мы просто будем последовательно удалять ***** из *****************, как это показано ниже: ***************** ************ ******* * *, и в результате получим, очевидно, 2, так как следующее удаление уже станет невозможно. Блок-схема изложенного выше процесса нахождения остатка от деления путем последовательных вычитаний приведена на рис. 2.2.
Рис 2.2Чтобы придать блок-схеме алгоритма Евклида завершенный вид, мы должны подставить схему отыскания остатка в соответствующий блок справа в центре предыдущей схемы. Такая подстановка одного алгоритма в другой — распространенная в компьютерном программировании процедура. Алгоритм вычисления остатка, изображенный на рис. 2.2, служит примером подпрограммы, иначе говоря, это алгоритм (как правило, уже известный), вызываемый и используемый по мере надобности в ходе выполнения основного алгоритма. Безусловно, обозначение числа n просто набором из n звездочек чрезвычайно неэффективно, когда речь заходит о больших числах. Именно поэтому обычно используют более компактную запись, например, стандартную (десятичную) систему. Однако оставим в стороне эффективность операций и обозначений и уделим все внимание вопросу о том, какие операции в принципе могут выполняться алгоритмически. Действие, которое поддается алгоритмизации в одной записи, сохранит это свойство и в любой другой. Эти два случая различаются только техническими нюансами и сложностью выполнения алгоритма. Алгоритм Евклида — это лишь одна из многих, часто классических, алгоритмических процедур, встречающихся в математике повсеместно. Но, вероятно, не лишним будет отметить, что, несмотря на значительный исторический возраст отдельных алгоритмов, точная формулировка универсального определения алгоритма появилась только в двадцатом веке. В 1930-х годах было предложено несколько альтернативных формулировок этого понятия, из которых наиболее емкая и убедительная — и, к тому же, наиболее значимая в историческом плане — опирается на понятие машины Тьюринга. Поэтому нам будет полезно рассмотреть некоторые свойства этих «машин». Прежде всего следует помнить, что «машина» Тьюринга принадлежит области «абстрактной математики» и ни в коем случае не является физическим объектом. Это понятие было введено в 1935–1936 годах английским математиком и кибернетиком Аланом Тьюрингом, внесшим огромный новаторский вклад в развитие компьютерной науки (Тьюринг [1937]). Тьюринг рассматривал задачу весьма общего характера (известную как проблема алгоритмической разрешимости), которая была поставлена великим немецким математиком Давидом Гильбертом частично в 1900 году на Парижском Конгрессе математиков (так называемая «десятая проблема Гильберта»), и более полно — на международном конгрессе 1928 года в Болонье. Проблема, поставленная Гильбертом, состояла ни больше, ни меньше как в отыскании универсальной алгоритмической процедуры для решения математических задач или, вернее, ответа на вопрос о принципиальной возможности такой процедуры. Кроме того, Гильберт сформулировал программу, целью которой было построение математики на несокрушимом фундаменте из аксиом и правил вывода, установленных раз и навсегда. Но к тому моменту, когда Тьюринг написал свою великую работу, сама идея этой программы уже была опровергнута поразительной теоремой, доказанной в 1931 году блестящим австрийским логиком Куртом Геделем. Мы рассмотрим теорему Геделя и ее значение в четвертой главе. Проблема Гильберта, которую исследовал Тьюринг (Entscheidungsproblem), не зависит от какого-либо конкретного построения математики в терминах аксиоматической системы. Вопрос формулировался так: существует ли некая универсальная механическая процедура, позволяющая, в принципе, решить все математические задачи (из некоторого вполне определенного класса) одну за другой? Трудность с ответом на этот вопрос была связана отчасти с определением смысла «механической процедуры» — это понятие выходило за рамки стандартных математических идей того времени. Чтобы как-то ее преодолеть, Тьюринг постарался представить, как можно было бы формализовать понятие «машина» путем расчленения ее действий на элементарные операции. Вполне вероятно, что в качестве примера «машины», помимо прочего, Тьюринг рассматривал и человеческий мозг, тем самым относя к «механическим процедурам» все действия, которые математики выполняют, размышляя над решением математических задач. Хотя такой взгляд на процесс мышления оказался весьма полезным при разработке Тьюрингом его в высшей степени важной теории, нам совершенно необязательно его придерживаться. Действительно, дав точное определение механической процедуры, Тьюринг тем самым показал, что существуют совершенно четко определенные математические операции, которые никак не могут называться механическими в общепринятом смысле слова. Можно, наверное, усмотреть некую иронию в том, что эта сторона работы Тьюринга позволяет нам теперь косвенным образом выявить его собственную точку зрения на природу мышления. Однако, нас это пока занимать не будет. Прежде всего нам необходимо выяснить, в чем же, собственно, заключается теория Тьюринга.
Рис. 2.3. Точная машина Тьюринга требует бесконечной ленты!Но подобная идеализация является очень важной. Чудеса современных компьютерных технологий позволяют создавать электронные устройства хранения информации, которые мы можем рассматривать как неограниченные в приложении к большинству практических задач. На самом деле память устройства, которая выше была названа «внешней», можно рассматривать как внутренний компонент современного компьютера. Но это уже технические детали — рассматривать часть объема для хранения информации как внутреннюю или внешнюю по отношению к устройству. Одним из способов проводить такое деление между «устройством» и «внешней» частью могло бы стать использование понятий аппаратного (hardware) и программного (software) обеспечения вычислений. В этой терминологии внутренняя часть могла бы соответствовать аппаратному обеспечению (hardware), тогда как внешняя — программному обеспечению (software). Я не буду жестко придерживаться именно этой классификации, однако, какую бы точку зрения мы не заняли, не вызывает сомнений, что идеализация Тьюринга достаточно точно аппроксимируется современными электронными компьютерами. Тьюринг представлял внешние данные и объем для хранения информации в виде «ленты» с нанесенными на нее метками. Устройство по мере необходимости могло обращаться к этой ленте, «считывать» с нее информацию и перемещать ее вперед или назад в ходе выполнения операций. Помимо этого, устройство могло ставить новые метки на ленту и стирать с нее старые, что позволяло использовать одну и ту же ленту и как внешнюю память (то есть «черновик»), и как источник входных данных. На самом деле, не стоило бы проводить явное различие между этими двумя понятиями, поскольку во многих операциях промежуточные результаты вычислений могут играть роль новых исходных данных. Вспомним, что при использовании алгоритма Евклида мы раз за разом замещали исходные числа (А и В) результатами, полученными на разных этапах вычислений. Сходным образом та же самая лента может быть использована и для вывода окончательного результата («ответа»). Лента будет двигаться через устройство туда-сюда до тех пор, пока выполняются вычисления. Когда, наконец, все вычисления закончены, устройство останавливается, и результат вычислений отображается на части ленты, лежащей по одну сторону от устройства. Для определенности будем считать, что ответ всегда записывается на части ленты, расположенной слева от устройства, а все исходные числовые данные и условия задачи — на части ленты, расположенной справа от него. Меня всегда несколько смущало представление о конечном устройстве, которое двигает потенциально бесконечную ленту вперед и назад. Неважно, насколько легок материал ленты — сдвинуть бесконечную ленту все-таки будет трудно! Вместо этого я предпочитаю представлять себе эту ленту как некое окружение, по которому может перемещаться наше конечное устройство. (Конечно же, в современных электронных устройствах ни «лента», ни само «устройство» не должны в обычном смысле физически «перемещаться», но представление о таком «движении» позволяет достичь известной наглядности.) При таком подходе устройство получает все входные данные из этого окружения, использует его в качестве «черновика» и, наконец, записывает в него конечный результат. В представлении Тьюринга «лента» состоит из бесконечной в обоих направлениях линейной последовательности квадратов. Каждый квадрат либо пуст, либо помечен[41]. Использование помеченных и пустых квадратов означает, что мы допускаем разбиение нашего «окружения» (т. е. ленты) на части и возможность его описания множеством дискретных элементов (в противоположность непрерывному описанию). Это представляется вполне разумным, если мы хотим, чтобы наше устройство работало надежно и совершенно определенным образом. В силу используемой математической идеализации мы допускаем (потенциальную) бесконечность «окружения», однако в каждом конкретном случае входные данные, промежуточные вычисления и окончательный результат всегда должны быть конечными. Таким образом, хотя лента и имеет бесконечную длину, на ней должно быть конечное число непустых квадратов. Другими словами, и с той, и с другой стороны от устройства найдутся квадратики, после которых лента будет абсолютно пустой. Мы обозначим пустые квадраты символом «0», а помеченные — символом «1», например: Нам нужно, чтобы устройство «считывало» информацию с ленты. Мы будем считать, что оно считывает по одному квадрату за раз и смещается после этого ровно на один квадрат влево или вправо. При этом мы не утрачиваем общности рассуждений: устройство, которое читает за один раз n квадратов или перемещается на k квадратов, легко моделируется устройством, указанным выше. Передвижение на k квадратов можно построить из к перемещений по одному квадрату, а считывание n квадратов за один прием сводится к запоминанию результатов n однократных считываний. Что именно может делать такое устройство? Каким образом в самом общем случае могло бы функционировать устройство, названное нами «механическим»? Вспомним, что число внутренних состояний нашего устройства должно быть конечным. Все, что нам надо иметь в виду помимо этого — это то, что поведение нашего устройства полностью определяется его внутренним состоянием и входными данными. Входные данные мы упростили до двух символов — «0» и «1». При заданном начальном состоянии и таких входных данных устройство должно работать совершенно определенным образом: оно переходит в новое состояние (или остается в прежнем), заменяет считанный символ 0 или 1 тем же или другим символом 1 или 0, передвигается на один квадрат вправо или влево, и наконец, оно решает, продолжить вычисления или же закончить их и остановиться. Чтобы явно определить операции, производимые нашим устройством, для начала пронумеруем его внутренние состояния, например: 0,1,2,3,4,5. Тогда действия нашего устройства, или машины Тьюринга, полностью определялись бы неким явным списком замен, например: 00 → 00R 01 → 131L 10 → 651R 11 → 10R 20 → 01R.STOP 21 → 661L 30 → 370R • • • • • • 2100 → 31L • • • • • • 2581 → 00R.STOP 2590 → 971R 2591 → 00R.STOP Выделенная цифра слева от стрелки — это символ на ленте, который устройство в данный момент считывает. Оно заменяет этот символ выделенной цифрой в середине справа от стрелки. R означает, что устройство должно переместиться вдоль ленты на один квадрат вправо, a L соответствует такому же перемещению влево. (Если, в соответствии с исходным представлением Тьюринга, мы полагаем, что движется не устройство, а лента, то R означает перемещение ленты на один квадрат влево, a L — вправо.) Слово STOP означает, что вычисления завершены и устройство должно остановиться. Например, вторая инструкция 01 → 131L говорит о том, что если устройство находится в начальном состоянии 0 и считывает с ленты 1, то оно должно перейти в состояние 13, оставить на ленте тот же символ 1 и переместиться по ленте на один квадрат влево. Последняя же инструкция 2591 → 00R.STOP говорит о том, что если устройство находится в состоянии 259 и считывает с ленты 1, то оно должно вернуться в состояние 0, стереть с ленты 1, т. е. записать в текущий квадрат 0, переместиться по ленте на один квадрат вправо и прекратить вычисления. Вместо номеров 0, 1, 2, 3, 4, 5…. для обозначения внутренних состояний мы можем — и это более соответствовало бы знаковой системе нанесения меток на ленту — прибегнуть к системе нумерации, построенной только на символах «0» и «1». Состояние n можно было бы обозначить просто последовательностью из n единиц, но такая запись неэффективна. Вместо этого мы используем двоичную систему счисления, ставшую теперь общепринятой: 0 → 0, 1 → 1, 2 → 10, 3 → 11, 4 → 100, 5 → 101, 6 → 110, 7 → 111, 8 → 1000, 9 → 1001, 10 → 1010, 11 → 1011, 12 → 1100 и т. д. Здесь последняя цифра справа соответствует «единицам» точно так же, как и в стандартной (десятичной) системе записи, но цифра прямо перед ней показывает число «двоек», а не «десятков». В свою очередь третья цифра справа относится не к «сотням», а к «четверкам»; четвертая — к «восьмеркам», а не к «тысячам» и т. д. При этом разрядность каждой последующей цифры (по мере продвижения влево) дается соответственной степенью двойки: 1, 2, 4 (= 2 х 2), 8 (= 2 х 2 х 2), 16 (= 2х2х2х2), 32 (= 2x2x2х2х2). (В дальнейшем нам будет иногда удобно использовать в качестве основания системы счисления числа, отличные от «2» и «10». Например, запись десятичного числа 64 по основанию «три» даст 2101, где каждая цифра теперь — некоторая степень тройки: 64 = (2 х З3) + З2 + 1; см. главу 4). Используя двоичную запись для внутренних состояний, можно представить вышеприведенную инструкцию, описывающую машину Тьюринга, следующим образом: Здесь я к тому же сократил R.STOP до STOP, поскольку мы вправе считать, что L.STOP никогда не происходит, так как результат последнего шага вычислений, будучи частью окончательного ответа, всегда отображается слева от устройства. Предположим, что наше устройство находится во внутреннем состоянии, представленном бинарной последовательностью 11010010, и процессу вычисления соответствует участок ленты, изображенный на предыдущем рисунке. Пусть мы задаем команду 110100100 → 111L. Та цифра на ленте, которая в данный момент считывается (в нашем случае цифра «0»), показана «жирным» символом справа от последовательности нулей и единиц, обозначающих внутреннее состояние. В частично описанном выше примере машины Тьюринга (который я выбрал более-менее произвольно) считанный «0» был бы тогда замещен на «1», внутреннее состояние поменялось бы на «11» и устройство переместилось бы на один шаг влево: Теперь устройство готово к считыванию следующей цифры, снова «0». Согласно таблице, оно оставляет этот «0» нетронутым, но изменяет свое внутреннее состояние на «100101» и передвигается по ленте назад, т. е. на один шаг вправо. Теперь оно считывает «1» и находит где-то ниже в таблице инструкцию, которая определяет изменение внутреннего состояния и указывает, должна ли быть изменена считанная цифра и в каком направлении по ленте должно дальше двигаться устройство. Таким образом устройство будет действовать до тех пор, пока не достигнет команды STOP. В этой точке — после еще одного шага вправо — раздастся звонок, оповещающий оператора о том, что вычисления завершены. Мы будем считать, что машина всегда начинает с внутреннего состояния «0» и что вся лента справа от устройства изначально пуста. Все инструкции и данные подаются в устройство с правой стороны. Как упоминалось ранее, эта информация всегда имеет форму конечной строки из нулей и единиц, за которой следует пустая лента (т. е. нули). Когда машина получает команду STOP, результаты вычислений оказываются на ленте слева от считывающего устройства. Поскольку мы хотели бы иметь возможность вводить в устройство и числовые данные, то нам потребуется некий способ описания обычных чисел (под которыми я здесь имею в виду целые неотрицательные числа 0, 1, 2, 3, 4….) как части входной информации. Для представления числа n можно было бы просто использовать строку из n единиц (хотя при этом могут возникнуть трудности, когда речь зайдет о нуле): 1 → 1, 2 → 11, 3 → 111, 4 → 1111, 5 → 11111 и т. д. Эта примитивная схема нумерации называется (хотя и довольно нелогично) унарной (единичной) системой. В этом случае символ 0 мог бы использоваться в качестве пробела для разделения двух разных чисел. Наличие такого способа разделения для нас существенно, так как многие алгоритмы оперируют не отдельными числами, а множествами чисел. Например, для выполнения алгоритма Евклида наше устройство должно производить определенные действия над парой чисел А и В. Соответствующая машина Тьюринга может быть легко записана в явном виде. В качестве упражнения заинтересованный читатель может проверить, что нижеследующий набор инструкций действительно описывает машину Тьюринга (которую я буду называть EUC), выполняющую алгоритм Евклида, если в качестве исходных данных использовать два «унарных» числа, разделенных символом 0: 00 → 00R 01 → 11L 10 → 101R 11 → 11L 100 → 10100R 101 → 110R 110 → 1000R 111 → 111R 1000 → 1000R 1001 → 1010R 1010 → 1110L 1011 → 1101L 1100 → 1100L 1101 → 11L 1110 → 1110L 1111 → 10001L 10000 → 10010L 10001 → 10001L 10010 → 100R 10011 → 11L 10100 → 00.STOP 10101 → 10101R Однако я бы порекомендовал такому читателю начать не с этого упражнения, а с чего-нибудь гораздо более простого, например, с машины Тьюринга UN + 1, которая просто прибавляет единицу к числу в унарном представлении: 00 → 00R 01 → 11R 10 → 01.STOP 11 → 11R
рис. 3.1. Первый взгляд на новый мирЧто бы это могло быть? Странного вида насекомое? А может быть, темное озеро с многочисленными втекающими в него ручьями? Или огромный причудливой формы внеземной город, с исходящими в разных направлениях дорогами, которые ведут в расположенные поблизости городки и деревушки? Возможно, это остров — и если это так, то давайте поищем поблизости континент, с которым он связан. Для этого «отойдем назад», т. е. уменьшим увеличение наших приборов раз в 15. И вот — посмотрите-ка — этот новый мир предстал перед нашим взором во всей своей полноте (рис. 3.2):
Рис. 3.2. Общий вид Тор'Блед-Нам. Стрелками отмечены области, увеличенные изображения которых даны на рис. 3.1, 3.3 и 3.4На рис. 3.2 наш «островок» выглядит как маленькая точка под стрелкой «рис. 3.1». Все волокна (ручьи, дороги, мосты?), исходящие из первоначального островка, обрываются, за исключением одного — того, что выходит из внутренней части расположенной справа расщелины, и который, в свою очередь, соединен с объектом гораздо большего размера (он изображен на рис. 3.2). Последний, как нетрудно заметить, подобен первоначальному островку, хотя их формы несколько отличаются. При более подробном рассмотрении «береговой линии» выявляются бесчисленные округлые выступы, края которых, в свою очередь, густо усеяны выступами такой же формы. Каждый маленький выступ соединен в каком-нибудь месте с более крупным, и все вместе они образуют бородавчатую структуру, где более крупные выступы покрыты наростами помельче, те — еще более мелкими и т. д. По мере того, как картина становится все более отчетливой, мы видим мириады мельчайших волокон, исходящих из рассматриваемой структуры. Сами волоконца ветвятся в разных местах, беспорядочно извиваясь. В некоторых частях волокон просматриваются узлы более сложной структуры, неразрешимые при данном увеличении приборов. Ясно, что наш объект — это никакой не остров или континент, и даже не пейзаж. Не исключено, что перед нашим взором чудовищный жук, а то, что мы увидели вначале, — это его детеныш, все еще соединенный с родителем своеобразной волокнистой пуповиной. Давайте исследуем один из наростов у нашего насекомого, для чего увеличим разрешение примерно в десять раз (см. рис. 3.3 — соответствующая область на рис. 3.2. отмечена как «рис. 3.3»).
Рис. 3.3. Бородавка с «пятеричностью» своих волоконцевСвоим видом нарост сильно напоминает все существо целиком, за исключением места соединения. Обратите внимание, что на рис. 3.3 имеется множество точек, в которых сходятся пять волокон. По-видимому, этому конкретному наросту свойственна некая «пятеричность» (точно также как для самой верхней «бородавки» на рис. 3.2 характерна определенная «троичность»). На самом деле, если исследовать (на рис. 3.2) расположенный чуть ниже и левее следующий разумного размера нарост, то мы обнаружим у него «семеричность», а у следующего — характерную «девятеричность» и т. д. При углублении во впадину между двумя самыми крупными областями на рис. 3.2, справа будут встречаться наросты с постоянно нарастающим нечетным числом лучей. Давайте всмотримся внимательно вниз вглубь заостренной впадины, повысив увеличение еще в десять раз по сравнению с рис. 3.2 (рис. 3.4).
Рис. 3.4. Главная впадина. «Долина морских коньков» едва различима справа внизуМы обнаружим множество других мельчайших наростиков на фоне общего беспорядочного завихрения. Справа видны едва различимые спиралевидные структуры, напоминающие «хвосты морских коньков», расположенные в области, которую мы так и назовем — «долина морских коньков». Здесь нам встретятся — если смотреть на это место при достаточно большом увеличении — разнообразные «морские анемоны» или области с богатой флорой. В конце концов, перед нами действительно может быть какой-то экзотический берег — возможно, коралловый риф, изобилующий всевозможными формами жизни. Объект, принятый нами за цветок, при более сильном увеличении может оказаться состоящим из мириада мельчайших и при этом невероятно сложных структур, с многочисленными волокнами и вихреобразными спиралевидными хвостами. Давайте рассмотрим подробнее один из более крупных хвостов морских коньков, а именно — едва различимое образование, обозначенное на рис. 3.4 как «рис. 3.5» (и соединенное с 29-ричным наростом!). Повысив увеличение в 250 раз, мы увидим изображенную на рис. 3.5 спираль.
Рис. 3.5. Хвост «морского конька» крупным планомПри этом окажется, что это не обычный хвост: и он тоже состоит из сложнейших вихреобразных структур с многочисленными мельчайшими спиралями и областями в форме осьминогов и морских коньков!
Рис. 3.6. Дальнейшее увеличение места соединения спиралей. В центре едва различим маленький детенышВо многих местах видно, что исследуемые нами структуры расположены точно в том месте, где сходятся две спирали. Рассмотрим одно такое место (обозначенное как «рис. 3.6» на рис. 3.5) с дополнительным 30-кратным увеличением. Посмотрите-ка: в самой середине теперь виднеется странный объект, в котором, однако, есть что-то знакомое. Увеличим изображение еще в шесть раз (рис. 3.7) — появляется крохотный дочерний объект, практически идентичный всей структуре!
Рис. 3.7. При увеличении детеныш обнаруживает сходство с целым миромПри более внимательном рассмотрении обнаруживаются некоторые отличия присоединенных к этой субструктуре волокон от тех, что выходят из основной структуры, — новые волокна, закручиваясь, уходят на значительно большие относительные расстояния. И при этом маленькое существо выглядит почти неотличимым от своего родителя, — у него даже есть аналогично расположенные собственные детеныши. Можно было бы исследовать и их, если вновь повысить увеличение приборов. «Внуки» тоже будут напоминать своего общего предка — и нетрудно увидеть, что так может продолжаться до бесконечности. Этот странный мир Тор'Блед-Нам можно исследовать как угодно долго, постоянно увеличивая разрешающую способность нашей системы наблюдения. И тогда перед нами предстанет бесконечное разнообразие: никакие две области не являются в точности одинаковыми, но всем им свойственны общие черты, которые очень быстро становятся узнаваемыми. Знакомые нам уже жукообразные существа появляются на все меньших и меньших масштабах. Каждый раз при этом расположенные рядом волокнистые структуры отличаются от предыдущих, демонстрируя новые фантастические сцены невероятной сложности. В какой же странной и удивительно замысловатой по своей структуре стране мы оказались? Не сомневаюсь, что многие читатели уже знакомы с ней, но не все. Это не что иное, как фрагмент абстрактной математики — множество, известное под названием множества Мандельброта[57]. При всей его несомненной сложности оно получается на редкость простым образом! Чтобы как следует объяснить правила построения этого множества, необходимо сначала рассказать о том, что такое комплексные числа. Именно этим я сейчас займусь. Комплексные числа нам понадобятся и в дальнейшем. Они являются неотъемлемой частью структуры квантовой механики и вследствие этого лежат в основе поведения самого мира, в котором мы живем. Кроме того, комплексные числа являют собой одно из великих чудес математики. Чтобы объяснить, что такое комплексные числа, мне сначала потребуется напомнить вам, что подразумевается под термином «действительные числа». Не лишним будет также отметить связь этого понятия с действительностью «реального мира»!
Рис. 3.8. Изображение комплексного числа z = х + iy на плоскости АрганаОбратите внимание, что число 0 (рассматриваемое как комплексное число) соответствует началу координат, а число 1 — одной из точек на оси х. Плоскость Аргана есть просто способ геометрически наглядной организации семейства комплексных чисел. Такое представление не является для нас чем-то совершенно новым. Мы уже знакомы с геометрическим представлением действительных чисел — в виде прямой линии, простирающейся на неограниченное расстояние в обоих направлениях. Одна из точек обозначена как 0, а еще одна — как 1. Точка 2 смещена относительно точки 1 равно настолько, насколько точка 1 смещена относительно точки 0; точка 1/2 расположена в точности посередине между точками 0 и 1; точка -1 расположена так, что точка 0 находится в точности посередине между точками -1 и 1, и т. д., и т. п. Отображенное таким образом множество действительных чисел называется действительной прямой. В случае комплексных чисел у нас есть уже целых два действительных числа — а и b — которые могут рассматриваться как координаты комплексного числа а + ib. Эти два числа дают нам две координаты точки на плоскости, в данном случае — на плоскости Аргана. Для примера я указал на рис. 3.9 приблизительные положения комплексных чисел u = 1 + i 1,3, v = -2 + i, w = -1,5 — i 0,4.
Рис. 3.9. Расположение чисел u = 1 + i1,3, v = -2 + i, ω = -1,5 — i0,4 на плоскости АрганаТеперь основные алгебраические операции сложения и умножения комплексных чисел приобретают ясную геометрическую интерпретацию. Рассмотрим сначала сложение. Предположим, что u и v это два комплексных числа, представленные на плоскости Аргана в соответствии с описанной выше схемой. Тогда сумма этих двух чисел u + v представляется «векторной суммой» двух точек, то есть точка u + v находится на месте недостающей вершины параллелограмма, образованного точками u, v и началом координат 0. Нетрудно убедиться, что эта конструкция (рис. 3.10) действительно дает сумму двух чисел, но соответствующее доказательство я здесь опускаю.
Рис. 3.10. Сумма u + v двух комплексных чисел определяется по правилу параллелограммаПроизведение uv двух комплексных чисел тоже имеет простую, хотя и, быть может, несколько менее очевидную геометрическую интерпретацию (рис. 3.11). (Я опять опускаю доказательство.)
Рис. 3.11. Произведение uv двух комплексных чисел u и v — это такое число, что треугольник, образованный точками 0, v и uv, подобен треугольнику, образованному точками 0, 1 и u. То же самое можно сформулировать иначе: расстояние точки uv от 0 равно произведению расстояний от 0 до точек u и v, а угол между uv и действительной (горизонтальной) осью равен сумме углов между этой осью и отрезками к точкам и и vУгол при начале координат между 1 и uv равен сумме углов между 1 и v и между 1 и u (все углы измеряются против часовой стрелки), а расстояние точки uv от начала координат равно произведению расстояний от начала координат до u и v. Это эквивалентно утверждению, что треугольник, образованный точками 0, v и uv подобен (и ориентирован подобно) треугольнику, образованному точками 0, 1 и u. (Энергичные читатели, не знакомые с такого рода построениями, могут сами убедиться в том, что эти построения непосредственно следуют из только что приведенных алгебраических правил сложения и умножения комплексных чисел, также как и упомянутые выше тригонометрические тождества.)
Рис. 3.12. Последовательность точек на плоскости Аргана ограничена, если вся она целиком помещается в пределах некоторого фиксированного круга. (Итерация на рисунке начинаетсл с точки 0 и построена для с = — l/2 + (l/2)i.)Хорошим примером здесь может служить последовательность с = 0, поскольку каждый ее член равен 0. Другим примером ограниченного поведения является случай с = 1, при котором получается последовательность 0, -1, 0, -1, 0, -1….; еще один пример — это с = i, когда получается последовательность 0, i, i — 1, -i, i — 1, -i, i — 1, -i….. Однако, для целого ряда других комплексных чисел с получаемая последовательность все дальше удаляется от начала координат, то есть является неограниченной и не может находиться целиком в пределах фиксированного круга. Именно так происходит при с = 1, когда получается последовательность 0, 1, 2, 5, 26, 677,458 330….; аналогичное поведение имеет место в случае с = 3 — соответствующая последовательность имеет вид 0, -3, 6, 33,1086….; а также случай с = i — 1, который приводит к последовательности 0, i — 1, -i — 1, -1 + 3i, — 9 — i5, 55 + i91, -5257 + i10011, Множество Мандельброта — то есть зачерненная часть страны Тор'Блед-Нам[64] — как раз и есть та самая область на плоскости Аргана, что состоит из всех точек с, для которых получаемая последовательность является ограниченной. Белая же область состоит из тех точек с, для которых получается неограниченная последовательность. Приведенные выше подробные рисунки основаны на результатах компьютерных вычислений. На компьютере был проведен систематический перебор всевозможных комплексных чисел с, для каждого из них строилась последовательность 0, с, с2+с…, после чего согласно некоторому критерию определялось, ограничена или нет получаемая последовательность. Если последовательность оказывалась ограниченной, то соответствующая числу с точка экрана становилась черной. Таким образом, для каждой точки в рассматриваемой области компьютер решал, закрасить ее в белый или черный цвет. Множество Мандельброта впечатляет своей сложностью, особенно учитывая, как это часто бывает в математике, удивительную простоту его определения. Кроме того, структура этого множества в целом не очень чувствительна к выбору алгебраической формы отображения — z → z2 + с. Многие другие итеративные отображения (например, z → z3 + iz2 + c) приводят к поразительно похожим структурам (при условии выбора подходящего начального числа — возможно, это не 0, а значение, четко задаваемое вполне определенным математическим правилом для каждого разумно выбранного отображения). Подобные «мандельбротовы» структуры характеризуются некоторыми универсальными или абсолютными свойствами по отношению к итеративным комплексным отображениям. Изучение таких структур является предметом отдельного раздела математики — так называемой теории комплексных динамических систем.
«Да, есть странные утверждения, вроде Pk(k), для которых мое понятие доказуемости или ИСТИНЫ расходится с вашим интуитивным понятием истинности, но подобные выражения едва ли встречаются в серьезной математике (по крайней мере не в такой, которая меня интересует), поскольку они абсурдно усложнены и неестественны для математики».Несомненно, что утверждения вида Pk(k), будучи полностью выписанными, были бы чрезвычайно громоздки и выглядели бы странно для числовых математических выражений. Однако за последнее время были выдвинуты сравнительно простые выражения приемлемого с точки зрения математики характера, которые эквивалентны утверждениям Геделя[74]. Они недоказуемы на основании обычных аксиом арифметики, однако же следуют из некоего свойства «самоочевидности», которым обладает сама система аксиом. Отсутствие интереса к «математической истине», исповедуемое формалистами, кажется мне очень странной позицией в приложении к философии математики. Более того: она совсем не так прагматична, как представляется. Когда математики проводят свои выкладки, они не намерены постоянно проверять, могут ли они быть сформулированы посредством аксиом и правил вывода некоторой сложной формальной системы. Единственно, что необходимо — быть уверенным в правомерности использования этих рассуждений для установления истины. Доказательство Геделя удовлетворяет этому требованию, так что Pk(k) является математической истиной с таким же правом, как и любое другое утверждение, полученное более стандартным путем с использованием изначально заданных аксиом и правил вывода. Процедура, которая напрашивается сама собой, заключается в следующем. Давайте положим, что Pk(k) — совершенно верное утверждение (переобозначим его здесь как G0). Тогда мы можем присоединить его к нашей системе в качестве дополнительной аксиомы. Естественно, что наша новая система будет, в свою очередь, содержать новое утверждение Геделя, скажем, G1, которое также будет истинным числовым выражением. Соответственно, мы можем и G1 добавить в нашу систему. Это даст нам новую улучшенную систему, которая также содержит новое утверждение Геделя G2 (опять же совершенно справедливое); и мы сможем снова добавить его к системе, получая следующее утверждение Геделя G3 , которое мы тоже присоединяем — и так далее, повторяя этот процесс неограниченно. Что мы можем сказать о получившейся в результате системе, где мы используем весь набор G0, G1, G2, G3…. как дополнительные аксиомы? Может ли эта система быть полной? Поскольку мы теперь имеем неограниченную (бесконечную) систему аксиом, то возможность применения процедуры Геделя совсем не очевидна. Однако, это последовательное включение утверждений Геделя является в высшей степени систематичной схемой, результат применения которой может быть истолкован как обычная конечная система аксиом и правил вывода. Эта система будет иметь свое собственное утверждение Геделя Gω которое мы также сможем к ней присоединить, получая новую систему и с ней — еще одно утверждение Геделя Gω+1. Продолжая, как и ранее, мы получаем набор утверждений Gω , Gω+1 ,Gω+2 , Gω+3, каждое из которых истинно и может быть включено в нашу формальную систему. Сохраняя свойство строгой систематичности, этот процесс вновь приводит нас к созданию новой системы, которая охватывает все созданные к этому моменту аксиомы. Но и эта система, в свою очередь, имеет свое собственное утверждение Геделя, скажем, Gω+ω— которое можно переписать как Gω2, и мы можем начать всю процедуру заново. В результате этого мы получим новый бесконечный, но систематический, набор аксиом Gω2 , Gω2+1, Gω2+2, и т. д., приводящий к еще одной новой системе — и новому утверждению Геделя Gω3. Воспроизводя весь процесс, мы получаем Gω4 , потом — Gω5 и так далее. И эта схема также будет полностью систематичной и даст свое собственное утверждение Геделя Gω2. Есть ли логическое завершение у этого процесса? В определенном смысле — нет; но это приводит нас к ряду трудных математических рассуждений, которые здесь не могут быть нами рассмотрены во всех деталях. Вышеуказанная процедура обсуждалась Аланом Тьюрингом в статье[75], опубликованной в 1939 году. Примечательно, что на самом деле любое истинное (в общепринятом смысле) утверждение в арифметике может быть получено путем повторения процедуры «геделизации» такого рода (см. Феферман [1988]). Однако это может вызвать вопрос о том, как мы в действительности решаем, является ли утверждение истинным или ложным. Исключительно важным будет также понять, как на каждом этапе нужно выполнять присоединение бесконечного семейства утверждений Геделя, чтобы они порождали единственную дополнительную аксиому (или конечное число аксиом). Для выполнения такого присоединения требуется определенная алгоритмическая систематизация нашего бесконечного семейства. Чтобы быть уверенным в том, что подобная систематизация корректна и приводит к желаемому результату, нам придется опереться на интуитивные представления, выходящие за рамки системы — точь-в-точь, как мы это сделали для установления истинности Pk(k). Именно эти «прозрения» и не могут быть систематизированы, не говоря о том, что они должны лежать вне сферы действия любой алгоритмической процедуры! Интуитивная догадка, которая позволила нам установить, что утверждение Геделя Pk(k) является на самом деле истинным, представляет собой разновидность общей процедуры, известной логикам как принцип рефлексии: посредством нее, размышляя над смыслом системы аксиом и правил вывода и убеждаясь в их способности приводить к математическим истинам, можно преобразовывать интуитивные представления в новые математические выражения, невыводимые из тех самых аксиом и правил вывода. То, как нами была выше установлена истинность Pk(k), как раз базировалось на применении этого принципа. Другой принцип рефлексии, имеющий отношение к доказательству Геделя (хотя и не упомянутый выше), опирается на вывод новых математических истин исходя из представления о том, что система аксиом, которую мы полагаем априори адекватной для получения математических истин, является непротиворечивой. Применение принципов рефлексии часто подразумевает размышления о бесконечных множествах, и при этом нужно быть всегда внимательным и остерегаться рассуждений, которые могут привести к парадоксам наподобие расселовского. Принципы рефлексии полностью противопоставляются рассуждениям формалистов. Если использовать их аккуратно, то они позволяют вырваться за жесткие рамки любой формальной системы и получить новые, основанные на интуитивных догадках, представления, которые ранее казались недостижимыми. В математической литературе могло бы быть множество приемлемых результатов, чье доказательство требует «прозрений», далеко выходящих за рамки исходных правил и аксиом стандартной формальной системы арифметики. Все это свидетельствует о том, что деятельность ума, приводящая математиков к суждениям об истине, не опирается непосредственно на некоторую определенную формальную систему. Мы убедились в истинности утверждения Геделя Pk(k), хотя мы и не можем вывести ее из аксиом системы. Этот тип «вйдения», используемый в принципе рефлексии, требует математической интуиции, которая не является результатом чисто алгоритмических операций, представимых в виде некоторой формальной математической системы. Мы вернемся к этому вопросу в главе 10. Читатель может заметить определенное сходство между рассуждениями, устанавливающими, вопреки «недоказуемости», истинность Pk(k), и парадоксом Рассела. Помимо этого, наблюдается сходство и с доказательством Тьюринга о невозможности существования «машины Тьюринга», которая могла бы решить проблему остановки. Эти сходства не случайны. Между этими тремя событиями имеется прочная историческая нить. Тьюринг пришел к своему доказательству после изучения работ Геделя. Сам Гедель был очень близко знаком с парадоксом Рассела и смог преобразовать те парадоксальные рассуждения, которые уводили слишком далеко в область логических абстракций, в состоятельное математическое доказательство. (Все эти утверждения уходят корнями к диагональному процессу Кантора, описанному в предыдущей главе) Почему мы должны принимать доказательства Геделя и Тьюринга и в то же время сбрасывать со счетов рассуждения, ведущие к парадоксу Рассела? Первые являются более ясными и безупречными с точки зрения математики, тогда как парадокс Рассела строится на более туманных рассуждениях об «огромных» множествах. Но нужно признать, что различия здесь не настолько очевидны, как нам хотелось бы. Попытка придать этим различиям ясность была лейтмотивом всей идеи формализма. Доказательство Геделя, с одной стороны, показывает, что строгий формальный подход не выдерживает критики, но с другой стороны, оно не приводит нас к абсолютно надежной альтернативе. По-моему, этот вопрос до сих пор не разрешен. Процедура, используемая в современной математике с целью избежать рассуждений, вовлекающих в рассмотрение «огромные» множества и приводящих к парадоксу Рассела, не является полностью удовлетворительной[76]. Более того, она, как правило, формулируется в чисто формалистских терминах — или же в терминах, которые не дают нам полной уверенности, что в результате их использования не возникнет противоречий. Как бы там ни было, мне кажется, что из доказательства Геделя следует с очевидностью, что понятие математической истины не может быть заключено ни в. одну из формальных систем. Математическая истина выходит за рамки любого формализма. Возможно, это ясно даже без теоремы Геделя. Иначе как бы мы решали, какие аксиомы и правила вывода брать в расчет при построении формальной системы? Нашим руководством в принятии такого решения должно всегда служить интуитивное понимание о том, что является «самоочевидно верным» с учетом «смысловых значений» символов системы. Как нам решить, какие формальные системы стоит использовать (в соответствии с нашим интуитивным ощущением «самоочевидности» и «смысла»), а какие — нет? Понятие «внутренней непротиворечивости» явно не подходит для этой цели. Можно иметь много внутренне непротиворечивых систем, которые «бессмысленны» с точки зрения их практического использования, в которых аксиомы и правила вывода имеют ложные в нашем понимании значения или же не имеют никаких. «Самоочевидность» и «смысл» — это понятия, которые потребовались бы даже без теоремы Геделя. Однако, без этой теоремы могло бы сложиться впечатление, что интуитивные понятия «самоочевидность» и «смысл» могли бы быть использованы только в самом начале раз и навсегда, просто чтобы изначально задать формальную систему, а затем мы могли бы отказаться от них при построении строгого математического доказательства для определения истины. Тогда, в соответствии с формалистскими воззрениями, эти «расплывчатые» интуитивные понятия задействовались бы только в «предварительных» размышлениях математиков, направленных на отыскание подходящего формального доказательства; а потом, когда дело дойдет до определения математической истины, они уже не играли бы никакой роли. Теорема Геделя демонстрирует, что такой подход в действительности не является логически состоятельным в рамках фундаментальной философии математики. Понятие математической истины выходит за пределы всей теории формализма. В этом понятии есть нечто абсолютное и «данное свыше». И это как раз то, о чем трактует математический платонизм, обсуждаемый в конце предыдущей главы. Всякая формальная система имеет свойство сиюминутности и «человеко-зависимости». Такие системы, безусловно, играют очень важную роль в математических рассуждениях, но они могут указывать только частично верное (или приблизительное) направление к истине. Настоящая математическая истина выходит за пределы сотворенного человеком.
Рис. 4.1. Очень схематичное представление рекурсивного множестваНа рис. 4.1 я попытался схематически представить рекурсивное множество как фигуру с простой и изящной границей, так что кажется, что определить непосредственно принадлежность произвольной точки этому множеству — дело несложное. Каждая точка на рисунке соответствует некоторому натуральному числу. При этом дополнительное множество также представлено в виде просто выглядящей области на плоскости. На рис. 4.2 я постарался изобразить рекурсивно нумеруемое, но не рекурсивное множество в виде области со сложной границей, где подразумевается, что множество с одной стороны границы, — той, что рекурсивно нумеруема — должно выглядеть проще, чем с другой.
Рис. 4.2. Очень схематичное представление рекурсивно нумеруемого множества (темная область), которое не является рекурсивным. Здесь светлая область определяется только по «остаточному принципу», когда удаляется темная часть, построенная при помощи вычислений; а установить путем прямых вычислений, принадлежит ли заданная точка белой области, нельзяФигуры очень схематичны и не претендуют на какую бы то ни было «геометрическую аккуратность». И конечно же, не стоит придавать большого значения тому, что эти рисунки изображены так, как если бы они были расположены на двумерной плоскости! На рис. 4.3 я схематично обозначил, как расположены области Р, Т и А внутри множества N.
Рис. 4.3. Очень схематичное представление различных множеств утверждений. Множество Р утверждений, доказуемых в рамках системы, является, как и А, рекурсивно нумеруемым, но не рекурсивным. Множество Т истинных утверждений даже не рекурсивно нумеруемо
Рис. 4.4. Единичный круг, безусловно, должен рассматриваться как рекурсивное множество, но это требует определенных соглашенийТрудность возникает не с точками, лежащими внутри или снаружи, а именно с точками на самой границе круга — то есть на самой единичной окружности. Эта окружность рассматривается по условию как часть круга. Предположим, что нам уже предоставлен в распоряжение алгоритм для получения цифр вещественной и мнимой частей некоторого комплексного числа. Если мы предполагаем, что это комплексное число лежит на единичной окружности, то мы не можем с необходимостью подтвердить этот факт. Не существует алгоритма, чтобы установить, является ли вычислимое число x2 + y2 равным единице, что служит критерием для принадлежности комплексного числа х + iy данной единичной окружности. Очевидно, это совсем не то, что нам нужно. Единичный круг, безусловно, должен рассматриваться как рекурсивное множество. Едва ли найдется сколь-нибудь значительное число множеств, более простых, чем единичный круг! Чтобы обойти эту проблему, одним из способов может быть игнорирование границы. Ведь для точек, лежащих внутри (или снаружи), безусловно существует алгоритм, устанавливающий этот факт. (Можно просто последовательно генерировать цифры числа х2+у2, и, в конце концов, мы найдем цифру, отличную от 9 в дробной части 0,9999… или отличную от 0 — в дробной части 1,00000…) В этом смысле единичный круг является рекурсивным. Но этот подход чрезвычайно неудобен для математики, поскольку там часто возникает необходимость ссылаться в рассуждениях на то, что происходит именно на границах. С другой стороны, вполне возможно, что такая точка зрения окажется применимой в области физики. Позднее нам еще придется вернуться к этому вопросу. Существует другой метод, имеющий непосредственное отношение к данному вопросу, который не предполагает вообще обращения к вычислимым комплексным числам. Вместо того, чтобы пытаться пронумеровать комплексные числа внутри или снаружи рассматриваемого множества, мы просто будем вызывать алгоритм, который для любого наперед заданного комплексного числа будет определять, принадлежит оно нашему множеству или же его дополнению. Говоря «наперед заданный», я подразумеваю, что для каждого числа, которое мы рассматриваем, нам некоторым — быть может, «волшебным» — образом известны цифры мнимой и вещественной части, одна за другой, и в таком количестве, сколько нам нужно. Я не требую, чтобы существовал алгоритм, известный или неизвестный, для нахождения этих цифр. Множество комплексных чисел считалось бы «рекурсивно нумеруемым», если бы существовал хотя бы единственный алгоритм такой, что для любой заданной ему вышеуказанным образом последовательности цифр он бы говорил «да» после конечного числа шагов тогда и только тогда, когда комплексное число действительно принадлежит этому множеству. Оказывается, что как и в случае подхода, предложенного выше, эта точка зрение также «игнорирует» границы. Следовательно, внутренняя и внешняя области единичного диска будут каждая по отдельности считаться рекурсивно нумеруемыми в указанном смысле, тогда как сама граница — нет. Для меня совершенно не очевидно, что какой-либо из этих методов дает то, что нам нужно[86]. Философия «игнорирования границ», будучи приложенной к множеству Мандельброта, может привести к потере большого числа тонких моментов. Одна часть этого множества состоит из «клякс» — внутренних областей, а другая — из «усиков». Наибольшие сложности при этом связаны, видимо, с «усиками», которые могут «извиваться» самым причудливым образом. Однако, «усики» не принадлежат внутренней части множества, и, тем самым, они были бы проигнорированы, используй мы любой из двух вышеприведенных подходов. Но даже при таком допущении остается неясность, можно ли считать множество Мандельброта рекурсивным в том случае, когда рассматриваются только «кляксы». Похоже, что вопрос этот связан с некоторым недоказанным предположением, касающимся самого множества, а именно: является ли оно, что называется, «локально связным»? Я не собираюсь здесь разбирать значение этого понятия или его важность для данного вопроса. Я хочу просто показать, что существует ряд трудностей, которые вызывают неразрешенные на сегодняшний день вопросы, касающиеся множества Мандельброта, чье решение — первоочередная задача для некоторых современных математических исследований. Существуют также и другие подходы, которые могут использоваться с тем, чтобы обойти проблему несчетности комплексных чисел. Вместо того, чтобы рассматривать все вычислимые комплексные числа, можно ограничиться только подмножеством таких чисел, для любой пары которых можно вычислительным путем установить их равенство. Простым примером такого подмножества могут служить «рациональные» комплексные числа, у которых как мнимая, так и вещественная части могут быть представлены рациональными числами. Я не думаю, однако, что это дало бы многое в случае «усиков» множества Мандельброта, поскольку такая точка зрения накладывает очень значительные ограничения. Более удовлетворительным могло бы оказаться рассмотрение алгебраических чисел — тех комплексных чисел, которые являются алгебраическими решениями уравнений с целыми коэффициентами. Например, все решения z уравнения 129z7 — ЗЗz5 + 725z4 + 16z3 — 2z — 3 = 0 — это алгебраические числа. Такие числа будут счетными и вычислимыми, и задача проверки двух из них на равенство будет решатся путем прямого вычисления. (Как выясняется, многие из них будут лежать на границе единичного круга и «усиков» множества Мандельброта.) И мы можем по желанию рассматривать вопрос о рекурсивности множества Мандельброта в терминах этих чисел. Возможно, что алгебраические числа оказались бы подходящим инструментом для двух обсуждаемых нами множеств, но они не снимают все наши трудности в общем случае. Пусть мы рассматриваем множество (темная область на рис. 4.5), определяемое неравенством y ≥ ez, где х + iy(= z) — точка в плоскости Аргана.
Рис. 4.5. Множество, определенное экспоненциальным соотношением у ≥ еz, должно также рассматриваться как рекурсивноеВнутренняя часть множества, равно как и внутренняя часть его дополнения, будут рекурсивно нумеруемыми в соответствии с любой из вышеизложенных точек зрения, но (как следует из знаменитой теоремы Ф.Линдеманна, доказанной в 1882 году) граница, у = ех, содержит только одну алгебраическую точку, а именно точку z = i. В этом случае алгебраические числа никак не могут нам помочь при исследовании алгоритмической по своей природе границы! Несложно определить другой подкласс вычислимых чисел, которые будут подходить в данном конкретном случае, но при этом все равно останется ощущение, что правильный подход нами до сих пор так и не был найден.
Рис. 4.6. Два примера периодического замощения плоскости фигурой одной формы (предложены Марджори Райе (Marjorie Rice) в 1976 году)Замощение фигурами двух форм может стать более хитроумной задачей. Два простых примера даны на рис. 4.7.
Рис. 4.7. Два примера периодического замощения плоскости фигурами двух формВсе эти замощения являются периодическими; это означает, что они в точности повторяются по всей плоскости в двух независимых направлениях. На языке математики мы бы сказали, что существует параллелограмм периодов — параллелограмм, который, будучи неким образом выделен и затем повторен снова и снова в двух направлениях, параллельных его сторонам, даст в результате заданный узор покрытия. На рис. 4.8. представлен пример, где периодическое покрытие слева состоит из «плиток» в форме шипов, а справа указан соответствующий параллелограмм периодов.
Рис. 4.8. Периодическое замощение и его параллелограмм периодовС другой стороны, существует множество типов замощений плоскости, которые не являются периодическими. Рис. 4.9 изображает три непериодических «спиральных» замощения из таких же шиповидных «плиток», как и на рис. 4.8.
Рис. 4.9. Три непериодических «спиральных» замощения из таких же «универсальных» плиток, как и на рис. 4.8Эта форма «плиток», известная как «универсальная» (по вполне понятным причинам!), была предложена Б. Грюнбаумом и Дж. К. Шепардом [1981, 1987] на основании форм, изученных X. Фодербергом. Обратите внимание, что универсальная форма позволяет замостить плоскость как периодически, так и непериодически. Это свойство характерно и для многих других форм единичных «плиток» и наборов «плиток». А могут ли существовать «плитки» (или конечные наборы «плиток»), которые бы покрывали плоскость только непериодически? Ответ на этот вопрос будет «да». На рис. 4.10 я изобразил сконструированный американским математиком Рафаэлем Робинсоном набор из фигур шести различных форм, которым можно замостить всю плоскость, но только непериодическим образом.
Рис. 4.10. Набор Рафаэля Робинсона из шести плиток, который покрывает плоскость только непериодическиНебесполезно было бы сделать историческое отступление и посмотреть, как появился это непериодический набор (см. Грюнбаум, Шепард [1987]). В 1961 году американский логик китайского происхождения Хао Ванг поставил вопрос о существовании процедуры для решения задачи замощения, или, иными словами, о нахождении алгоритма, который позволил бы выяснить возможность замощения всей плоскости с помощью конечного набора многоугольников различной формы![89] Ему удалось показать, что такая процедура могла бы существовать, если бы получилось доказать следующую гипотезу: любой конечный набор разных «плиток», с помощью которого можно каким-нибудь способом выполнить замощение плоскости, пригоден также и для ее периодического замощения. Мне думается, в то время интуитивно казалось, что не может существовать набор «плиток», нарушающий это условие (т. е. не может существовать «непериодический» набор плиток). Однако в 1966 году, следуя в указанном Хао Вангом направлении, Роберт Бергер смог показать, что, на самом деле, процедуры решения задачи покрытия не существует: эта задача также принадлежит области нерекурсивной математики![90] С учетом доказанного Хао Вангом это означало, что хотя бы один непериодический набор «плиток» должен существовать; и Бергер смог построить первый такой набор. Однако, из-за сложности выбранного им способа рассуждений, его набор состоял из ненормально большого числа «плиток» разной формы — изначально их насчитывалось 20 426. Использовав некоторый дополнительный искусный прием, Бергеру удалось сократить это число до 104. А в 1971 году Рафаэль Робинсон довел его до шести, которые изображены на рис. 4.10 выше. Другой непериодический набор из шести «плиток» представлен на рис. 4.11. Это множество я придумал сам в 1973 году, следуя в своих рассуждениях несколько отличным путем. (Я вернусь к этой теме в главе 10 «Плиточные структуры и квазикристаллы», где на рис. 10.3, изображен массив, покрытый такими «плитками».)
Рис. 4.11. Другой набор из шести плиток, который покрывает плоскость только непериодическиПосле того, как, я познакомился с «шестиплиточным» набором Робинсона, я начал думать о том, как сократить их число; и путем различных манипуляций с разрезаниями и склеиванием я, в конечном счете, смог довести количество «плиток» до двух. Две альтернативные схемы представлены на рис. 4.12.
Рис. 4.12. Две пары плиток, которые покрывают плоскость только непериодически («плитки Пенроуза»). Также показано замощение плоскости каждой из этих парУзоры, которые получаются в результате полного замощения и имеющие с необходимостью непериодическую структуру, обладают рядом замечательных свойств, в том числе — кажущейся невозможной с точки зрения кристаллографии квазипериодической симметрией с осью пятого порядка. К этому вопросу я вернусь позднее. Вероятно, это покажется удивительным, что такая очевидно «тривиальная» область математики, как замощение плоскости конгруэнтными «плитками», которая выглядит не более серьезно, чем «детская игра», на самом деле является частью нерекурсивной математики. В действительности эта область содержит множество трудных и не решенных пока задач. Пока неизвестно, например, есть ли единственная «плитка» такой формы, которая бы покрывала всю плоскость непериодически. Задача замощения, в том виде, как она исследовалась Вангом, Бергером и Робинсоном, формулируется для «плиток», построенных на квадратах. Я же здесь допускаю рассмотрение многоугольников произвольной формы, и поэтому необходимо наличие какого-нибудь способа изображения каждой из «плиток», поддающегося адекватному вычислению. Одним из таких путей могло бы быть представление вершин «плиток» точками плоскости Аргана, которые превосходно задаются алгебраическими числами.
Рис. 4.13. Бо́льшая часть внутренней области множества Мандельброта может быть определена простыми алгоритмическими уравнениямиЕе внутренняя часть представляет собой множество точек с = z — 1, где z — удалено от начала координат на расстояние меньше 1/4. Эта область, несомненно, является внутренностью диска, так как представляет собой множество точек, лежащих внутри правильной окружности. И, опять же, эта область является рекурсивно нумеруемой в принятом нами смысле. А как насчет других «бородавок» на кардиоиде? Возьмем две следующие по величине «бородавки». Это практически круглые «кляксы», располагающиеся примерно наверху и внизу кардиоиды на рис. 3.2 и которые на рис. 4.13 обозначены через С1 и С2. Они могут быть описаны как множество c3 + 2с2 + (1 — z)c + (1 — z)2 = 0, где z изменяется в пределах круга радиуса 1/8 с центром в начале координат. Фактически, это уравнение дает нам не только обе эти «кляксы», но и «дочернюю» фигуру кардиоидной формы (основную часть рис. 3.1), которая находится слева на рис. 3.2 и которая обозначена как С3 на рис. 4.13. И, аналогично, эти области (как порознь, так и вместе) составляют рекурсивно нумеруемые множества благодаря существованию вышеприведенной формулы. Несмотря на предположение о нерекурсивности множества Мандельброта, сделанное мной вначале, мы смогли разобраться с его наиболее значительными частями с помощью вполне определенного и достаточно простого алгоритма. Кажется, что такой процесс можно продолжать и дальше. Все наиболее очевидные области множества — и, конечно же, подавляющая часть множества (если не все оно целиком) в процентном выражении — поддаются алгоритмическому анализу. Если, как я предполагаю, все множество все-таки нерекурсивно, то те области, которые недоступны для действия алгоритма, должны быть с необходимостью очень «тонкими» и почти «невидимыми». Более того: когда мы найдем такую область, то вероятнее всего мы смогли бы понять, как нам изменить наш алгоритм, чтобы эта область также оказалась в зоне его действия. Однако, после этого найдутся другие области (если мое предположение о нерекурсивности справедливо), еще более труднодоступные из-за тонкости и сложности своей структуры, перед которыми будет бессилен даже наш усовершенствованный алгоритм. И вновь «волшебство» интуиции, искусства и техники, наверное, позволит нам вычленить эту область; но другие в очередной раз ускользнут от нас; и так будет повторяться снова и снова. Я полагаю, что этот путь не слишком отличается от того, который часто используется в математике для решения трудных и, предположительно, нерекурсивных задач. Многие задачи, с которыми сталкиваются в некоторых специфических областях, часто решаются с помощью простых алгоритмических процедур — процедур, известных, быть может, на протяжении веков. Но некоторые из этих задач могут не поддаться таким методам, и тогда приходится искать более сложные пути к их решению. Такие задачи будут, конечно, сильнее всего интриговать математиков и подталкивать их к развитию все более мощных методов, в основу которых будет закладываться все более и более глубокое интуитивное понимание природы используемых математических объектов. Возможно, в этом есть что-то от того, как мы познаем окружающий нас физический мир. В задачах покрытия и задачах со словами, рассмотренных выше, можно уже уловить, как применяется подобный подход (хотя это не те области математики, где аппарат развит в достаточной степени). Мы смогли привести очень простое доказательство для того, чтобы показать невозможность трансформации одного слова в другое при помощи установленных правил. Нетрудно вообразить, что более «продвинутые» методы доказательства способны помочь в более сложных случаях. Не исключена вероятность, что эти новые подходы могут быть превращены в алгоритмические процедуры. Мы знаем, что ни одна процедура не может удовлетворять всем примерам задачи со словами, но те из них, которые ускользают из «алгоритмических сетей», должны быть очень тонко и аккуратно сконструированы. Конечно, как только мы узнаем принцип построения таких примеров — как только мы будем уверены, что в неком конкретном случае произошла «осечка» алгоритма, — мы сможем усовершенствовать наш алгоритм так, чтобы он включал и этот частный пример. Ускользать могут только пары «неравных» слов, так что, как только мы находим такую «ускользающую» пару, мы можем быть уверены в их «неравенстве» и присовокупить этот критерий к нашему алгоритму. Так наше более глубокое понимание ведет ко все более совершенным алгоритмам!
Рис. 4.14. Граф с гамильтоновым циклом (изображен зачерненными линиями). Существует только один гамильтонов цикл, как читатель может сам убедитьсяЕсть разные способы представления графов на языке двоичных чисел. Неважно, какой из этих способов применяется в том или ином случае. Один из методов заключается в том, чтобы пронумеровать вершины 1, 2, 3, 4, 5…, а потом перечислить пары в некотором подходящем фиксированном порядке: (1,2), (1,3), (2,3), (1,4), (2,4), (3,4), (1,5), (2, 5), (3,5), (4, 5), (1,6)…. Затем мы на место каждой пары помещаем «1», если пара соединена стороной графа, и «О» — в противном случае. Тогда двоичная последовательность 10010110110… будет означать, что вершина 1 соединяется с вершинами 2, 4 и 5; вершина 3 — с вершинами 4 и 5; вершина 4 — с вершиной 5, и т. д. (в соответствии с рис. 4.14). Гамильтонов цикл может быть задан по желанию просто как подмножество этих сторон, которое было бы описано такой же двоичной последовательностью, как и ранее, но со значительно бо́льшим числом нулей. Процедура проверки в этом случае проходит несравненно быстрее, чем процесс непосредственного построения гамильтонова цикла. Все, что нужно выяснить, — это является ли построенный цикл действительно циклом, т. е. принадлежат ли его стороны исходному графу, и что каждая вершина графа используется ровно два раза — по одному разу на концах каждой из входящих в нее двух сторон. Такую процедуру проверки можно легко завершить за «полиномиальное» время. На самом деле эта задача относится не только к NP, но к так называемой категории NP-полных задач. Это означает, что любая другая NP-задача может быть сведена к данной за «полиномиальное» время — так что, если бы кому-нибудь удалось отыскать алгоритм для решения задачи нахождения гамильтонова цикла за «полиномиальное» время (т. е. показать, что задача гамильтонова цикла действительно принадлежит Р), то это будет означать, что все NP-задачи будут лежать в Р! Это имело бы очень важные следствия. В широком смысле, задачи из Р считаются «податливыми» (иначе говоря, «решаемыми за приемлемое время») для относительно больших n, на быстром современном компьютере; тогда как задачи из NP, но не лежащие в Р, считаются «неподатливыми» (т. е. решаемыми в принципе, но «нерешаемыми практически») для тех же n — независимо от того, на какое разумно предсказуемое увеличение быстродействия компьютеров рассчитывать в будущем. (Реальное время, которое бы потребовалось для достаточно больших n при решении «неподатливой» задачи, легко превосходит возраст вселенной, что никак не предполагает практическое использование такого подхода!) Любой «умный» алгоритм для решения задачи о нахождении гамильтонова цикла за «полиномиальное» время мог бы быть превращен в алгоритм для решения всех прочих NP-задач, и тоже за «полиномиальное» время! Другая задача, также являющаяся NP-полной[94] — «задача коммивояжера», которая во многом похожа на гамильтонов цикл, если не считать того, что разным сторонам приписаны числа и ставится цель отыскать гамильтонов цикл с минимальной суммой этих чисел (минимальной «длиной» пути, проделанного коммивояжером). Аналогично, «полиномиальное» время решения, достигнутое в «задаче коммивояжера», привело бы к возможности решать все NP-задачи за «полиномиальное» время. (Если такое решение когда-нибудь найдется, то новость об этом сразу попала бы на первые страницы! Ведь к NP-задачам относится, в частности, факторизация больших целых чисел, которая применяется в секретных шифровальных системах, представленных за последние несколько лет. Если эта задача окажется решаемой за «полиномиальное» время, то, возможно, такие шифры могли бы быть взломаны при помощи мощных современных компьютеров; если же нет — эти шифры останутся неприступными. См. Гарднер [1989].) Эксперты, как правило, полагают, что используя устройство, работающее по принципу машины Тьюринга, невозможно за «полиномиальное» время решить NP-полную задачу; и что, следовательно, Р и NP — неэквивалентны. Это мнение, похоже, верно, хотя пока его никто не смог доказать. И это остается наиболее важной и на сегодняшний день нерешенной задачей теории сложности.
Рис. 5.1. а) Треугольник в евклидовом пространстве, б) Треугольник в пространстве ЛобачевскогоЗамечательный голландский художник Мориц К. Эшер создал несколько мозаик, очень тонко и точно передающих суть геометрии Лобачевского. Одна из этих мозаик представлена на рис. 5.2.
Рис. 5.2. Пространство Лобачевского, изображенное Эшером в виде мозаики. (Все рыбы — как черные, так и белые — должны считаться конгруэнтными.)Каждую черную рыбу, в соответствии с геометрией Лобачевского, следует считать имеющей такой же размер и такую же форму, что и любая другая черная рыба. Для белых рыб — аналогично. Геометрия Лобачевского не может быть абсолютно точно воспроизведена на евклидовой плоскости, отсюда — кажущееся скопление рыб вблизи круговой границы. Представьте себе, что вы находитесь внутри мозаики где-то у этой окружности. Тогда геометрия Лобачевского должна для вас выглядеть точно такой же, как если бы находились в центре или в каком-то другом месте мозаики. То, что выглядит как «граница» мозаики в этом евклидовом представлении, в действительности находится «на бесконечности» в геометрии Лобачевского. Граничную окружность вообще не следует рассматривать как часть пространства Лобачевского — равно как и никакую часть евклидовой области, лежащую за ее пределами. (Это остроумное представление плоскости Лобачевского принадлежит Пуанкаре. Его достоинство заключается в том, что форма очень маленьких фигур при этом не искажается — изменяются только их размеры.) «Прямыми» в геометрии Лобачевского (вдоль которых расположены некоторые из рыб на мозаике Эшера) служат окружности, пересекающие круговую границу под прямыми углами. Вполне может быть, что геометрия Лобачевского действительно выполняется для нашего мира в космологических масштабах (см. главу 7, «Космология и Большой взрыв»). Но коэффициент пропорциональности между дефицитом углов и площадью треугольника в этом случае чрезвычайно мал, а для обычных масштабов евклидова геометрия дает превосходное приближение геометрии Лобачевского. В самом деле, как мы увидим далее в этой главе, общая теория относительности Эйнштейна говорит нам о том, что геометрия нашего мира действительно отклоняется от евклидовой геометрии (хотя и «нерегулярно», т. е. более сложно, чем геометрия Лобачевского) на масштабах, значительно уступающих космологическим, хотя по обычным меркам нашей повседневной жизни эти отклонения всеравно будут ничтожно малы. Тот факт, что евклидова геометрия, казалось бы, столь точно отражает структуру «пространства» нашего мира, вводил нас (и наших предшественников!) в заблуждение, заставляя думать, будто евклидова геометрия является логической необходимостью или будто мы обладаем внутренней интуитивной способностью априори догадаться, что евклидова геометрия должна быть применима к миру, в котором мы живем. (Так утверждал даже великий философ Иммануил Кант.) Реальный разрыв с евклидовой геометрией наступил только с созданием Эйнштейном общей теории относительности, появившейся на свет много лет спустя. И тогда стало понятно, что евклидова геометрия вовсе не является логической необходимостью, и что ее весьма точное (хотя и далеко не абсолютное) соответствие структуре нашего физического пространства — не более, чем результат эмпирических наблюдений! Евклидова геометрия действительно была (ПРЕВОСХОДНОЙ) физической теорией. И это в дополнение к тому, что евклидова геометрия — изящный и логически непротиворечивый раздел чистой математики. Здесь угадывается определенное сходство с философской концепцией Платона (изложенной примерно в 360 году до н. э. — почти за пятьдесят лет до появления Начал Евклида — знаменитого сочинения по геометрии). С точки зрения Платона объекты чистой геометрии — прямые, окружности, треугольники, плоскости и т. п. — могут быть лишь приблизительно реализованы в реальном мире физических вещей. Эти математически точные объекты чистой геометрии обитают в другом мире — платоновском идеальном мире математических понятий. Платоновский мир состоит не из осязаемых вещей, а из «математических объектов». Этот мир доступен нашему восприятию не обычным физическим путем, а посредством интеллекта. Человеческий разум контактирует с миром Платона всякий раз, когда открывает математическую истину, постигая ее с помощью математических рассуждений и интуитивных догадок. Идеальный мир Платона рассматривался как отличный от нашего материального мира — более совершенный, но при этом столь же реальный. (Вспомним сказанное в главах 3 и 4, с. 89, 101 о платоновской реальности математических понятий.) Таким образом, хотя идеальные объекты чистой евклидовой геометрии можно исследовать с помощью мысли, логически выводя при этом их свойства — отсюда вовсе не следует, что для «несовершенного» физического мира, воспринимаемого нашими органами чувств, неукоснительное следование этому идеалу является необходимостью. Располагая в свое время достаточно скудными данными, Платон, по-видимому благодаря какому-то чудесному озарению, смог предугадать, что, с одной стороны, математику следует изучать и понимать ради самой математики, и что нельзя требовать полного и точного соответствия математических объектов объектам физического опыта; а с другой — что функционирование реального внешнего мира в конечном счете может быть понято только в терминах точной математики, т. е. в терминах платоновского идеального мира, «доступного через интеллект»! Платоном в Афинах была основана Академия, в задачи которой входило дальнейшее развития таких идей. Среди элиты, выросшей из числа членов этой Академии, был и необычайно влиятельный и знаменитый философ Аристотель. Но здесь нас будет интересовать другой человек, принадлежащий к платоновской Академии — математик и астроном Евдокс, несколько менее известный, чем Аристотель, но, по моему глубокому убеждению, гораздо более проницательный ученый, один из величайших мыслителей античности. В евклидовой геометрии есть одна очень важная и тонкая составляющая, которая, на самом деле, является очень существенной и которую сегодня мы вряд ли вообще отнесли бы к геометрии! (Математики охотнее назвали бы это «анализом», чем «геометрией».) Речь идет о введении действительных чисел. Евклидова геометрия использует длины и углы. Чтобы иметь возможность использовать такую геометрию, нам необходимо понимать, какого рода «числа» нужны для описания этих самых длин и углов. И здесь новая идея была предложена Евдоксом (ок. 408–335 гг. до н. э.) в IV веке до н. э.[104]) Греческая геометрия переживала «кризис» из-за открытия пифагорейцами таких чисел, как √2 (последнее необходимо для того, чтобы выразить длину диагонали квадрата через длины его сторон), не представимых в виде дроби, т. е. отношения двух целых чисел. Для древних греков было важно иметь возможность формулировать их геометрические меры (отношения) в терминах (отношений) целых чисел, чтобы оперировать геометрическими величинами в соответствии с правилам арифметики. В основном, идея Евдокса заключалась в том, чтобы дать метод описания отношений длин (т. е. действительных чисел!) в терминах целых чисел. Евдоксу удалось сформулировать в рамках операций над целыми числами такие критерии, которые позволяли решать, является ли одно из отношений длин больше другого или их можно считать в точности равными. В общих чертах идея Евдокса сводится к следующему: если a, b, c и d — четыре длины, то критерием, позволяющим утверждать, что отношение а/b больше отношения c/d, будет существование таких целых чисел М и N, что длина а, сложенная сама с собой N раз, больше длины b, сложенной сама с собой М раз, — тогда как длина d, сложенная сама с собой М раз, больше длины с, прибавленной к самой себе N раз[105]). Соответствующий критерий можно аналогичным образом использовать для установления противоположного неравенства а/b < c/d. А искомый критерий равенства а/b = c/d просто отвечает случаю, когда ни один из двух критериев (а/b > c/d и а/b < c/d) не может быть выполнен! Совершенно точная абстрактная математическая теория действительных чисел была построена только в XIX веке такими математиками, как Дедекинд и Вейерштрасс. Но в действительности, предложенная ими процедура опиралась на те же идеи, которые были открыты Евдоксом примерно двадцатью двумя столетиями раньше! Сейчас нам не обязательно заниматься подробным изучением этой современной теории. Я кратко коснулся ее основных моментов в главе 3 (подглава «Действительные числа»), где для большей наглядности изложения предпочел использовать более привычное десятичное разложение действительных чисел. (В действительности, десятичное разложение была введено Стевином в 1585 году.) Следует также заметить, что хорошо знакомая нам десятичная запись была неизвестна древним грекам. Однако, между теориями, предложенными Евдоксом с одной стороны, и Дедекиндом и Вейерштрассом — с другой, существует важное различие. Древние греки рассматривали действительные числа как изначально данные — в терминах (отношений) геометрических величин — т. е. как свойства «реального» пространства. Древним грекам было необходимо иметь возможность описывать геометрические величины арифметически, чтобы затем в рамках законов и правил арифметики проводить строгие рассуждения над этими геометрическими величинам, а также их суммами и произведениями — существенными составляющими столь многих замечательных геометрических теорем древних. (На рис. 5.3 в качестве иллюстрации приведена знаменитая теорема Птолемея, хотя Птолемей открыл ее гораздо позже эпохи, в которую жил Евдокс. Теорема Птолемея устанавливает соотношение, которому удовлетворяют расстояния между четырьмя точками на окружности; в ее формулировке с необходимостью используются как понятие суммы, так и понятие произведения.) Критерии Евдокса оказались необычайно плодотворными и, в частности, позволили древним грекам строго вычислять площади и объема.
Рис. 5.3. Теорема ПтолемеяНо для математиков XIX века — и, разумеется, для современных математиков роль геометрии изменилась. Для древних греков и, в частности, для Евдокса, «действительные» числа были объектами, извлеченными из геометрии физического пространства. Ныне мы предпочитаем считать, что действительные числа логически более первичны, чем геометрия. Это позволяет нам конструировать всевозможные различные типы геометрии, каждый из которых исходит из понятия числа. (Ключевой идеей была идея координатной геометрии, введенная в XVII веке Ферма и Декартом. Координаты можно использовать для определения других типов геометрии.) Любая такая «геометрия» должна быть логически непротиворечивой, но не обязательно должна иметь прямое отношение к физическому пространству нашего эмпирического опыта. Конкретную физическую геометрию мы, по-видимому, постигаем через идеализацию эмпирического опыта (т. е. в зависимости от наших экстраполяций на бесконечно большие или бесконечно малые размеры, — см. главу 3, подглава «„Действительность“ действительных чисел»). Проводимые ныне эксперименты достаточно точны и приводят нас с необходимостью к заключению, что наша «извлеченная из эмпирического опыта» геометрия в действительности отличается от евклидова идеала (см. гл.5, конец подглавы «Общая теория относительности Эйнштейна») и согласуется с геометрией, требуемой в общей теорией относительности Эйнштейна. Однако, несмотря на изменения в наших взглядах на геометрию физического мира, возникших в настоящее время, понятие действительного числа, выдвинутое Евдоксом двадцать три столетия назад, по существу осталось неизменным и является существенным ингредиентом как теории Эйнштейна, так и теории Евклида. В действительности это понятие служит существенным ингредиентом всех современных серьезных физических теорий! Пятая книга Начал Евклида бьша, по существу, изложением описанной выше «теории пропорций», введенной Евдоксом. Эта книга имела принципиально важное значение для всего многотомного сочинения Евклида в целом. На самом деле, Начала Евклида, впервые увидевшие свет около 300 года до н. э., должны считаться одним из сочинений, оказавших наибольшее влияние в истории человечества. Именно Начала Евклида установили эталон для почти всего последующего естественнонаучного и математического мышления. Методы Начал были дедуктивными, изложение начиналось с четко сформулированных аксиом, которые предполагались «самоочевидными» свойствами пространства; из аксиом выводились многочисленные следствия, многие из которых были важными и поразительными, и совсем не самоочевидными. Не подлежит сомнению, что Начала Евклида имели огромное значение для последующего развития естественнонаучного мышления. Величайшим математиком древности несомненно был Архимед (287–212 гг. до н. э.). Остроумно используя теорию пропорций Евдокса, Архимед вычислил площади и объемы многих фигур и тел различной формы, например, сферы и более сложных геометрических форм, в том числе парабол или спиралей. Ныне для этих целей мы использовали бы дифференциальное и интегральное исчисление, но Архимед жил и творил примерно за 19 веков до создания математического анализа, разработанного Ньютоном и Лейбницем! (Можно было бы сказать, что добрая половина — «интегральная» половина — математического анализ была известна еще Архимеду!) Степень математической строгости, достигнутой Архимедом в своих рассуждениях, была безупречной даже по современным стандартам. Работы Архимеда оказали глубокое влияние на математиков и естествоиспытателей последующих веков, в частности, в значительной мере на Галилея и Ньютона. Архимед также ввел (ПРЕВОСХОДНУЮ?) физическую теорию статики (т. е. теорию, занимающуюся изучением законов поведения тел, находящихся в состоянии равновесия, например, законов рычага и законов плавающих тел) и развил статику как дедуктивную науку, аналогично тому, как Евклид изложил науку о геометрическом пространстве и геометрию твердых тел. Современником Архимеда, которого я также считаю необходимым отметить, был Аполлоний (ок. 262–200 гг. до н. э.), великий геометр, отличавшийся глубиной озарений и остроумием. Ему мы обязаны исследованием теории конических сечений (т. е. эллипсов, парабол и гипербол), которая оказала весьма сильное влияние на Кеплера и Ньютона. Оказалось, что именно эти кривые, что весьма примечательно, необходимы для описания планетных орбит!
Рис. 5.4. Скорость, величина скорости и ускорениеУскорение (также векторная величина) — это темп изменения, скорости во времени. Таким образом, ускорение в действительности есть скорость изменения скорости изменения положения во времени! (Древним было трудно понять сущность понятия «ускорение», так как у них не было адекватных «часов», и они не располагали соответствующими математическими идеями относительно «темпа изменения».) Галилей установил, что сила, приложенная к телу (в случае, исследуемом Галилеем — сила тяжести), управляет ускорением этого тела, но не управляет непосредственно его скоростью, как полагали древние, например, Аристотель. В частности, в отсутствие приложенной к телу силы его скорость постоянна. Следовательно, неизменяемое движение тела по прямой есть результат отсутствия силы (первый закон движения Ньютона). Тела в свободном движении продолжают сохранять состояние равномерного прямолинейного движения, и для того, чтобы они пребывали в этом состоянии, никакой силы не требуется. Действительно, одно из следствий из выведенных Галилеем и Ньютоном законов движения состояло в том, что равномерное прямолинейное движение физически полностью неотличимо от состояния покоя (т. е. отсутствия движения): не существует локального способа, позволяющего отличить равномерное прямолинейное движение от покоя! Галилей особенно четко сформулировал это утверждение (даже более четко, чем Ньютон) и дал ему весьма наглядное описание, использовав образ корабля в море (см. Дрэйк [1953], с. 186–187):
«Закройтесь вместе с вашим приятелем в кают-компании под палубой большого судна, прихватив с собой мух, бабочек и каких-нибудь других мелких летающих существ. Возьмите также с собой большой сосуд с водой, в котором бы плавала рыбка; подвесьте бутылку, из которой вода капля за каплей вытекала бы в подставленный снизу широкий сосуд. Пока судно будет стоять, внимательно присмотритесь к тому, как мелкие твари летают в каюте с одинаковой быстротой по всем направлениям. Рыбка также плавает одинаково охотно по всем направлениям; капли из бутылки падают в подставленный снизу сосуд… Внимательно пронаблюдав все эти явления, вы пускаетесь в плавание. Судно идет с любой скоростью, какая вам будет угодна. До тех пор и поскольку движение судна будет прямолинейным и равномерным без рысканья то в одну, то в другую сторону, вы не обнаружите ни малейших изменений в наблюденных ранее явлениях и не сможете отличить ни по одному из них, движется ли судно или стоит на месте… Капли будут, как и прежде, падать в подставленный снизу сосуд, ничуть не отклоняясь к корме, хотя пока капли находятся в воздухе, судно успевает пройти значительное расстояние. Рыбка в воде будет плавать вперед (по ходу движения судна) так же часто, как и назад, и с одинаковой легкостью подплывать к корму, в каком бы месте у стенок сосуда он бы ни был насыпан. Наконец, мухи и бабочки будут по-прежнему летать по всем направлениям, не отдавая предпочтения ни одному из них, не скапливаясь ближе к корме, как бы от усталости, будучи вынужденными следовать курсу судна, от которого они будут отделены на протяжении продолжительных интервалов времени, в течение которых они находятся в воздухе».Этот замечательный факт, получивший название принципа относительности Галилея, имеет в действительности решающее значение для наполнения копернианской точки зрения динамическим смыслом. Николай Коперник (1473–1543) и древнегреческий астроном Аристарх (ок. 310–230 гг. до н. э.; не путать с Аристотелем!) за восемнадцать веков до Коперника выдвинули гипотезу о том, что Солнце покоится, а Земля движется, вращаясь вокруг своей собственной оси и обращаясь по орбите вокруг Солнца. Почему мы не ощущаем этого движения, которое происходит со скоростью около нескольких сотен тысяч километров в час? До того, как Галилей выдвинул свою динамическую теорию, этот вопрос действительно представлял настоящую и глубокую загадку для сторонников копернианской картины мироздания. Если бы была верна более ранняя «аристотелевская» версия динамики, согласно которой реальная скорость системы в ее движении сквозь пространство влияла бы на динамическое поведение системы, то движение Земли заведомо было бы чем-то непосредственно очевидным для нас. Относительность Галилея позволяет понять, каким образом Земля может находиться в движении, хотя это движение не будет чем-то воспринимаемым нами непосредственно[107]). Заметим, что в рамках галилеевой относительности не существует локального физического смысла, который можно было бы придать понятию «в покое». Это приводит к важным следствиям относительно того, как надлежит рассматривать пространство и время. Интуитивная картина пространства и времени состоит в том, что «пространство» представляет собой своего рода арену, на которой происходят физические события. Физический объект может в один момент времени находиться в одной точке пространства, а в более поздний момент времени может оставаться в той же точке или оказаться в другой точке пространства. Представим себе мысленно, что точки пространства каким-то образом могут сохранять свое положение от одного момента времени до следующего момента так, что имеет смысл говорить о том, изменил ли некоторый объект свое положение в пространстве или не изменил. Но галилеева относительность учит нас, что «состояние покоя» не имеет абсолютного характера и поэтому невозможно придать смысл выражению «одна и та же точка пространства в два различных момента времени». Какая точка евклидова трехмерного пространства физической реальности в один момент времени является «той же» точкой евклидова трехмерного пространства в другой момент времени? На этот вопрос невозможно ответить. Создается впечатление, что для каждого момента времени нам необходимо иметь совершенно «новое» евклидово пространство! Этому можно придать смысл, если рассмотреть четырехмерную пространственно-временну́ю картину физической реальности (рис. 5.5).
Рис. 5.5. Галилеево пространство-время: частицы, движущиеся равномерно и прямолинейно, изображены в виде прямыхТрехмерные евклидовы пространства, соответствующие различным моментам времени, в этой картине действительно рассматриваются отдельно друг от друга, но все эти пространства объединены, образуя совместно полную картину четырехмерного пространства-времени. Истории частиц, движущихся равномерно и прямолинейно, описываются прямыми (называемыми мировыми линиями) в пространстве-времени. В дальнейшем я еще вернусь к проблеме пространства-времени и относительности движения в контексте эйнштейновской специальной теории относительности. Мы увидим, что довод в пользу четырехмерности обретает в этом случае гораздо бо́льшую силу. Третья из великих догадок Галилея стала ключом к началу понимания закона сохранения энергии. Галилея главным образом интересовало движение объектов под действием силы тяжести. Он заметил, что если тело стартует из состояния покоя, то идет ли речь о свободно падающем теле, или о колеблющемся маятнике произвольной длины, или о теле, соскальзывающем по наклонной плоскости, скорость движения всегда зависит только от расстояния по вертикали, пройденного телом от начального положения. Кроме того, достигнутая скорость всегда в точности достаточна для возвращения тела на ту высоту, с которой оно начало двигаться. Теперь мы должны были бы сказать, что энергия, запасенная телом на исходной высоте над поверхностью земли (гравитационная потенциальная энергия), может превращаться в энергию движения тела (кинетическую энергию, которая зависит от величины скорости тела), а та, в свою очередь, — в потенциальную энергию, причем в целом энергия не утрачивается и не приобретается. Закон сохранения энергии — очень важный физический принцип. Это — не независимое физическое требование, а следствие из законов движения Ньютона, до которых мы скоро дойдем. На протяжении столетий все более понятные формулировки закона сохранения энергии делались Декартом, Гюйгенсом, Лейбницем, Эйлером и Кельвином. Позднее в этой главе и в главе 7 мы еще вернемся к закону сохранения энергии. Оказывается, что в сочетании с галилеевским принципом относительности закон сохранения энергии приводит к другим законам сохранения, имеющим немалое значение: закону сохранения массы и закону сохранения количества движения (импульса). Количество движения частицы равно произведению ее массы и ее скорости. Знакомые примеры сохранения количества движения возникают при рассмотрении реактивного движения, когда увеличение направленного вперед количества движения ракеты в точности уравновешивается направленным назад количеством движения выхлопных газов (обладающих меньшей массой, но зато большей скоростью). Отдача ружья при выстреле — еще одно проявление закона сохранения количества движения. Еще одним следствием из законов движения Ньютона служит закон сохранения углового момента (момента количества движения), описывающий постоянство вращения системы вокруг собственной оси. Вращение Земли вокруг собственной оси, равно как и вращение теннисного мяча вокруг собственной оси, не затухают благодаря закону сохранения их угловых моментов. Каждая частица, образующая любое тело, вносит свой вклад в полный угловой момент тела, причем величина этого вклада равна произведению количества движения частицы на расстояние ее от оси вращения (длину перпендикуляра, опущенного из точки, где находится частица, на ось вращения). (Следовательно, угловую скорость свободно вращающегося объекта можно увеличить, сделав объект более компактным. Это приводит к поразительному, но хорошо знакомому действию, часто исполняемому спортсменами на льду и воздушными гимнастами на трапеции. Прижав к себе руки или поджав ноги, они резко увеличивают скорость вращения просто вследствие закона сохранения углового момента!) Как будет показано в дальнейшем, масса, энергия, количество движения (импульс) и угловой момент принадлежат к числу важных для нас понятий. Наконец, мне следовало бы напомнить читателю о пророческой догадке Галилея, понявшего, что в отсутствие атмосферного сопротивления все тела под действием силы тяжести падают с одной и той же скоростью. (Возможно, читатель вспомнит известную легенду о том, как Галилей сбрасывал с наклонной башни в Пизе по несколько предметов одновременно.) Три столетия спустя то же самое озарение привело Эйнштейна к обобщению принципа относительности на ускоренные системы отсчета и стало, как мы увидимв конце этой главы, краеугольным камнем его необычайной общерелятивистской теории относительности. На мощном фундаменте, заложенном Галилеем, Ньютону удалось возвести величественнейший храм. Он сформулировал три закона, управляющие поведением материальных тел. Первый и второй законы Ньютона по существу совпадали с законами, открытыми Галилеем: если на тело не действует никакая сила, то тело продолжает равномерно двигаться по прямой; если на тело действует какая-нибудь сила, то произведение массы тела на ускорение (т. е. скорость изменения количества движения тела) равно этой силе. Заслуга собственно Ньютона состояла в осознании необходимости третьего закона движения: сила, с которой тело А действует на тело В, в точности равна по величине и противоположна по направлению силе, с которой тело В действует на тело А (иными словами, «для каждого действия всегда существует равное по величине противодействие»), Три закона движения Ньютона образуют основу основ. «Ньютоновская вселенная» состоит из частиц, движущихся в пространстве, где действуют законы евклидовой геометрии.
Рис. 5.6. Сложение векторов по правилу параллелограммаУскорения этих частиц определяются действующими на них силами. Сила, приложенная к каждой из частиц, получается путем сложения (по правилу сложения векторов, см. рис. 5.6) всех сил, действующих на данную частицу со стороны всех остальных частиц. Чтобы система была хорошо определенной, необходимо задать некоторое четкое правило, которое позволяло бы установить, какая сила действует на частицу А со стороны другой частицы В. Обычно мы требуем, чтобы эта сила действовала по прямой, соединяющей частицы А и В (рис. 5.7).
Рис. 5.7. Сила, действующая между двумя частицами, направлена по прямой между ними (и по третьему закону Ньютона сила, действующая на частицу А со стороны частицы В, всегда равна по величине и противоположна по направлению силе, действующей на В со стороны А)Если речь идет о гравитационной силе, то между А и В возникает сила притяжения, величина которой пропорциональна произведению масс частиц А и В и обратно пропорциональна квадрату расстояния между частицами: закон обратных квадратов. Для других типов сил зависимость от взаимного расположения частиц может быть другой, и величина силы в этом случае будет зависеть не от масс частиц, а от какого-то иного их свойства. Великий Иоганн Кеплер (1571–1630), современник Галилея, заметил, что орбиты планет, описываемые ими вокруг Солнца, имеют форму эллипсов, а не окружностей (причем Солнце всегда находится в фокусе, а не в центре эллипса), и сформулировал два других закона, задающих скорости, с которыми планеты движутся по орбитам. Ньютон сумел показать, что три закона Кеплера следуют из его собственной общей модели (с учетом силы притяжения, обратно пропорциональной квадрату расстояния между телами). Кроме того, Ньютон внес многие поправки к кеплеровским эллиптическим орбитам, а также объяснил ряд других эффектов (например, медленное движение оси вращения Земли, замеченное задолго до Ньютона еще древними греками). Чтобы прийти к таким результатам, Ньютону, помимо дифференциального исчисления, пришлось разработать немало дополнительных математических методов. Феноменальный успех, увенчавший эти усилия, во многом объясняется его высочайшим искусством математика и великолепной физической интуицией.
Рис. 5.8. Тройное соударение. Поведение частиц в результате столкновения существенно зависит от того, какие частицы сталкиваются первыми, поэтому исход столкновения не зависит непрерывным образом от начальных данныхВ нашей модели существует индетерминизм, когда происходит тройное столкновение! Если угодно, то мы можем просто исключить тройные столкновения и столкновения более высокого порядка как «в высшей степени (бесконечно) невероятные». Это дает вполне непротиворечивую схему, но потенциальная проблема тройных столкновений означает, что результирующее поведение частиц может не зависеть непрерывным образом от начального состояния. Поскольку такое положение дел нас не совсем удовлетворяет, то мы можем отдать предпочтение картине точечных частиц. Но для того, чтобы избежать некоторых теоретических трудностей, возникающих в рамках этого подхода (бесконечные силц и бесконечные энергии при столкновении частиц), необходимо сделать дополнительные предположения, в частности о том, что на коротких расстояниях силы, действующие между частицами, всегда становятся отталкивающими. Тогда мы можем обеспечить невозможность столкновения любой пары частиц. (Оно также помогает нам избежать проблемы определения поведения частиц при столкновении!) Но для большей наглядности я все-таки буду рассматривать модель твердых сферических шариков, ибо, как мне кажется, подобная «бильярдная» картина для большинства из нас подсознательно как раз и является рабочей моделью реальности! Подчеркнем (игнорируя проблему столкновения нескольких шариков), что ньютонианская[109] бильярдная картина реальности в действительности является детерминистской моделью. Слово «детерминистская» надлежит понимать в том смысле, что физическое поведение системы с математической точки зрения полностью определено во все моменты времени в будущем (или в прошлом) положениями и скоростями шариков (во избежание некоторых проблем предположим, что число шариков конечно) в какой-то один момент времени. Таким образом, создается впечатление, будто в таком бильярдном мире нет места для разума, который своей «свободной волей» мог бы влиять на поведение материальных объектов. Если мы верим в «свободу воли», то, по-видимому, вынуждены будем усомниться в возможности описания нашего реального мира в рамках бильярдной модели. Мучительный вопрос о «свободе воли» проходит через всю эту книгу — хотя при обсуждении большинства затронутых в ней тем он остается на заднем плане. В этой главе ему предстоит сыграть определенную, но небольшую роль (связанную с проблемой передачи сигналов со сверхсветовой скоростью в теории относительности). Вопросом о свободе воли мы займемся непосредственно в главе 10, и читатель несомненно будет разочарован моим вкладом в эту проблему. Я действительно считаю, что вопрос о свободе воле представляет собой реальную, а не вымышленную проблему — но она в высшей степени нетривиальна и ее трудно сформулировать адекватно. Вопрос о детерминизме в физической теории, безусловно, важен, однако я убежден, что он не является камнем преткновения. Например, мир может быть детерминистским, но невычислимым. Иначе говоря, будущее может определяться прошлым, но точно рассчитать его при этом будет в принципе невозможно. В главе 10 я попытаюсь изложить аргументы, показывающие, что действие нашего наделенного сознанием разума неалгоритмично (т. е. невычислимо). Соответственно, свобода воли, которой мы наделены (по нашему глубокому убеждению), должна быть тесно связана с какой-то невычислимой составляющей законов, управляющих тем миром, в котором мы живем. Независимо от того, принимаем ли мы или отвергаем такую точку зрения на свободу воли, интерес для нас представляет вопрос именно о вычислимости данной физической теории (например, ньютоновской динамики), а не о том, является ли она детерминистской. Вопрос о вычислимости отличен от вопроса о детерминизме. Утверждение о том, что это — два совершенно разных вопроса, как раз и служит одним из основных тезисов в данной книге.
Рис. 5.9. «Переключатель» (конструкции А. Ресслера) в компьютере Фредкина — Тоффоли на бильярдных шарах. Если шар попадает в переключатель через вход В, то в дальнейшем он покидает переключатель через выход D или Е в зависимости от того, попадает ли другой шар в переключатель через вход А (предполагается, что шары попадают в переключатель через входы А и В одновременно)В модели Фредкина — Тоффоли все основные логические операции компьютера могут выполняться с помощью шариков. Модель позволяет имитировать вычисления, производимые любой машиной Тьюринга: конкретный выбор машины Тьюринга Тu определяет конфигурацию «стенок» и т. д. в машине Фредкина — Тоффоли; начальное состояние движущихся шариков соответствует информации на входной ленте машины Тьюринга; а содержимое на выходной ленте соответствует конечному состоянию шариков. Таким образом, можно, в частности, спросить: останавливается ли когда-нибудь такая-то и такая-то машина Тьюринга? «Остановка» может быть сформулирована как состояние при котором шарик А сталкивается, в конце концов, с шариком В. То, что на этот вопрос невозможно ответить алгоритмически (см. гл.2 «Неразрешимость проблемы Гильберта»), по крайней мере наводит на мысль о том, что ньютоновский вопрос «сталкивается ли когда-нибудь шарик А с шариком В?», который был поставлен мной первоначально, тоже не может быть разрешен алгоритмически. В действительности, ньютоновская задача является гораздо более каверзной, чем задача, поставленная Фредкином и Тоффоли. Эти авторы могли задавать состояние своей модели с помощью дискретных параметров (т. е. при помощи утверждений «да или нет» типа «шарик либо находится в данном туннеле, либо не находится»). Но в полной ньютоновской задаче начальные положения и скорости шариков необходимо задавать с бесконечной точностью в терминах координат, которые являются действительными числами, а не принимают дискретные значения. Таким образом, мы снова сталкиваемся со всеми проблемами, которые нам уже приходилось рассматривать, когда в главе 4 мы пытались ответить на вопрос, рекурсивно ли множество Мандельброта. Что означает «вычислимость», когда в качестве входных и выходных данных допускаются непрерывно изменяющиеся параметры?[111] Проблему можно слегка облегчить, предположив, что все начальные положения и скорости заданы рациональными числами (хотя нельзя ожидать, что координаты и компоненты скорости останутся рациональными в более поздние рациональные моменты времени t). Напомним, что рациональное число представимо в виде отношения двух целых чисел и, следовательно, определяется в дискретных конечных терминах. Используя рациональные числа, мы можем сколь угодно точно аппроксимировать любые наборы начальных данных, которые собираемся использовать в своих вычислениях. И предположение о том, что при рациональных начальных данных может не существовать алгоритма, позволяющего определить, столкнутся в конце концов или нет шарики А и В, — отнюдь не лишено смысла. Однако на самом деле, когда говорят: «Ньютонианский бильярдный мир не вычислим», имеют в виду совсем другое. Та модель, которую я сравниваю с ньютонианским бильярдным миром — а именно, «бильярдный компьютер» Фредкина — Тоффоли — действует как вычислительный алгоритм. В конечном счете, это и было квинтэссенцией идеи Фредкина и Тоффоли — что их модель должна вести себя как (универсальный) компьютер! Вопрос, который я пытаюсь сейчас прояснить, сводится к следующему: можно ли представить себе, что человеческий мозг, используя некоторые подходящие «невычислимые» физические законы, работает в определенном смысле «лучше», чем машина Тьюринга? Бесполезно пытаться использовать что-нибудь вроде следующего утверждения:
«Если шарик А никогда не сталкивается с шариком В, то ответ на Ваш вопрос будет: „нет“».Чтобы окончательно удостовериться в том, что шарик А действительно никогда не сталкивается с шариком В, пришлось бы прождать вечность! Разумеется, машины Тьюринга ведут себя именно так. На самом деле, существуют, по-видимому, достаточно весомые указания в пользу своего рода вычислимости ньютонианского бильярдного мира (по крайней мере, если оставить в стороне проблему множественных столкновений). Способ, которым мы пользуемся для того, чтобы рассчитать поведение такого мира, сводится к введению аппроксимаций. Мы могли бы предположить, что центры шариков по определению располагаются в узлах некоторой точечной решетки, причем координаты узлов измерены, например, с точностью до сотых долей единицы. Время также можно считать «дискретным»: все допустимые моменты времени должны быть кратными некоторой небольшой единице (обозначаемой, скажем, Δt). Это приводит к разным дискретным возможностям для «скоростей» (разностей между значениями положений точек на решетке В два последовательных разрешенных момента времени, деленных на Δt). Соответствующие приближения для. ускорений вычисляются с использованием закона силы, и, в свою очередь, используются для получения значений «скоростей». После чего с требуемой точностью вычисляются новые положения шариков в узлах решетки в следующий допустимый момент времени. Вычисления производятся до тех пор, пока сохраняется указанная точность. Вполне может оказаться, что точность будет потеряна раньше, чем мы успеем рассчитать состояние системы для достаточно большого числа моментов времени. В этом случае процедура начинается снова со значительно более мелкой пространственной решеткой и более частыми допустимыми моментами времени. Это позволяет достичь большей точности — и рассчитать поведение системы в более отдаленном будущем. Такой прием дает возможность математически описывать ньютоновский бильярдный мир (игнорируя множественные столкновения) сколь угодно точно, и в этом смысле можно сказать, что ньютонианский мир действительно вычислим. Но в то же время можно сказать и обратное: что в некотором (практическом) смысле этот мир «невычислим», поскольку точность, с которой могут быть известны начальные данные, всегда ограничена. Действительно, такого рода задачам всегда присуща некоторая (и весьма значительная) «нестабильность». Очень небольшое изменение в начальных условиях может привести к возникновению чудовищных изменений в конечном состоянии. (Всякий, кто пытался загнать в лузу бильярдный шар, стремясь ударить его промежуточным шаром, поймет, что я имею в виду!) Сказанное становится очевидным, когда происходят (последовательные) столкновения, но такие неустойчивости в поведении могут встречаться и в случае действия ньютоновского тяготения на расстоянии (если гравитирующих тел больше двух). Для обозначения этого типа неустойчивости часто используется термин «хаос», или «хаотическое поведение». Например, хаотическое поведение важно, когда речь заходит о погоде. Хотя ньютоновские уравнения, управляющие стихиями, хорошо изучены, долговременный прогноз погоды печально известен своей ненадежностью! Все это не похоже на тот тип «невычислимости», который можно было бы каким-то образом «использовать». Невычислимость в данном случае обусловлена просто тем, что из-за существования предела точности, с которой может быть известно начальное состояние, будущее состояние в принципе не поддается точному расчету на основании известных начальных условий. На самом деле, в этом случае к будущему поведению системы примешивается случайный элемент — и только. Если же работа мозга все-таки опирается на полезные невычислимые составляющие физических законов, то последние должны быть совершенно другими — и более конструктивными — по своей природе. Поэтому я не буду называть «хаотическое» поведение такого рода «невычислимостью», предпочитая использовать термин «непредсказуемость». Наличие непредсказуемости — весьма общее явление для тех детерминистских законов, которые, как мы вскоре убедимся, действительно возникают в (классической) физике. Но мы скорее уж предпочтем минимизировать непредсказуемость, чем «использовать» ее в конструкции мыслящей машины! Обсуждая в общем и целом вопросы вычислимости и непредсказуемости, нам будет полезно принять более широкую, чем прежде, точку зрения на природу физических законов. Это позволит рассматривать не только схему ньютоновской механики, но и более поздние теории, пришедшие ей на смену. И сперва нам стоит окинуть беглым взглядом замечательную формулировку законов механики, предложенную Гамильтоном.
Рис. 5.10. Фазовое пространство. Каждая точка Q фазового пространства описывает полное состояние некоторой физической системы, включающее в себя мгновенные движения всех ее частейДля n свободных частиц размерность фазового пространства равна 6n (по три координаты положения и по три координаты импульса для каждой частицы). Читателя может обеспокоить то, что даже для одной-единственной частицы размерность фазового пространства оказывается вдвое большей, чем мы обычно привыкли представлять! Но секрет успеха заключается в том, чтобы не пасовать перед трудностями. Конечно, шестимерное пространство действительно имеет бо́льшую размерность, чем та, которую можно с ходу (!) представить — но даже если бы могли себе его представить, то пользы от этого оказалось бы немного. Например, всего лишь для комнаты, полной молекул газа, размерность фазового пространства могла бы равняться, например, такой величине: 10 000 000 000 000 000 000 000 000 000. Попытка наглядно представить себе пространство столь высокой размерности заранее обречена на провал! Так что лучше даже и не пытаться делать это даже в случае фазового пространства для одной-единственной частицы. Просто представьте себе несколько расплывчатую трехмерную (или даже всего лишь двумерную) область. Взгляните еще раз на рис. 5.10. Этого вполне достаточно. А как теперь наглядно представить себе уравнения Гамильтона для фазового пространства? Прежде всего следует помнить о том, что на самом деле изображает одна точка Q фазового пространства. Она соответствует некоторому конкретному набору значений всех координат положений х 1, х2…. и всех координат импульсов р1, p2, …. То есть, точка Q представляет всю нашу физическую систему в определенном состоянии движения, заданного для каждой из образующих ее частиц в отдельности. Уравнения Гамильтона говорят нам о степени быстроты изменения всех этих координат, если их текущие значения известны, т. е. управляют движениями всех отдельных частиц. В переводе на язык фазового пространства уравнения Гамильтона описывают дальнейшее поведение точки Q в этом пространстве, если нам задано ее текущее положение. Таким образом, в каждой точке фазового пространства мы имеем маленькую стрелку (точнее: вектор), которая говорит нам о том, как движется точка Q — а это позволяет описывать эволюцию во времени всей нашей системы. Совокупность всех стрелок образует так называемое векторное поле (рис. 5.11). Следовательно, уравнения Гамильтона определяют векторное поле в фазовом пространстве.
Рис. 5.11. Векторное поле в фазовом пространстве, представляющее эволюцию системы во времени в соответствии с уравнениями ГамильтонаВыясним, как можно интерпретировать в терминах фазового пространства физический детерминизм. В качестве начальных условий при t = 0 мы имели бы конкретный набор значений, заданных для всех координат положений и импульсов, т. е. некоторую определенную точку Q фазового пространства. Чтобы вычислить эволюцию системы во времени, надо просто следовать стрелкам. Таким образом, все поведение нашей системы (независимо от степени ее сложности) описывается в фазовом пространстве всего лишь одной точкой, движущейся по стрелкам, которые она встречает на своем пути. Мы можем считать, что стрелки указывают «скорость» нашей точки Q в фазовом пространстве. Если стрелка «длинная», то точка Q движется быстро, а если «короткая» — то медленно. Чтобы узнать, что наша система делает в момент времени t, мы просто смотрим, куда к этому времени переместилась точка Q, следуя указаниям попутных стрелок. Ясно, что это — детерминистская процедура. Характер движения точки Q полностью определяется гамильтоновым векторным полем. А как обстоит дело с вычислимостью? Если мы стартовали из вычислимой точки фазового пространства (т. е. из точки, у которой все координаты положения и импульсов являются вычислимыми числами, см. главу 3, «Страна Тор'Блед-Нам»), и с момента начала движения прошло вычислимое время t — то закончим ли мы с необходимостью в точке, которая может быть вычислимым образом получена из t и исходных значений координат? Ответ, очевидно, зависит от выбора функции Гамильтона Н. Действительно, в функцию Н могут входить физические константы — такие, как ньютоновская постоянная тяготения или скорость света, величина которых зависит от выбора единиц; или другие, описывающиеся точными числовыми выражениями — и поэтому, чтобы положительно ответить на поставленный вопрос, необходимо сначала убедиться в том, что все эти постоянные вычислимы. В таком случае я осмелюсь предположить, что для обычных гамильтонианов (т. е. функций H), встречающихся в физике, ответ может быть утвердительным. Но это — всего лишь догадка, и вопрос — интересный вопрос! — остается пока открытым. Надеюсь, что со временем он будет изучен более основательно. С другой стороны, мне кажется, — по тем же самым причинам, которых я кратко коснулся в связи с бильярдным миром — что этот вопрос не настолько существенен. Ведь чтобы утверждение о невычислимости точки фазового пространства имело смысл, необходимо было бы задавать ее координаты с бесконечной точностью, т. е. со всеми десятичными знаками после запятой! (Число, записываемое конечным количеством десятичных знаков, всегда вычислимо.) Конечный отрезок десятичного разложения любого числа ничего не говорит нам о возможности вычислить оставшуюся часть. Но точность всех физических измерений ограничена возможностями приборов, поэтому они могут дать нам информацию лишь о конечном числе знаков десятичного разложения. Обесценивает ли это само понятие «вычислимого числа» применительно к физическим измерениям? Действительно, если мы рассматриваем устройство, которое могло бы использовать каким-нибудь полезным образом некие (гипотетические) невычислимые составляющие физических законов, то разумно предположить, что оно не должно зависеть от произведения измерений с неограниченной точностью. Но возможно, я сейчас стараюсь рассуждать слишком строго. Предположим, что у нас имеется физическое устройство, которое в силу известных теоретических причин реализует некоторую интересную математическую процедуру неалгоритмического характера. Тогда поведение этого устройства — при условии, что мы имеем возможность точно удостовериться в этом — позволило бы получать правильные ответы на последовательность математически содержательных вопросов, для решения которых не существует алгоритма (подобно вопросам, рассмотренным в главе 4). Любой наперед заданный алгоритм на определенной стадии такого процесса дал бы сбой — тогда как наше устройство на той же стадии выдало бы некоторый новый результат. Действительно, это устройство могло бы осуществлять изучение некоторого физического параметра со все большей и большей точностью, необходимой для дальнейшего продвижения по списку вопросов. Однако мы действительно получим нечто новое от нашего устройства на какой-то конечной стадии точности, по крайней мере пока нам не удастся найти усовершенствованный алгоритм для ответа на указанную последовательность вопросов: затем нам следовало бы повысить точность, чтобы продвинутся еще дальше — до тех пор, пока наш усовершенствованный алгоритм не окажется бессилен. Тем не менее, создается впечатление, что даже все возрастающая точность в определении физического параметра неудобна в качестве способа кодирования информации. Гораздо предпочтительнее было бы получать нашу информацию в «дискретной» (или «цифровой») форме. В этом случае ответы на вопросы, расположенные все дальше и дальше от начала списка, могли бы быть получены путем рассмотрения все большего количества дискретных единиц или, быть может, путем повторного рассмотрения некоторого фиксированного набора дискретных единиц, где требуемая неограниченная информация распределялась бы по все более длинным временным интервалам. (Мы могли бы представить себе, что эти дискретные единицы построены из частей, каждая из которых может находиться в одном из двух состояний — «вкл.» или «выкл.» — подобных единицам и нулям в описании машины Тьюринга, приведенном в главе 2.) Для этого нам, как представляется, требуются такие устройства, которые могли бы принимать (отличимые) дискретные состояния и, совершив определенные эволюции в соответствии с динамическими законами, снова перейти в один из наборов дискретных состояний. Если бы это было так, то мы могли бы избежать необходимости изучать каждое устройство с произвольно высокой степенью точности. Возникает вопрос: действительно ли гамильтоновы системы ведут себя подобным образом? Необходимым условием для этого, видимо, должна быть некоторая устойчивость в поведении системы, позволяющая четко устанавливать, в каком из таких дискретных состояний находится наше устройство. При этом желательно будет зафиксировать это состояние (по крайней мере на некоторый достаточно продолжительный период времени) и добиться того, чтобы оно (устройство) не дрейфовало из одного состояния в другое. Кроме того, если система оказывается в этих состояниях с небольшой погрешностью, то нам бы не хотелось, чтобы погрешности накапливались; наоборот: мы будем требовать, чтобы такие погрешности со временем сглаживались. К тому же, наше искомое устройство должно было бы состоять из частиц (или каких-то других подэлементов), которые с необходимостью описывались бы в терминах непрерывных параметров, причем каждое отличимое «дискретное» состояние покрывало бынекоторый диапазон значений этих непрерывных параметров. (Например, можно представлять разные дискретные состояния с помощью частицы, лежащей либо в одном, либо в другом ящике. Чтобы указать, что частица действительно находится в одном из них, мы будем говорить, что координаты положения частицы принадлежат определенному диапазону значений.) С точки зрения фазового пространства это означает, что каждая из «дискретных» альтернатив должна соответствовать некоторой области в фазовом пространстве так, чтобы различные точки фазового пространства, принадлежащие одной и той же области, отвечали бы одному и тому же состоянию нашего устройства (рис. 5.12).
Рис. 5.12. Область в фазовом пространстве соответствует диапазону возможных значений пространственных координат и импульсов всех частиц. Такая область может представлять отдельное отличимое состояние (т. е. «альтернативу») какого-нибудь устройстваПредположим теперь, что наше устройство стартует из точки фазового пространства, принадлежащей некоторой области R0. которая соответствует одной из таких возможностей. Мы будем считать, что область R0 перемещается вдоль гамильтонова векторного поля до тех пор, пока в момент времени t она не переходит в область Rt Представляя себе такое развитие событий, мы тем самым описываем эволюцию нашей системы во времени при всех возможных начальных состояниях, соответствующих одной и той же альтернативе (рис. 5.13).
Рис. 5.13. С течением времени область R0 фазового пространства, увлекаемая вдоль векторного поля, переходит в новую область Rt. Это может служить описанием эволюции во времени некоторого определенного состояния нашего устройстваВопрос об устойчивости (в том смысле, в каком мы трактуем устойчивость здесь) сводится к вопросу о том, остается ли с ростом t область Rt локализованной или начинает расплываться по всему фазовому пространству. Если область Rt со временем сохраняет конечный объем, то мы будем говорить, что наша система демонстрирует устойчивое поведение. Точки фазового пространства, близкие друг к другу (настолько, что они соответствуют конкретным физическим состояниям системы, которые существенно похожи друг на друга), остаются близкими, и погрешности в указании их положения со временем не увеличиваются. Любое чрезмерно сильное расплывание начальной области R0 в результате приводит к появлению непредсказуемой составляющей в поведении системы. А что вообще можно сказать о гамильтоновых системах? Стремятся ли области фазового пространства расплываться со временем или все-таки нет? Казалось бы, при такой общей постановке проблемы сказать о ней можно будет немного. Однако для гамильтоновых систем существует весьма красивая теорема, принадлежащая выдающемуся французскому математику Жозефу Лиувиллю (1809–1882), которая утверждает, что объем любой области фазового пространства должен оставаться постоянным при любых изменениях состояния системы, происходящих в соответствии с уравнениями Гамильтона. (Разумеется, размерность «объема» следует понимать в смысле размерности фазового пространства.) Следовательно, объем каждой области Rt должен быть таким же, как объем исходной области R0. На первый взгляд теорема Лиувилля позволяет утвердительно ответить на вопрос об устойчивости гамильтоновых систем. В силу того, что размер исходной области (в смысле ее объема в фазовом пространстве) не может возрастать, создается впечатление, будто наша исходная область не может со временем расплываться по всему фазовому пространству. Однако такое впечатление обманчиво, и, немного поразмыслив над этим, мы поймем, что в действительности может произойти прямо противоположная ситуация! На рис. 5.14 я попытался наглядно изобразить такое поведение системы, которое можно было бы ожидать в общем случае.
Рис. 5.14. Несмотря на то, что — согласно теореме Лиувилля — объем фазового пространства сохраняется постоянным, он, как правило, будет расплываться в результате чрезвычайно сложной эволюции системы во времениПредставим себе, что начальная область R0 невелика и имеет «приемлемую» форму — достаточно гладкую, лишенную причудливых выступов — которая указывает на то, что при описании состояний, принадлежащих этой области, чрезмерно высокая точность совсем необязательна. Но с течением времени область Rt начинает деформироваться и растягиваться — сначала принимая форму, напоминающую амебу, а затем образуя причудливые отростки, которые простираются далеко в стороны, замысловато извиваясь то в одном, то в другом направлении. Объем при этом действительно сохраняется, но тот же самый объем может теперь истончиться и распределиться по обширной области фазового пространства. Практически аналогичная картина будет наблюдаться в случае с капелькой чернил, попавшей в большую емкость с водой. В то время, как реальный объем чернильной жидкости остается неизменным, она постепенно истончается, распределяясь по всему объему емкости. Вероятно, подобным образом ведет себя и исходная область R0 в фазовом пространстве. Она не обязательно должна расплываться по всему фазовому пространству (эта предельная ситуация известна под названием «эргодической») — но вполне может в конце концов занять область, значительно превышающую ее первоначальный объем. (Дальнейшее обсуждение см. в книге: Дэвис [1974].) Трудность заключается в том, что сохранение объема отнюдь не влечет за собой сохранение формы : малые области имеют тенденцию деформироваться, и их деформации простираются на большие расстояния. В многомерных пространствах проблема расплывания начальной области гораздо более серьезна, чем в пространствах малой размерности, так как «направлений», по которым расплываются отдельные части нашей области, гораздо больше. На самом деле, вместо того, чтобы «помочь» нам держать область Rt под контролем, теорема Лиувилля создает фундаментальную проблему! Не будь теоремы Лиувилля, можно было бы представить, что бесспорная тенденция к расплыванию области в фазовом пространстве могла бы (при соответствующих обстоятельствах) компенсироваться уменьшением полного объема. Но теорема Лиувилля говорит нам, что такое уменьшение невозможно, и нам остается только мириться с таким поразительным свойством — универсальным для всех классических динамических (гамильтоновых) систем нормального типа![113] Помня о неизбежном расплывании исходной области в фазовом пространстве, уместно спросить: а как в таком случае вообще возможно делать предсказания в классической механике? Это действительно непростой вопрос. Расплывание начальной области говорит нам о том, что независимо от степени точности, с которой мы знаем начальное состояние системы (конечно, в разумных пределах), тенденция к возрастанию погрешностей со временем сделает нашу исходную информацию практически бесполезной. В этом смысле классическая механика в принципе непредсказуема. (Вспомним введенное выше понятие «хаоса».) Чем же в таком случае объяснить явный успех ньютоновской механики? Говоря о небесной механике (т. е. движении небесных тел под действием сил гравитации), в качестве наиболее вероятной причины можно назвать, наверное, то, что, во-первых, небесная механика занимается изучением сравнительно небольшого числа связанных тел (Солнца, планет и их естественных спутников — лун), между которыми имеется большой разброс по массе, поэтому в первом приближении возмущающим действием менее массивных тел на более массивные можно пренебречь и рассматривать только взаимодействие нескольких массивных тел друг на друга; во-вторых, законы движения, применимые к отдельным частицам, образующим эти тела, как нетрудно видеть, работают и на уровне самих тел, вследствие чего с очень хорошим приближением Солнце, планеты и луны можно, в свою очередь, рассматривать как частицы и не беспокоиться по поводу малых движений отдельных составляющих небесных тел![114] И снова нам удается свести все к рассмотрению системы из «небольшого» количества тел, где расплывание начальной области в фазовом пространстве становится несущественным. Помимо небесной механики и поведения запущенных тел (камней, пуль, ядер, и т. д.), что можно рассматривать как ее частный случай, а также изучения простых систем, содержащих небольшое число частиц, — основные методы, использовавшиеся ньютоновской механикой, очевидно, не могут быть вообще отнесены к разряду «детерминистско-предсказуемых» в том смысле, о котором мы говорили выше. Общую ньютоновскую схему используют скорее для построения моделей, изучение которых позволяет делать выводы о поведении системы в целом. Некоторые точные следствия из законов движения, такие, как законы сохранения энергии, импульса и углового момента, действительно выполняются на любых масштабах. Кроме того, существуют статистические свойства, которые можно комбинировать с динамическими законами, управляющими отдельными частицами, и использовать их для общего прогнозирования поведения системы. (См. обсуждение термодинамики в главе 7; эффект расплывания в фазовом пространстве, рассмотрением которого мы занимались выше, находится в достаточно тесной взаимосвязи со вторым началом термодинамики — и при соблюдении надлежащей осторожности эти идеи действительно можно использовать для прогнозирования.) Искусно проделанное самим Ньютоном вычисление скорости звука в воздухе (слегка подправленное столетие спустя Лапласом) — хороший тому пример. Но весьма редко случается, чтобы детерминизм, присущий ньютоновской (или, в более широком смысле, гамильтоновой) динамике, реально использовался на практике. Эффект расплывания начальной области в фазовом пространстве приводит к еще одному замечательному следствию. Только подумайте: ведь он свидетельствует о том, что классическая механика, на самом деле, не в состоянии адекватно описать наш с вами мир! Я несколько преувеличиваю — но не так уж сильно. Классическая механика может достаточно точно описывать поведение жидких тел — главным образом газов, хотя (с приемлемой степенью точности) и собственно жидкостей — в том случае, когда интерес представляют общие «усредненные» свойства систем частиц; но она испытывает затруднения при попытке объяснить структуру твердых тел, которая отличается более высокой организацией. Проблемой здесь становится невозможность описать феномен сохранения твердым телом своей формы несмотря на то, что оно состоит из мириадов точечноподобных частиц, структура относительного расположения которых постоянно нарушается из-за расплывания начальной области в фазовом пространстве. Как мы теперь знаем, для того, чтобы разобраться в строении твердых тел, необходима квантовая теория, поскольку квантовые эффекты могут каким-то образом предотвратить расплывание портрета системы в фазовом пространстве. Это — весьма важный вопрос, к которому мы еще вернемся в дальнейшем (см. главы 8 и 9). Затронутая нами тема имеет не менее важное значение и для вопроса о построении «вычислительной машины». Эффект расплывания в фазовом пространстве относится к разряду явлений, которые необходимо контролировать. Нельзя позволить слишком сильно расплываться той области фазового пространства, которая соответствует «дискретному» состоянию вычислительного устройства (такой, например, как описанная выше область R0). Напомним, что даже в «бильярдном компьютере» Фредкина— Тоффоли требовались некоторые специально вводимые извне твердые стенки, необходимые для правильной работы компьютера. Объяснить «цельность» объекта, состоящего из множества частиц, можно в действительности только с помощью квантовой механики. Создается впечатление, что даже «классическая» вычислительная машина должна заимствовать некоторые принципы из квантовой физики — иначе она просто не сможет работать эффективно!
Рис. 5.15. Как можно строго применить уравнения движения Лоренца? Сила, действующая на заряженную частицу, не может быть получена измерением поля в точке нахождения частицы, так как здесь доминирует собственное поле частицыДополнительно к этому нам следует выяснить, будут ли отличающиеся по величине силы, которые действуют на частицу, стремиться повернуть или деформировать ее; а также понять, какими упругими свойствами обладает частица: и т. д. (особенно трудны вопросы возникающие в связи с теорией относительности, но я не собираюсь сейчас отвлекать на них внимание читателя). Ясно, что теперь проблема становится намного сложнее по сравнению с тем, какой она казалась нам прежде. Возможно, нам стоило бы рассматривать частицу как материальную точку. Но такой подход приводит к проблемам другого рода, ибо в непосредственной окрестности точечной частицы ее собственное электрическое поле становится бесконечным. Если, как это следует из уравнений Лоренца, частица должна реагировать на электромагнитное поле в той точке, где она находится, то точечная частица должна испытывать действие со стороны бесконечно большого поля! Чтобы формула Лоренца для величины силы имела смысл, необходимо найти способ, который позволил бы вычитать собственное поле частицы и оставлять конечное фоновое поле, которое бы однозначно определяло поведение частицы. Такой метод был предложен в 1938 году Дираком (о котором мы еще услышим в дальнейшем). Однако решение Дирака приводило к определенным следствиям, которые не могли не вызывать тревогу. Дирак обнаружил, что для однозначного определения поведения частиц и полей исходя из соответствующих начальных данных, необходимо знать не только начальное положение и скорость каждой частицы, но и ее начальное ускорение (в контексте стандартных динамических теорий такую ситуацию нельзя не признать несколько аномальной). Для большинства значений начального ускорения частица ведет себя самым «сумасшедшим» образом, спонтанно ускоряясь в пространстве до скорости, весьма близкой к световой! Эти «убегающие решения» Дирака не соответствуют ни одному природному явлению. Необходимо найти способ, который позволил бы исключать убегающие решения и правильно выбирать начальные ускорения. Такой выбор возможен всегда, но только при условии, что мы будем пользоваться неким «априорным знанием», т. е. будем задавать начальное ускорение так, будто нам уже известно, какие решения в конце концов станут убегающими, и стараться избавляться от них. Однако в стандартной детерминистской физической задаче начальные данные задаются по-другому — произвольно и без каких-либо ограничений и требований относительно будущего поведения решений. В нашем же случае не только будущее полностью определено данными, заданными в некоторый момент времени в прошлом, но и сам способ задания этих данных весьма жестко ограничен требованием, накладываемым на будущее («допустимое») поведение частиц и полей! Так обстоит дело, пока мы рассматриваем фундаментальные классические уравнения. Читатель легко поймет, что вопрос о детерминизме и вычислимости в законах классической физики носит раздражающе неясный характер. Действительно ли в физических законах есть телеологическая составляющая, которая заставляет будущее каким-то образом оказывать влияние на происходящее в прошлом? На самом деле, физики обычно не рассматривают подобные следствия из классической электродинамики (теории классических заряженных частиц, а также электрического и магнитного полей) как соответствующие реальности. Стандартный ответ физиков на упомянутые выше трудности сводится к утверждению, что «отдельные заряженные частицы» относятся к области квантовой электродинамики, и что нельзя ожидать получить разумные ответы на подобные вопросы, если использовать строго классическую теорию. Такое утверждение, безусловно, верно — но, как мы увидим в дальнейшем, в самой квантовой теории здесь также возникают проблемы. На самом деле, Дирак исследовал классическую задачу движения заряженной частицы именно потому, что надеялся обнаружить там какие-нибудь новые идеи, способные помочь в разрешении еще более фундаментальных трудностей, возникающих при рассмотрении (физически более адекватной) квантовой задачи. С проблемами квантовой теории нам еще придется столкнуться позднее!
«Таким образом, пространство само по себе и время само по себе обречены исчезнуть, превратившись в бесплотные тени, и только объединение пространства и времени сохранится как независимая реальность».Попытаемся понять основные положения специальной теории относительности в терминах величественного пространства-времени Минковского. Одна из трудностей на пути к освоению понятия пространства-времени связана с его четырехмерностью, мешающей нам представить себе пространство-время наглядно. Но после того, как мы пережили нашу встречу с фазовым пространством, представить себе всего лишь четыре измерения не составит для нас особых трудностей! Как и в случае с фазовым пространством, мы пойдем на «обман» и нарисуем картину пространства меньшего числа измерений, но теперь степень обмана будет несравненно меньше, а картина, соответственно — гораздо точнее и ближе к истинной. Для многих целей достаточно рассмотреть двумерное пространство-время (одно измерение — для пространства и одно измерение — для времени). Я надеюсь, что читатель простит мне некоторую напористость и разрешит подняться до трехмерного пространства-времени (два измерения — для пространства, и одно измерение — для времени). Это позволит нарисовать вполне убедительную картину, посмотрев на которую нетрудно будет понять, что, в принципе, аналогичные идеи могут быть легко распространены без особых изменений и на четырехмерный случай. Рассматривая графическое изображение пространства-времени, необходимо иметь в виду, что каждая точка на картинке представляет некоторое событие, т. е. определенную точку в пространстве в какой-то конкретный момент времени.Иначе говоря, точка пространства-времени обладает только мгновенным существованием. Полная картина пространства-времени изображает всю историю: прошлое, настоящее и будущее. Любая частица, коль скоро она существует на протяжении некоторого времени, представляется в пространстве-времени не точкой, а линией, которая называется мировой линией данной частицы. Мировая линия — прямая в случае равномерного движения частицы, и искривленная, если частица движется с ускорением (т. е. неравномерно) — описывает всю историю существования частицы. На рис. 5.16 я изобразил пространство-время с двумя пространственными измерениями и одним временны́м.
Рис. 5.16. Световой конус в пространстве-времени Минковского (с двумя пространственными измерениями), описывающий историю световой вспышки при взрыве, произошедшем в точке О пространства-времениМожно считать, что существует обычная временна́я координата t, измеряемая по вертикали, и две пространственные координаты x/c и z/c, измеряемые по горизонтали[121]. Конус с вершиной в центре — это световой конус (будущего), с центром в начале координат О пространства-времени. Чтобы по достоинству оценить его значение, представьте себе, что в точке О происходит взрыв. (Иначе говоря, взрыв происходит в начале пространства в момент времени t = 0.) Этот световой конус описывает историю света, испущенного при взрыве. На языке двумерного пространства история вспышки света была бы окружностью, расширяющейся со скоростью света с. В полном трехмерном пространстве вместо окружности мы имели бы сферу, расширяющуюся со скоростью света с, — сферический волновой фронт света. Но в рассматриваемом примере мы «подавляем» пространственное направление у и поэтому получаем всего лишь окружность, подобную круговым волнам, расходящимся от точки падения камня на поверхность пруда. Нетрудно понять, что на объемной картине пространства-времени мы получим расширяющиеся окружности, если рассмотрим серию горизонтальных сечений светового конуса, каждое последующее из которых расположено выше предыдущего. Эти горизонтальные сечения представляют собой различные пространственные описания волнового фронта света по мере возрастания временно́й координаты t. Одна из отличительных особенностей специальной теории относительности состоит в том, что никакая материальная частица не может двигаться быстрее света (подробнее об этом — чуть позднее). Все материальные частицы, возникшие при взрыве, должны отставать от света. На языке пространства-времени это означает, что мировые линии всех частиц, испущенных при взрыве, должны лежать внутри светового конуса. Часто свет бывает удобно описывать не электромагнитными волнами, а как поток частиц, называемых фотонами. Мы можем мысленно представлять себе «фотон» как крохотный «пакет» электромагнитного поля, осциллирующего с высокой частотой. Термин «волновой пакет» физически более приемлем в контексте квантовых описаний, к которым мы перейдем в следующей главе, но пока для нас будут полезны и «классические» фотоны. В свободном пространстве фотоны всегда движутся по прямолинейным траекториям с постоянной скоростью с. Это означает, что, изображенная на картине пространства-времени Минковского мировая линия фотона всегда имеет вид прямой, образующей с вертикалью угол 45°. Фотоны, образовавшиеся при взрыве в точке О пространства-времени, описывают световой конус с вершиной в О. Описанными выше свойствами должны обладать все точки пространства-времени. В начале пространства-времени нет ничего особенного: точка О ничем не отличается от любой другой точки. Следовательно, в любой точке пространства-времени должен быть свой световой конус, имеющий такой же смысл, как и световой конус, исходящий из начала пространства-времени. История любой вспышки света, или мировые линии фотонов, если угодно воспользоваться корпускулярным описанием света, всегда располагаются на поверхности светового конуса с вершиной в каждой точке пространства-времени — тогда как история любой материальной частицы всегда должна располагаться внутри соответствующего светового конуса. Это показано на рис. 5.17. Семейство световых конусов во всех точках пространства-времени можно рассматривать как часть геометрии Минковского пространства-времени.
Рис. 5.17. Картина геометрии МинковскогоЧто такое геометрия Минковского? Самая важная ее часть — структура светового конуса, хотя геометрия Минковского ею не исчерпывается. В этой геометрии существует понятие «расстояния», во многом аналогичное определению расстояния в евклидовой геометрии. В трехмерной евклидовой геометрии расстояние r от произвольной точки до начала координат, выраженное через обычные декартовы координаты, определяется соотношением r2 = x2 + y2 + z2
Рис. 5.18. Сравнение «расстояний», измеренных в (а) евклидовой геометрии и (б) геометрии Минковского (здесь «расстояние» означает «прожитое время»)(См. рис. 5.18 а. Это — всего лишь теорема Пифагора; возможно, двумерный вариант этого соотношения более привычен читателю.) В нашей трехмерной геометрии Минковского выражение для расстояния очень похоже на евклидово (рис. 5.18 б); существенное отличие состоит в том, что в геометрии Минковского это выражение содержит два знака минус: Каков физический смысл величины «расстояния» s в этом выражении? Предположим, что мы рассматриваем точку Р с координатами (t, x/c, y/c, z/c), или (t, x/c, z/c) в трехмерном случае; см. рис. 5.16 — она лежит в световом конусе (будущего) точки О. Тогда прямолинейный отрезок ОР может представлять часть истории какой-то материальной частицы, например, испущенной при взрыве. «Длина» Минковского s отрезка ОР допускает прямую физическую интерпретацию. Это — продолжительность (длина) интервала времени, реально прожитого частицей между событиями О и Р! Иначе говоря, если бы существовали очень прочные и точные часы, намертво прикрепленные к частице[122], то разность между их показаниями в точках О и Р составила бы ровно s единиц времени. Вопреки ожиданиям, величина t сама по себе не описывает время, измеряемое этими гипотетическими часами — за исключением того случая, когда часы «покоятся» в нашей системе координат (т. е. имеют фиксированные значения координат х/с, у/с, z/c), а это означает, что мировая линия часов имеет на «картине» вид вертикальной прямой. Таким образом, t будет задавать «время» только для тех наблюдателей, которые «стационарны» (т. е. чьи мировые линии — «вертикальные» прямые). Правильной мерой времени для движущегося (равномерно и прямолинейно из начала координат О) наблюдателя, согласно специальной теории относительности, служит величина s. Заключение, к которому мы пришли, весьма удивительно и полностью расходится с находящейся в согласии со «здравым смыслом» галилеево-ньютони-анской мерой времени, которая просто совпадает с координатным значением t. Обратите внимание на то, что релятивистская (в смысле Минковского) мера времени s всегда несколько меньше, чем t, если вообще существует какое-то движение (так как s2 меньше, чем t2, коль скоро не все координаты х/с, у/с, z/c равны нулю), как это следует из приведенной выше формулы. Наличие движения (т. е. случай, когда отрезок ОР расположен не вдоль оси t) приводит к «замедлению» хода часов по сравнению с t, иными словами, по отношению к показаниям часов в нашей системе отсчета. Если скорость движения мала по сравнению с с, то величины s и t почти совпадают, чем объясняется то, что мы непосредственно не ощущаем «замедление хода движущихся часов». В другом предельном случае, когда скорость движения совпадает со скоростью света, точка Р лежит на световом конусе, и мы получаем s = 0. Световой конус есть не что иное, как геометрическое место точек, для которых «расстояние» в смысле Минковского (т. е. «время») от начала координат О действительно равно нулю. Таким образом, фотон вообще «не ощущает», как течет время! (Мы не можем позволить себе рассматривать еще более экстремальный случай, когда точка Р движется у самой поверхности снаружи светового конуса, так как это привело бы к мнимому значению s — квадратному корню из отрицательного числа, и нарушило бы правило, согласно которому материальные частицы, или фотоны, не могут двигаться быстрее света.)[123] Понятие «расстояния» в смысле Минковского одинаково хорошо применимо к любой паре точек в пространстве-времени, одна из которых лежит внутри световою конуса другой, так что частица может двигаться из одной точки в другую. Мы просто будем считать, что начало координат О перенесено в какую-то иную точку пространства-времени. Кроме того, расстояние по Минковскому между точками соответствует интервалу времени, отсчитываемого часами, которые равномерно и прямолинейно движутся из одной точки в другую. Когда в качестве частицы выступает фотон, и расстояние в смысле Минковского обращается в нуль, мы получаем две точки, одна из которых лежит на световом конусе другой — что позволяет строить световой конус для последней. Основная структура геометрии Минковского со столь причудливой мерой «длины» мировых линий, интерпретируемой как время, измеряемое (или «прожитое») физическими часами, несет в себе самую суть специальной теории относительности. В частности, читателю, возможно, известен так называемый «парадокс близнецов» в СТО: один из братьев-близнецов остается на Земле, другой совершает путешествие на соседнюю звезду, двигаясь туда и обратно с огромной скоростью, приближающейся к скорости света. По возвращении выясняется, что близнецы состарились неодинаково: путешественник все еще молод, а его брат, остававшийся на Земле, стал дряхлым стариком. «Парадокс близнецов» легко описывается в терминах геометрии Минковского, и всякий может без труда понять, почему это явление — хотя и способное озадачить — парадоксальным все же не является. Мировая линия АС принадлежит тому из близнецов, который остается дома, тогда как мировая линия близнеца-путешествен-ника состоит из двух отрезков А В и ВС, соответствующих полету на звезду и возвращению на Землю (рис. 5.19).
Рис. 5.19. Так называемый «парадокс близнецов» специальной теории относительности, трактуемый с помощью неравенства треугольника в геометрии Минковского. (Для сравнения приведен и евклидов случай.)Близнец-домосед проживает время, измеряемое расстоянием в смысле Минковского АС, тогда как близнец-путешественник проживает время, измеряемое суммой[124] двух расстояний АВ и ВС. Эти времена не равны, и мы обнаруживаем, что АС > АВ + ВС. Это неравенство показывает, что время, прожитое близнецом-домоседом, действительно больше времени, прожитого близнецом-путешественником. Полученное неравенство очень похоже на хорошо известное неравенство треугольника из обычной евклидовой геометрии (А, B и С теперь — три точки в евклидовом пространстве): АС < АВ + ВС, которое утверждает, что сумма двух сторон треугольника всегда больше третьей стороны. Это неравенство мы не считаем парадоксом! Мы прочно усвоили идею о том, что евклидова мера расстояния вдоль пути из одной точки в другую (в нашем случае — из А в С), зависит от того, какой путь мы в действительности выберем. (В рассматриваемом примере двумя путями служат АС и более длинный изломанный маршрут ABC.) Неравенство треугольника — частный случай общего утверждения, которое гласит, что кратчайшее расстояние между двумя точками (в данном случае А и С) измеряется по прямой, их соединяющей (отрезок АС). Изменение знака неравенства на обратный при измерении расстояний в смысле Минковского происходит вследствие изменения знаков в определении «расстояния», в результате чего отрезок АС, измеряемый по Минковскому, оказывается «длиннее», чем ломаный маршрут ABC. Таким образом, «неравенство треугольника» в геометрии Минковского в более обобщенной формулировке говорит о том, что самой длинной (в смысле наибольшего прожитого времени) среди мировых линий, соединяющих два события, является прямая (т. е. траектория, соответствующая равномерному движению). Если оба близнеца стартуют из точки А и завершают свой путь в точке С, и при этом первый близнец движется прямо из А в С без ускорения, а второй — с ускорением, то первый близнец к моменту встречи со вторым всегда успевает прожить более длинный интервал времени. Может показаться возмутительным вводить столь странную и сильно расходящуюся с нашими интуитивными представлениями концепцию меры времени. Однако ныне имеется огромное количество экспериментальных данных, свидетельствующих о правомерности такого положения. Например, существует много субатомных частиц, которые распадаются (т. е. превращаются в другие частицы) в определенной шкале времени. Иногда такие частицы движутся со скоростями, очень близкими к скорости света (например, так происходит с космическими лучами, попадающими на Землю из космического пространства, или в созданных человеком ускорителях элементарных частиц), и их времена распада оказываются при этом «растянуты» в полном согласии с вышеизложенными рассуждениями. Еще удивительнее другое: теперь, когда стало возможным изготовить особо точные («ядерные») часы, мы можем непосредственно обнаружить эффекты замедления хода часов, перевозимых на высокоскоростных самолетах, летающих на небольшой высоте — причем результаты измерений согласуются с мерой «расстояния» s в смысле Минковского, а не с t! (Строго говоря, с учетом высоты приходится принимать во внимание небольшие дополнительные гравитационные эффекты, предсказываемые общей теорией относительности, но они также согласуются с наблюдениями — см. следующий раздел.) Кроме того, существует много других явлений, тесно связанных со всей теоретической основой СТО, постоянно подтверждающейся вплоть до мельчайших деталей. Одно из них — знаменитое соотношение Эйнштейна Е = mc2, которое по существу устанавливает равноправие энергии и массы. (В конце этой главы мы познакомимся с некоторыми необычайно заманчивыми следствиями из этого соотношения.) Я еще не объяснил, каким образом принцип относительности оказывается реально включенным в намеченную выше схему. Каким образом происходит, что наблюдатели, движущиеся прямолинейно и равномерно с различными скоростями, могут оказаться эквивалентными с точки зрения геометрии Минковского? Каким образом ось времени на рис. 5.16 («стационарный наблюдатель») может быть полностью эквивалентной некоторой другой прямолинейной мировой линии, например, отрезку ОР («движущийся наблюдатель»)? Задумаемся сначала над особенностями евклидовой геометрии. Ясно, что в ней две произвольные несовпадающие прямые совершенно эквивалентны по отношению к геометрии в целом. Можно мысленно представить себе, что все евклидово пространство «скользит» по самому себе как «жестко скрепленное целое» до тех пор, пока одна прямая не совпадет с другой. Представьте себе двумерный случай — евклидову плоскость. Можно представить себе листок бумаги, жестко скользящий по плоской поверхности, до тех пор, пока некоторая прямая, проведенная на листке бумаги, не совпадет с прямой, проведенной на поверхности. Это «жесткое» движение сохраняет структуру геометрии. Аналогичное утверждение справедливо и относительно геометрии Минковского, хотя это и менее очевидно, так что следует проявлять особую осмотрительность, договариваясь о том, какой смысл надлежит вкладывать в термин «жесткое движение». Вместо листка бумаги следует рассматривать особый материал (возьмем сначала для простоты двумерный случай), на котором прямые с углом наклона 45° сохраняют этот угол, тогда как сам материал может растянуться в одном направлении под углом 45° и, соответственно, сжаться в другом направлении под углом 45°. Такая ситуация изображена на рис. 5.20. На рис. 5.21 я попытался показать, что происходит в трехмерном случае.
Рис. 5.20. Движение Пуанкаре в двумерном пространстве-времени
Рис. 5.21. Движение Пуанкаре в трехмерном пространстве-времени. На рисунке справа изображены пространства, одновременные для наблюдателя S, на рисунке слева — одновременные для наблюдателя М. Обратите внимание, что, по мнению наблюдателя S, событие R предшествует событию Q, тогда как, с точки зрения наблюдателя М, событие Q предшествует событию R. (Движение в данном случае считается пассивным, т. е. приводит лишь к различным описаниям двумя наблюдателями S и М одного и того же пространства-времени.)Эта разновидность «жесткого движения» пространства Минковского, называемая движением Пуанкаре (или неоднородным движением Лоренца), может выглядеть не очень «жесткой», но она сохраняет все расстояния в смысле Минковского, а «сохранение всех расстояний» — это ни что иное, как смысл понятия «жесткий» в евклидовом случае. Принцип специальной относительности утверждает, что законы физики при таких движениях Пуанкаре пространства-времени остаются неизменными. В частности, «стационарный» наблюдатель S, мировая линия которого совпадает с осью времени на нашем исходном изображении пространства-времени Минковского (рис. 5.16), имеет дело с физикой, совершенно эквивалентной физике «движущегося» наблюдателя М с мировой линией вдоль прямой ОР. Каждая координатная плоскость t = const представляет для наблюдателя S «пространство» в какой-то один момент «времени», т. е. семейство событий, которые он считает одновременными (происходящими в «одно и то же время»). Назовем эти плоскости одновременными пространствами наблюдателя S. Когда же мы переходим к другому наблюдателю М, то с необходимостью переводим наше исходное семейство одновременных пространств в некоторое новое семейство с помощью движения Пуанкаре, что позволяет нам получить одновременные пространства для наблюдателя М[125]. Обратите внимание на то, что одновременные пространства наблюдателя М выглядят «наклоненными вверх» (рис. 5.21). Если мыслить в терминах жестких движений в евклидовой геометрии, то может показаться, что наклон на рис. 5.21 изображен не в ту сторону, но именно таким его следует ожидать в геометрии Минковского. Наблюдатель S думает, что все события на любой плоскости t = const происходят одновременно, а наблюдатель М должен придерживаться другого мнения: ему кажется, что одновременно происходят все события на каждом из «наклоненных» одновременных пространств! Геометрия Минковского сама по себе не содержит единственного понятия «одновременности»; но каждый наблюдатель, движущийся равномерно и прямолинейно, имеет свое собственное представление о том, что значит «одновременно». Рассмотрим два события R и Q на рис. 5.21. С точки зрения наблюдателя S событие R происходит раньше события Q, так как R лежит в более раннем одновременном пространстве, чем Q. Но с точки зрения наблюдателя М все будет наоборот, и событие Q окажется в более раннем одновременном пространстве, чем R. Таким образом, для одного наблюдателя событие R происходит раньше события Q, а для другого наблюдателя — позже! (Так может случиться лишь потому, что события R и Q, как принято говорить, пространственно разделены, что означает следующее: каждое событие находится вне светового конуса другого события, в результате чего ни одна материальная частица или фотон не могут совершить путешествие от одного события к другому.) Даже при очень медленных относительных скоростях для точек, разделенных большими расстояниями, имеют место значительные различия в хронологической последовательности. Представим себе двух людей, медленно проходящих друг мимо друга на улице. События в туманности Андромеды (ближайшей большой галактики, находящейся на расстоянии 20 000 000 000 000 000 000 км от нашей собственной галактики — Млечного Пути), одновременные по мнению этих двух прохожих, в тот момент, когда они поравняются друг с другом — могут отстоять по времени друг от друга на несколько суток (рис. 5.22).
Рис. 5.22. Два наблюдателя А и В медленно проходят мимо друг друга. Их мнения относительно того, стартовал ли космический флот Андромеды в момент, когда они поравнялись, существенно отличаютсяВ то время как для одного из прохожих космический флот, отправленный с заданием уничтожить все живое на Земле, уже находится в полете, для другого прохожего само решение относительно отправки космического флота в рейд еще не принято!
Рис. 5.23. Галилей бросает два камня (и видеокамеру) с Пизанской башниВ описанной выше картине мы пренебрегаем сопротивлением воздуха. В наше время космические полеты открывают перед нами лучшую возможность проверки этих идей, так как в космическом пространстве нет воздуха. Кроме того, «падение» в космическом пространстве означает просто движение по определенной орбите под действием гравитации. Такое «падение» совсем не обязательно должно происходить по прямой вниз — к центру Земли. В нем вполне может быть и некоторая горизонтальная составляющая. Если эта горизонтальная составляющая достаточно велика, то тело может «падать» по круговой орбите вокруг Земли, не приближаясь к ее поверхности! Путешествие по свободной околоземной орбите под действием гравитации — весьма изощренный (и очень дорогой!) способ «падения». Как в описанной выше видеозаписи, астронавт, совершая «прогулку в открытом космосе», видит свой космический корабль парящим перед собой и как бы не испытывающим действия гравитации со стороны огромного шара Земли под ним! (См. рис. 5.24.) Таким образом, переходя в «ускоренную систему отсчета» свободного падения, можно локально исключить действие гравитации.
Рис. 5.24. Астронавт видит, что его космический корабль парит перед ним, как будто неподверженный действию гравитацииМы видим, что свободное падение позволяет исключить гравитацию потому, что эффект от действия гравитационного поля такой же, как от ускорения Действительно, если вы находитесь в лифте, который движется с ускорением вверх, то вы просто ощущаете, что кажущееся гравитационное поле увеличивается, а если лифт движется с ускорением вниз, то вам кажется, что гравитационное поле убывает. Если бы трос, на котором подвешена кабина, оборвался, то (если пренебречь сопротивлением воздуха и эффектами трения) результирующее ускорение, направленное вниз (к центру Земли), полностью уничтожило бы действие гравитации, и люди, оказавшиеся в кабине лифта, стали бы свободно плавать в пространстве, подобно астронавту во время выхода в открытый космос, до тех пор, пока кабина не стукнулась бы о Землю! Даже в поезде или на борту самолета ускорения могут быть такими, что ощущения пассажира относительно величины и направления гравитации могут не совпадать с тем, где, как показывает обычный опыт, должны быть «верх» и «низ». Объясняется это тем, что действия ускорения и гравитации схожи настолько, что наши ощущения не способны отличить одни от других. Этот факт — то, что локальные проявления гравитации эквивалентны локальным проявлениям ускоренно движущейся системы отсчета, — и есть то, что Эйнштейн назвал принципом эквивалентности. Приведенные выше соображения «локальны». Но если разрешается производить (не только локальные) измерения с достаточно высокой точностью, то в принципе можно установить различие между «истинным» гравитационным полем и чистым ускорением. На рис. 5 25 я изобразил в немного преувеличенном виде, как первоначально стационарная сферическая конфигурация частиц, свободно падающая под действием гравитации, начинает деформироваться под влиянием неоднородности (ньютоновского) гравитационного поля.
Рис. 5.25. Приливный эффект. Двойные стрелки указывают относительное ускорение (ВЕЙЛЬ)Это поле неоднородно в двух отношениях. Во-первых, поскольку центр Земли расположен на некотором конечном расстоянии от падающего тела, частицы, расположенные ближе к поверхности Земли, движутся вниз с бо́льшим ускорением, чем частицы, расположенные выше (напомним закон обратной пропорциональности квадрату расстояния Ньютона). Во-вторых, по той же причине существуют небольшие различия в направлении ускорения для частиц, занимающих различные положения на горизонтали. Из-за этой неоднородности сферическая форма начинает слегка деформироваться, превращаясь в «эллипсоид». Первоначальная сфера удлиняется в направлении к центру Земли (а также в противоположном направлении), так как те ее части, которые ближе к центру Земли, движутся с чуть бо́льшим ускорением, чем те части, которые дальше от центра Земли, и сужается по горизонтали, так как ускорения ее частей, находящихся на концах горизонтального диаметра, слегка скошены «внутрь» — в направлении на центр Земли. Это деформирующее действие известно как приливный эффект гравитации. Если мы заменим центр Земли Луной, а сферу из материальных частиц — поверхностью Земли, то получим в точности описание действия Луны, вызывающей приливы на Земле, причем «горбы» образуются по направлению к Луне и от Луны. Приливный эффект — общая особенность гравитационных полей, которая не может быть «исключена» с помощью свободного падения. Приливный эффект служит мерой неоднородности ньютоновского гравитационного поля. (Величина приливной деформации в действительности убывает обратно пропорционально кубу, а не квадрату расстояния от центра притяжения.) Закон всемирного тяготения Ньютона, по которому сила обратно пропорциональна квадрату расстояния, допускает, как оказывается, простую интерпретацию в терминах приливного эффекта: объем эллипсоида, в который первоначально[126] деформируется сфера, равен объему исходной сферы — в предположении, что сфера окружает вакуум. Это свойство сохранения объема характерно для закона обратных квадратов; ни для каких других законов оно не выполняется. Предположим далее, что исходная сфера окружает не вакуум, а некоторое количество материи общей массой М. Тогда возникает дополнительная компонента ускорения, направленная внутрь сферы из-за гравитационного притяжения материи внутри сферы. Объем эллипсоида, в который первоначально деформируется наша сфера из материальных частиц, сокращается — на величину, пропорциональную М. С примером эффекта уменьшения объема эллипсоида мы бы столкнулись, если бы выбрали нашу сферу так, чтобы она окружала Землю на постоянной высоте (рис. 5.26). Тогда обычное ускорение, обусловленное земным притяжением и направленное вниз (т. е. внутрь Земли), будет той самой причиной, по которой происходит сокращение объема нашей сферы.
Рис. 5.26. Когда сфера окружает некое вещество (в данном случае — Землю), возникает результирующее ускорение, направленное внутрь (РИЧЧИ)В этом свойстве сжимания объема заключена оставшаяся часть закона всемирного тяготения Ньютона, а именно — что сила пропорциональна массе притягивающего тела. Попробуем получить пространственно-временну́ю картину такой ситуации. На рис. 5.27 я изобразил мировые линии частиц нашей сферической поверхности (представленной на рис. 5.25 в виде окружности), причем я использовал для описания ту систему отсчета, в которой центральная точка сферы кажется покоящейся («свободное падение»).
Рис. 5.27. Кривизна пространства-времени: приливный эффект, изображенный в пространстве-времениПозиция общей теории относительности состоит в том, чтобы считать свободное падение «естественным движением» — аналогичным «равномерному прямолинейному движению», с которыми имеют дело в отсутствие гравитации. Таким образом, мы пытаемся описывать свободное падение «прямыми» мировыми линиями в пространстве-времени! Но если взглянуть на рис. 5.27, то становится понятно, что использование слова «прямые» применительно к этим мировым линиям способно ввести читателя в заблуждение, поэтому мы будем в терминологических целях называть мировые линии свободно падающих частиц в пространстве-времени — геодезическими. Но насколько хороша такая терминология? Что обычно понимают под «геодезической» линией? Рассмотрим аналогию для двумерной искривленной поверхности. Геодезическими называются такие кривые, которые на данной поверхности (локально) служат «кратчайшими маршрутами». Иначе говоря, если представить себе отрезок нити, натянутый на указанную поверхность (и не слишком длинный, чтобы он не мог соскользнуть), то нить расположится вдоль некоторой геодезической линии на поверхности.
Рис. 5.28. Геодезические линии в искривленном пространстве: линии сходятся в пространстве с положительной кривизной, и расходятся — в пространстве с отрицательной кривизнойНа рис. 5.28 я привел два примера поверхностей: первая (слева) — поверхность так называемой «положительной кривизны» (как поверхность сферы), вторая — поверхность «отрицательной кривизны» (седловидная поверхность). На поверхности положительной кривизны две соседние геодезические линии, выходящие из начальных точек параллельно друг другу, начинают впоследствии изгибаться навстречу друг другу; а на поверхности отрицательной кривизны они изгибаются в стороны друг от друга. Если мы представим себе, что мировые линии свободно падающих частиц в некотором смысле ведут себя как геодезические линии на поверхности, то окажется, что существует тесная аналогия между гравитационным приливным эффектом, о котором шла речь выше, и эффектами кривизны поверхности — причем как положительной кривизны, так и отрицательной. Взгляните на рис. 5.25, 5.27. Мы видим, что в нашем пространстве-времени геодезические линии начинают расходиться в одном направлении (когда они «выстраиваются» в сторону Земли) — как это происходит на поверхности отрицательной кривизны на рис. 5.28 — и сближаться в других направлениях (когда они смещаются горизонтально относительно Земли) — как на поверхности положительной кривизны на рис. 5.28. Таким образом, создается впечатление, что наше пространство-время, как и вышеупомянутые поверхности, тоже обладает «кривизной», только более сложной, поскольку из-за высокой размерности пространства-времени при различных перемещениях она может носить смешанный характер, не будучи ни чисто положительной, ни чисто отрицательной. Отсюда следует, что понятие «кривизны» пространства-времени может быть использовано для описания действия гравитационных полей. Возможность использования такого описания в конечном счете следует из интуитивного открытия Галилея (принципа эквивалентности) и позволяет нам исключить гравитационную «силу» с помощью свободного падения. Действительно, ничто из сказанного мной до сих пор не выходит за рамки ньютонианской теории. Нарисованная только что картина дает просто переформулировку этой теории[127]. Но когда мы пытаемся скомбинировать новую картину с тем, что дает предложенное Минковским описание специальной теории относительности — геометрии пространства-времени, которая, как мы знаем, применяется в отсутствие гравитации — в игру вступает новая физика. Результат этой комбинации — общая теория относительности Эйнштейна. Напомним, чему учил нас Минковский. Мы имеем (в отсутствие гравитации) пространство-время, наделенное особого рода мерой «расстояния» между точками: если мы имеем в пространстве-времени мировую линию, описывающую траекторию какой-нибудь частицы, то «расстояние» в смысле Минковского, измеряемое вдоль этой мировой линии, дает время, реально прожитое частицей. (В действительности, в предыдущем разделе мы рассматривали это «расстояние» только для тех мировых линий, которые состоят из прямолинейных отрезков — но приведенное выше утверждение справедливо и по отношению к искривленным мировым линиям, если «расстояние» измеряется вдоль кривой.) Геометрия Минковского считается точной, если нет гравитационного поля, т. е. если у пространства-времени нет кривизны. Но при наличии гравитации мы рассматриваем геометрию Минковского уже лишь как приближенную — аналогично тому, как плоская поверхность лишь приблизительно соответствует геометрии искривленной поверхности. Вообразим, что, изучая искривленную поверхность, мы берем микроскоп, дающий все большее увеличение — так, что геометрия искривленной поверхности кажется все больше растянутой. При этом поверхность будет нам казаться все более плоской. Поэтому мы говорим, что искривленная поверхность имеет локальное строение евклидовой плоскости[128]. Точно так же мы можем сказать, что при наличии гравитации пространство-время локально описывается геометрией Минковского (которая есть геометрия плоского пространства-времени), но мы допускаем некоторую «искривленность» на более крупных масштабах (рис. 5.29).
Рис. 5.29. Картина искривленного пространства-времениВ частности, как и в пространстве Минковского, любая точка пространства-времени является вершиной светового конуса — но в данном случае эти световые конусы расположены уже не одинаково. В главе 7 мы познакомимся с отдельными моделями пространства-времени, в которых явно видна эта неоднородность расположения световых конусов (см. рис. 7.13, 7.14). Мировые линии материальных частиц всегда направлены внутрь световых конусов, а линии фотонов — вдоль световых конусов. Вдоль любой такой кривой мы можем ввести «расстояние» в смысле Минковского, которое служит мерой времени, прожитого частицами так же, как и в пространстве Минковского. Как и в случае искривленной поверхности, эта мера «расстояния» определяет геометрию поверхности, которая может отличаться от геометрии плоскости. Геодезическим линиям в пространстве-времени теперь можно придать интерпретацию, аналогичную интерпретации геодезических линий на двумерных поверхностях, учитывая при этом различия между геометриями Минковского и Евклида. Таким образом, наши геодезические линии в пространстве-времени представляют собой не (локально) кратчайшие кривые, а наоборот — кривые, которые (локально) максимизируют «расстояние» (т. е. время) вдоль мировой линии. Мировые линии частиц, свободно перемещающиеся под действием гравитации, согласно этому правилу действительно являются геодезическими. В частности, небесные тела, движущиеся в гравитационном поле, хорошо описываются подобными геодезическими линиями. Кроме того, лучи света (мировые линии фотонов) в пустом пространстве так же служат геодезическими линиями, но на этот раз — нулевой «длины»[129]. В качестве примера я схематически нарисовал на рис. 5.30 мировые линии Земли и Солнца. Движение Земли вокруг Солнца описывается «штопорообразной» линией, навивающейся вокруг мировой линии Солнца. Там же я изобразил фотон, приходящий на Землю от далекой звезды. Его мировая линия кажется слегка «изогнутой» вследствие того, что свет (по теории Эйнштейна) на самом деле отклоняется гравитационным полем Солнца.
Рис. 5.30. Мировые линии Земли и Солнца. Световой луч от далекой звезды отклоняется СолнцемНам необходимо еще выяснить, каким образом ньютоновский закон обратных квадратов может быть включен (после надлежащей модификации) в общую теорию относительности Эйнштейна. Обратимся еще раз к нашей сфере из материальных частиц, падающей в гравитационном поле. Напомним, что если внутри сферы заключен только вакуум, то, согласно теории Ньютона, объем сферы первоначально не изменяется; но если внутри сферы находится материя общей массой М, то происходит сокращение объема, пропорциональное М. В теории Эйнштейна (для малой сферы) правила в точности такие же, за исключением того, что не все изменение объема определяется массой М; существует (обычно очень малый) вклад от давления, возникающем в окруженном сферой материале. Полное математическое выражение для кривизны четырехмерного пространства-времени (которая должна описывать приливные эффекты для частиц, движущихся в любой данной точке по всевозможным направлениям) дается так называемым тензором кривизны Римана. Это несколько сложный объект; для его описания необходимо в каждой точке указать двадцать действительных чисел. Эти двадцать чисел называются его компонентами. Различные компоненты соответствуют различным кривизнам в различных направлениях пространства-времени. Тензор кривизны Римана обычно записывают в виде Rtjkl, но так как мне не хочется объяснять здесь, что означаютэти субиндексы (и, конечно, что такое тензор), то я запишу его просто как: РИМАН. Существует способ, позволяющий разбить этот тензор на две части, называемые, соответственно, тензором ВЕЙЛЯ и тензором РИЧЧИ (каждый — с десятью компонентами). Условно я запишу это разбиение так: РИМАН = ВЕЙЛЬ + РИЧЧИ. (Подробная запись тензоров Вейля и Риччи для наших целей сейчас совершенно не нужна.) Тензор Вейля ВЕЙЛЬ служит мерой приливной деформации нашей сферы из свободно падающих частиц (т. е. изменения начальной формы, а не размеров); тогда как тензор Риччи РИЧЧИ служит мерой изменения первоначального объема[130]. Напомним, что ньютоновская теория гравитации требует, чтобы масса, содержащаяся внутри нашей падающей сферы, была пропорциональна этому изменению первоначального объема. Это означает, что, грубо говоря, плотность массы материи — или, что эквивалентно, плотность энергии (так как Е = mc2) — следует приравнять тензору Риччи. По существу, это именно то, что утверждают уравнения поля общей теории относительности, а именно — полевые уравнения Эйнштейна[131]. Правда, здесь имеются некоторые технические тонкости, в которые нам сейчас, впрочем, лучше не вдаваться. Достаточно сказать, что существует объект, называемый тензором энергии-импульса, который объединяет всю существенную информацию об энергии, давлении и импульсе материи и электромагнитных полей. Я буду называть этот тензор ЭНЕРГИЕЙ. Тогда уравнения Эйнштейна весьма схематично можно представить в следующем виде, РИЧЧИ = ЭНЕРГИЯ. (Именно наличие «давления» в тензоре ЭНЕРГИЯ вместе с некоторыми требованиями непротиворечивости уравнений в целом приводят с необходимостью к учету давления в описанном выше эффекте сокращения объема.) Кажется, что вышеприведенное соотношение ничего не говорит о тензоре Вейля. Тем не менее, оно отражает одно важное свойство. Приливный эффект, производимый в пустом пространстве, обусловлен ВЕЙЛЕМ. Действительно, из приведенных выше уравнений Эйнштейна следует, что существуют дифференциальные уравнения, связывающие ВЕЙЛЯ с ЭНЕРГИЕЙ — практически как во встречавшихся нам ранее уравнениях Максвелла[132]. Действительно, точка зрения, согласно которой ВЕЙЛЯ надлежит рассматривать как своего рода гравитационный аналог электромагнитного поля (в действительности, тензора — тензора Максвелла), описываемого парой (Е, В), оказывается весьма плодотворной. В этом случае ВЕЙЛЬ служит своего рода мерой гравитационного поля. «Источником» для ВЕЙЛЯ является ЭНЕРГИЯ — подобно тому, как источником для электромагнитного поля (Е, В) является (ρ, j) — набор из зарядов и токов в теории Максвелла. Эта точка зрения будет полезна нам в главе 7. Может показаться весьма удивительным, что при столь существенных различиях в формулировке и основополагающих идеях, оказывается довольно трудно найти наблюдаемые различия между теориями Эйнштейна и теорией, выдвинутой Ньютоном двумя с половиной столетиями раньше. Но если рассматриваемые скорости малы по сравнению со скоростью света с, а гравитационные поля не слишком сильны (так, что скорости убегания гораздо меньше с, см. главу 7, «Динамика Галилея и Ньютона»), то теория Эйнштейна по существу дает те же результаты, что и теория Ньютона. Но в тех ситуациях, когда предсказания этих двух теорий расходятся, прогнозы теории Эйнштейна оказываются точнее. К настоящему времени был проведен целый ряд весьма впечатляющих экспериментальных проверок, которые позволяют считать новую теорию Эйнштейна вполне обоснованной. Часы, согласно Эйнштейну, в гравитационном поле идут чуть медленнее. Ныне этот эффект измерен непосредственно несколькими способами. Световые и радиосигналы действительно изгибаются вблизи Солнца и слегка запаздывают для наблюдателя, движущегося им навстречу. Эти эффекты, предсказанные изначально общей теорией относительности, на сегодняшний день подтверждены опытом. Движение космических зондов и планет требуют небольших поправок к ньютоновским орбитам, как это следует из теории Эйнштейна — эти поправки сегодня также проверены опытным путем. (В частности, аномалия в движении планеты Меркурия, известная как «смещение перигелия», беспокоившая астрономов с 1859 года, была объяснена Эйнштейном в 1915 году.) Возможно, наиболее впечатляющим из всего следует считать серию наблюдений над системой, называемой двойным пульсаром, которая состоит из двух небольших массивных звезд (возможно, двух «нейтронных звезд», см. гл.7 «Черные дыры»). Эта серия наблюдений очень хорошо согласуется с теорией Эйнштейна и служит прямой проверкой эффекта, полностью отсутствующего в теории Ньютона, — испускания гравитационных волн. (Гравитационная волна представляет собой аналог электромагнитной волны и распространяется со скоростью света с.) Не существует проверенных наблюдений, которые противоречили бы общей теории относительности Эйнштейна. При всей своей странности (на первый взгляд), теория Эйнштейна работает и по сей день!
Рис. 5.31. Сигнал, который распространяется для наблюдателя W быстрее света, для наблюдается U распространяется назад по времени. Ситуация справа (б) представляет собой ту же ситуацию, что и слева (a), только перерисованную с точки зрения наблюдателя U. (Эту перерисовку можно рассматривать как движение Пуанкаре. Сравните с рис. 5.21 — но здесь преобразование от (a) к (б) следует понимать в активном, а не в пассивном смысле.)Предположим, что сконструировано некоторое устройство, способное посылать сигнал со скоростью немного больше скорости света. Пользуясь этим устройством, наблюдатель W посылает сигнал из точки А на своей мировой линии к далекой точке В, расположенной непосредственно под световым конусом события А. На рис. 5.31a эта ситуация изображена с точки зрения наблюдателя W, но на рис. 5.31б картина нарисована уже по-другому, с точки зрения второго наблюдателя U, который быстро движется от W (из точки, например, между А и В) — и наблюдателю U событие В кажется происходящим раньше события А! (Такая «перерисовка» есть не что иное, как движение Пуанкаре, как описано выше, см. «Специальная теория относительности Эйнштейна и Пуанкаре») С точки зрения наблюдателя W одновременные пространства наблюдателя U представляются «наклоненными». Поэтому событие В кажется наблюдателю U происходящим раньше события А. Таким образом, для U сигнал, испущенный наблюдателем W, будет распространяться назад во времени! Здесь пока еще нет явного противоречия. Но, учитывая симметричность картины с точки зрения наблюдателя U (в силу принципа специальной относительности), третий наблюдатель V, движущийся от наблюдателя U в сторону, противоположную той, в которую движется наблюдатель W, и оснащенный таким же, как и у наблюдателя W, устройством, мог бы в свою очередь послать сигнал, распространяющийся быстрее света с его (наблюдателя V) точки зрения, в направлении, противоположном направлению сигнала, испущенного наблюдателем W. Наблюдателю U при этом будет казаться, что сигнал, испущенный наблюдателем V, тоже движется назад во времени — но в противоположном (пространственном) направлении. Действительно, наблюдатель V мог бы послать второй сигнал к наблюдателю W в момент (В) получения исходного сигнала, пришедшего от наблюдателя W. Этот сигнал достигает наблюдателя W в тот момент, когда происходит событие С, которое (по оценке наблюдателя U) предшествует испусканию исходного сигнала (событию А) (рис. 5.32).
Рис. 5.32. Если у наблюдателя V имеется сверхсветовое сигнальное устройство, тождественное устройству, имеющемуся у W, но посылающее сигналы в противоположном направлении, то наблюдатель W может им воспользоваться для того, чтобы отправить послание в свое собственное прошлое!Но еще хуже то, что событие С действительно происходит раньше события А (испускания исходного сигнала) на собственной мировой линии наблюдателя W, поэтому W действительно воспринимает событие С как происходящее до того, как он испускает сигнал (события А)! Сигнал, отправляемый наблюдателем V обратно наблюдателю W, мог бы, по предварительной договоренности с W, просто повторять сигнал, полученный наблюдателем W в точке В. Таким образом, W получает в более ранний момент времени на своей мировой линии тот же самый сигнал, который он сам собирается послать позднее! Разнося двух наблюдателей достаточно далеко друг от друга, можно устроить все так, что ответный сигнал будет опережать исходный на сколь угодно большое время. Возможно, наблюдатель W своим исходным сигналом сообщал о том, что он сломал ногу. Тогда ответный сигнал он мог бы получить задолго до того, как с ним произошло это печальное происшествие, и тогда (предположительно) он мог бы предпринять необходимые меры предосторожности и избежать несчастного случая! Таким образом, распространение сигналов со сверхсветовыми скоростями вместе с эйнштейновским принципом относительности приводит к вопиющему противоречию с нашим нормальным пониманием «свободы воли». В действительности, ситуация еще более серьезна, чем до сих пор представлялось. Ибо мы могли бы сделать «наблюдателя W» всего лишь механическим устройством, запрограммированным так, чтобы посылать в ответ тот же сигнал, который был им получен (т. е. отвечать на «НЕТ» — «НЕТ» и на «ДА» — «ДА»). Это приводит к такому же принципиальному противоречию, как то, с которым нам уже приходилось сталкиваться прежде[133]. Причем кажется, что на этот раз оно не зависит от наличия у наблюдателя W «свободы воли». Это свидетельствует о том, что на устройство, способное испускать сверхсветовые сигналы, не стоит «делать ставку» как на физически возможное. В дальнейшем это обстоятельство еще приведет нас с вами к удивительным выводам (глава 6, «„Парадокс“ Эйнштейна, Подольского и Розена»). Исходя из вышесказанного, давайте примем, что сигналы любого рода — а не только переносимые обычными физическими частицами — должны быть ограничены световыми конусами. Действительно, то, о чем мы только что говорили, опирается на идеи специальной теории относительности — но и в общей теории относительности правила СТО (локально) остаются в силе. Именно локальная выполнимость положений специальной теории относительности позволяет утверждать, что все сигналы остаются в пределах световых конусов, поэтому то же самое должно выполнятся и в общей теории относительности. Далее мы посмотрим, как это отражается на вопросах детерминизма в рамках этих теорий. Напомним, что в ньютоновской (или гамильтоновой и т. д.) схеме «детерминизм» — это возможность однозначного определения поведения системы в любой момент времени при условии, что заданы начальные условия. Если мы будем смотреть на ньютоновскую теорию с точки зрения пространства-времени, то «конкретное время», когда мы задаем эти начальные условия, будет представлено некоторым трехмерным «слоем» в четырехмерном пространстве-времени (т. е. будет всем пространством в этот момент времени). В теории относительности не существует одного глобального понятия «времени», которое можно было бы выделить для этой цели. Обычный подход предполагает гибкое отношение к этому вопросу. Годится любое «время». В специальной теории относительности вместо упоминавшегося выше «слоя» можно взять одновременное пространство какого-нибудь наблюдателя и задать на нем начальные данные. Но в общей теории относительности понятие «одновременного пространства» достаточно размыто. Вместо него можно воспользоваться более общим понятием пространственно-подобной поверхности[134]. Такая поверхность изображена на рис. 5.33; она характеризуется тем, что в каждой из своих точек она лежит целиком вне светового конуса — так, что локально она напоминает одновременное пространство.
Рис. 5.33. Пространственно-подобная поверхность для задания начальных условий в общей теории относительностиДетерминизм в СТО можно сформулировать так: начальные данные на любом заданном одновременном пространстве S определяют поведение системы во всем пространстве-времени. (В частности, это верно для теории Максвелла, которая действительно является «специально релятивистской» теорией.) Однако можно высказать и более сильное утверждение. Если мы хотим знать, что произойдет в некоторой точке Р, лежащей где-то в будущем по отношению к пространству S, то для этого нам необходимы начальные данные не на всем S, а только в некоторой ограниченной (конечной) области пространства S — потому, что «информация» не может распространяться быстрее света, так что любые точки пространства S, лежащие слишком далеко для того, чтобы световые сигналы из них могли достигать Р, не оказывают на Р никакого влияния (рис. 5.34)[135].
Рис. 5.34. В специальной теории относительности то, что происходит в точке Р, зависит только от данных, заданных в конечной области одновременного пространства. Так происходит потому, что никакое воздействие не может достичь точки Р быстрее светаЭто гораздо более удовлетворительный результат по сравнению с той ситуацией, которая возникает в ньютоновском случае, где в принципе потребовалось бы иметь информацию о всем бесконечном «слое», для того, чтобы иметь возможность предсказать ближайшее будущее хотя бы для одной точки. На скорость, с которой может распространяться ньютоновская информация, не существует никаких ограничений, и действие ньютоновских сил поэтому распространяется мгновенно. «Детерминизм» в общей теории относительности — вопрос гораздо более сложный, чем в СТО, и я ограничусь здесь лишь несколькими замечаниями. Прежде всего, для задания начальных условий нам необходимо воспользоваться пространственноподобной поверхностью S (а не просто одновременной поверхностью). Тогда оказывается, что уравнение Эйнштейна задают локально детерминистское поведение гравитационного поля в предположении (как обычно), что поля материи, дающие вклад в тензор ЭНЕРГИЯ, ведут себя детерминистским образом. Однако здесь возникают значительные осложнения. Сама геометрия пространства-времени (включая ее «причинную» структуру — расположение световых конусов) теперь становится частью того, что требуется определить. Априори расположение световых конусов нам не известно, так что мы не можем сказать, какие части поверхности S необходимы для однозначного определения поведения системы в некотором будущем событии Р. Но могут сложиться такие экстремальные ситуации, когда всех точек поверхности S для этого окажется недостаточно, и, соответственно, глобальный детерминизм будет утрачен! (Здесь затрагиваются непростые вопросы, имеющие отношение к одной важной нерешенной пока проблеме в общей теории относительности, которая известна под названием «космической цензуры» и связана с образованием черных дыр (Типлер и др. [1980]); см. главу 7, подгл. «Черные дыры») Маловероятно, чтобы любое подобное «крушение детерминизма», обусловленное «экстремальными» гравитационными полями, имело непосредственное отношение к тому, что происходит на «человеческих» масштабах — но тем не менее это недвусмысленно указывает на отсутствие ясности в вопросе о детерминизме в рамках общей теории относительности.
Рис. 5.36. «Массивный» π°-мезон распадается на два безмассовых фотона. Пространственно-временна́я картина показывает, как сохраняется 4-вектор энергии-импульса: 4-вектор π°-мезона есть сумма 4-векторов двух фотонов, получаемая по правилу параллелограмма (на рисунке этот параллелограмм покрыт точками)Для наблюдателя, покоящегося относительно π°-мезона, каждый фотон уносит половину энергии и, в действительности, половину массы π°-мезона. Однако, «масса» фотона носит несколько призрачный характер, ибо это — чистая энергия. Если бы мы получили возможность быстро двигаться в направлении одного из фотонов, то смогли бы уменьшить его массу до сколь угодно малой величины — поскольку собственная масса (или масса покоя — с этим понятием мы вскоре познакомимся) фотона равна нулю. Все сказанное вместе образует непротиворечивую картину сохраняющейся массы, но эта картина сильно отличается о той, которой мы располагали раньше. Масса может, как и прежде, служить в некотором смысле мерой «количества материи» — но наша точка зрения теперь кардинально изменилась: так как масса эквивалентна энергии, то масса системы, как и ее энергия, зависит от движения наблюдателя! Сейчас нам стоит более четко сформулировать ту точку зрения, к которой мы в итоге пришли. Сохраняющаяся величина, которая исполняет роль массы — это единый объект, известный как четырехвектор энергии-импульса (или, в другой форме записи, 4-вектор энергии-импульса). Его можно условно изобразить в виде стрелки (вектора), исходящей из начала О пространства Минковского и направленной внутрь светового конуса будущего точки О (или, если речь идет о фотоне, — лежащей на поверхности этого конуса, см. рис. 5.35).
Рис. 5.35. 4-вектор энергии-импульсаЭта стрела, направленная в ту же сторону, что и мировая линия объекта, содержит всю информацию о его энергии, массе и импульсе. Таким образом, «t-значение» (или «высота») конца стрелки, измеренная в системе отсчета наблюдателя, описывает массу (или энергию, деленную на с2) объекта, а пространственные компоненты задают импульс (деленный на с). «Длина» этой стрелки в смысле Минковского — это важная величина, известная как масса покоя. Она описывает массу объекта в системе отсчета наблюдателя, покоящегося относительно этого объекта. Можно было бы рассматривать такую величину в качестве хорошей меры «количества материи», входящей в состав указанного объекта. Но подобная величина не аддитивна: если систему разделить на две, то исходная масса покоя не равна сумме масс покоя возникших в результате деления частей. Напомним рассмотренный выше распад π°-мезона. π°-мезон имеет положительную массу покоя, тогда как масса покоя каждого из возникших в результате распада фотонов равна нулю. Но свойство аддитивности выполняется для всей стрелки (четырехвектора), по отношению к которой мы должны выполнять «сложение» векторного типа, как показано на рис. 5.36. Именно вся стрелка служит мерой «количества материи»! Обратимся теперь к электромагнитному полю Максвелла. Мы уже отмечали, что оно переносит энергию. Значит, по соотношению Е = mc2 электромагнитное поле должно тоже иметь массу. Таким образом, и поле Максвелла представляет собой материю! И с этим утверждением теперь придется согласится, коль скоро поле Максвелла тесно связано с силами, удерживающими частицы вместе. Электромагнитные поля внутри любого тела должны вносить существенный вклад[138] в его массу. А как обстоит дело с гравитационным полем Эйнштейна? Во многих отношениях оно напоминает поле Максвелла. Подобно тому, как в теории Максвелла заряженные тела, двигаясь, могут испускать электромагнитные волны, массивные движущиеся тела тоже могут (согласно теории Эйнштейна) порождать гравитационные волны (см. выше «Релятивистская причинность и детерминизм»), которые, как и электромагнитные волны, распространяются со скоростью света, перенося при этом энергию. Однако эта энергия не поддается измерению стандартным способом, т. е. не может быть определена тензором ЭНЕРГИЯ, о котором говорилось выше. Для (чисто) гравитационной волны этот тензор всюду равен нулю! Можно было бы принять точку зрения, согласно которой кривизна пространства-времени (не полностью задаваемая тензором ВЕЙЛЬ) может каким-то образом представлять «количество материи», заключенной в гравитационных волнах. Но оказывается, что гравитационная энергия нелокальна: изучая кривизну пространства-времени только в ограниченных областях, невозможно определить, какова мера гравитационной энергии. Энергия, а следовательно, и масса гравитационного поля ведут себя подобно скользкому угрю, так что их невозможно «привязать» в каком-нибудь четко определенному месту. Тем не менее, к гравитационной энергии следует относиться со всей серьезностью. Она заведомо присутствует, и ее необходимо учитывать для того, чтобы сохранить смысл понятия массы. Существует хорошая (и положительная) мера массы (Бонди [1960] и Сакс [1962]), которая применима к гравитационным волнам — но нелокальность такова, что, как оказывается, эта мера может иногда становиться ненулевой в плоских областях пространства-времени, расположенных между двумя всплесками излучения (совсем как «глаз» урагана), где пространство-время на самом деле полностью лишено кривизны (см. Пенроуз, Риндлер [1986]) (и где, следовательно, оба тензора — ВЕЙЛЬ и РИЧЧИ — равны нулю)! В таких случаях мы, по-видимому, вынуждены придти к заключению, что если эта масса-энергия вообще должна быть локализована, то она с необходимостью должна быть сосредоточена в этом плоском пустом пространстве — области, совершенно свободной от материи или полей любого рода. При таких любопытных обстоятельствах наше «количество материи» либо локализовано там, в самых пустых областях пустого пространства — либо ее вообще нигде нет! Такое заключение кажется чистейшим парадоксом. Но мы знаем, что этот вывод непосредственно вытекает из тех сведений о природе «реальной» материи нашего мира, которые дают наши лучшие классические теории (а это действительно превосходные теории!). Согласно классической теории — не говоря уже о квантовой, к изучению которой мы скоро приступим — материальная реальность оказывается субстанцией гораздо более расплывчатой, чем казалось прежде. Задача ее количественного измерения — и даже само ее существование — связана только локально! Если такая нелокальность с необходимостью учета чрезвычайно тон — кажется вам загадочной — приготовьтесь к еще более сильным потрясениям!
Рис. 6.2. Расхождение между интенсивностью излучения нагретого тела («абсолютно черного тела»), вычисленной в рамках классической теории, и наблюдаемой интенсивностью привели Планка к началам квантовой теорииОдним из проявлений такой нестабильности системы полей и частиц стало явление, известное как «излучение абсолютно черного тела». Представьте себе объект, нагретый до определенной температуры, в котором электромагнитное излучение находится в тепловом равновесии с частицами. В 1900 году Рэлей и Джинс теоретически показали, что в этом случае вся энергия частиц должна быть без остатка «высосана» полем! Этот физически абсурдный результат получил название «ультрафиолетовой катастрофы», когда энергия безостановочно перетекает во все более и более высокочастотные колебания поля, в то время как в действительности природа никогда не ведет себя столь расточительно. Наблюдения показали, что энергия низкочастотных колебаний поля действительно соответствует предсказанию Рэлея и Джинса, но в высокочастотной части спектра (где ими была предсказана «ультрафиолетовая катастрофа») она не возрастает бесконечно, а спадает до нуля. Максимальное значение энергии при данной температуре приходится на определенную частоту или цвет (см. рис. 6.2). Хорошо знакомыми примерами этого могут служить красный цвет нагретой кочерги или желтобелый цвет раскаленного Солнца.
Рис. 6.1. Атомы нагретого вещества испускают свет, который обычно имеет лишь очень определенные частоты. С помощью призмы различные частоты можно разделить и получить характерные для атомов спектральные линии
Рис. 6.З. Эксперимент с двумя щелями и монохроматическим светом (Обозначения на рисунке: S (англ. sourse) — источник, t (англ. top) — верхняя [щель], b (англ. bottom) — нижняя [щель]. — Прим. ред.)Для большей конкретности выберем свет и условимся называть квант света «фотоном» согласно принятой терминологии. Наиболее очевидное проявление света как потока частиц (фотонов) наблюдается на экране. Свет достигает экрана в виде дискретных точечных порций энергии, которые всегда связаны с частотой света формулой Планка: Е = hv. Энергия никогда не передается в виде «половинки» (или иной доли) фотона. Регистрация фотонов представляет собой явление типа «все или ничего». Всегда наблюдается только целое число фотонов. Но при прохождении через две щели фотоны обнаруживают волновое поведение. Предположим, что сначала открыта только одна щель (а вторая — наглухо закрыта). Пройдя через эту щель, пучок света «рассеивается» (это явление называется дифракцией и является характерным для распространения волн). Пока еще можно придерживаться корпускулярной точки зрения и считать, что расширение пучка обусловлено влиянием краев щели, заставляющем фотоны отклоняться на случайную величину в обе стороны. Когда свет, проходящий через щель, обладает достаточной интенсивностью (число фотонов велико), то освещенность экрана кажется равномерной. Но если интенсивность света уменьшить, то можно с уверенностью утверждать, что освещенность экрана распадется на отдельные пятна — в согласии с корпускулярной теорией. Яркие пятна располагаются там, где отдельные фотоны достигают экрана. Кажущееся равномерным распределение освещенности представляет собой статистический эффект, обусловленный очень большим числом участвующих в явлении фотонов (рис. 6.4).
Рис. 6.4. Картина распределения интенсивности на экране, когда открыта только одна щель: наблюдается распределение дискретных крохотных пятнышек(Для сравнения, 60-ваттная электрическая лампа излучает около 100 000 000 000 000 000 000 фотонов в секунду!) При прохождении через щель фотоны действительно отклоняются случайным образом. Причем отклонения на различные углы имеют различные вероятности, что и порождает наблюдаемое распределение освещенности на экране. Но главная трудность для корпускулярной картины возникает, когда мы открываем вторую щель! Предположим, что свет излучается желтой натриевой лампой, это значит, что он имеет чистый цвет без примеси, или, если воспользоваться физическим термином, свет монохроматический, т. е. имеет одну определенную частоту, или, на языке корпускулярной картины, все фотоны имеют одну и ту же энергию. Длина волны в данном случае составляет около 5 х 10-7 м. Предположим, что щели имеют в ширину около 0,001 мм и отстоят друг от друга на расстояние около 0,15 мм, а экран находится от них на расстоянии около 1 м. При достаточно большой интенсивности света распределение освещенности все еще выглядит равномерным, но теперь в нем имеется некое подобие волнообразности, называемое интерференционной картиной — на экране примерно в 3 мм от центра наблюдаются полосы (рис. 6.5).
Рис. 6.5. Картина распределения интенсивности, когда открыты обе щели: наблюдается волнообразное распределение дискретных пятнышекОткрывая вторую щель, мы надеялись увидеть вдвое бо́льшую освещенность экрана (и это, действительно, было бы верно, если рассматривать полную освещенность экрана). Но оказалось, что теперь детальная картина освещенности полностью отлична от той, которая имела место при одной открытой щели. В тех точках экрана, где освещенность максимальна, его интенсивность оказывается не в два, а в четыре раза больше той, что была прежде. В других же точках, где освещенность минимальна, — интенсивность падает до нуля. Точки с нулевой интенсивностью, возможно, и представляют наибольшую загадку для корпускулярной точки зрения. Это те точки, которых фотон мог бы благополучно достичь, если бы открыта была только одна щель. Теперь же, когда мы открыли и вторую щель, неожиданно оказалось, что нечто помешало фотону попасть туда, куда он мог бы попасть прежде. Как могло случиться, что, предоставив фотону альтернативный маршрут, мы в действительности воспрепятствовали его прохождению по любому из маршрутов? Если в качестве «размера» фотона принять длину его волны, то в масштабе фотона вторая щель находится от первой на расстоянии около 300 «размеров фотона» (а ширина каждой щели составляет около двух длин волн фотона) (рис. 6.6).
Рис. 6.6. Щели «с точки зрения» фотона! Разве может быть важно фотону, открыта или закрыта вторая щель, находящаяся на расстоянии около 300 «размеров фотона»?Каким образом фотон, проходя через одну из щелей, «узнает» о том, открыта или закрыта другая щель? На самом деле, в принципе не существует предела для расстояния, на которое могут быть разнесены щели, для того, чтобы произошло явление «гашения или усиления». Создается впечатление, что когда свет проходит через одну или две щели, он ведет себя как волна, а не как корпускула (частица)! Такое гашение — деструктивная интерференция — хорошо известное свойство обычных волн. Если каждый из двух маршрутов порознь может быть пройден волной, то когда для нее открыты оба маршрута, может оказаться, что они взаимно погасят друг друга. На рис. 6.7 показано, как это происходит.
Рис. 6.7. Чисто волновая картина позволяет нам осмыслить распределение светлых и темных полос на экране (но не дискретность) на языке интерференции волнКогда какая-то часть волны, пройдя через одну из щелей, встречает часть волны, прошедшую через другую щель, то они усиливают друг друга, если находятся «в фазе» (т. е. если встречаются два гребня или две впадины), или гасят друг друга, если они находятся «в противофазе» (т. е. гребень одной части встречается с впадиной другой). В эксперименте с двумя щелями яркие места на экране возникают там, где расстояния до щелей отличаются на целое число длин волн так, что гребни приходятся на гребни, а впадины — на впадины, а темные места возникают там, где разность этих расстояний равна полуцелому числу длин волн так, что гребни встречаются с впадинами, а впадины — с гребнями. Нет ничего загадочного в поведении обычной макроскопической классической волны, проходящей одновременно через две щели. Волна в конечном счете представляет собой всего лишь «возмущение» либо некоторой непрерывной среды (поля), либо некоторого вещества, состоящего из мириад крохотных точечных частиц. Возмущение может частично пройти через одну щель, частично через другую щель. Но в корпускулярной картине ситуация иная: каждый отдельный фотон сам по себе ведет себя, как волна! В некотором смысле каждая частица проходит сразу через обе щели и интерферирует сама с собой! Ибо, если значительно уменьшить полную интенсивность света, то можно гарантировать, что вблизи щелей будет находиться не более одного фотона одновременно. Явление деструктивной интерференции, когда два альтернативных маршрута каким-то образом «ухитряются» исключить друг друга из числа реализованных возможностей, есть нечто, применимое к одному фотону. Если для фотона открыт только один из двух маршрутов, то фотон может пройти по нему. Если открыт другой маршрут, то фотон может пройти второй вместо первого маршрута. Но если перед фотоном открыты оба маршрута, то эти две возможности чудесным образом исключают друг друга, и оказывается, что фотон не может пройти ни по одному из маршрутов! Настоятельно советую читателю остановиться и вдуматься в смысл этого необычного факта. Дело не в том, что свет ведет себя в одних случаях как волны, а в других как частицы. Каждая частица в отдельности сама по себе ведет себя, как волна; и различные альтернативные возможности, открывающиеся перед частицей, иногда могут полностью уничтожать друг друга! Действительно ли фотон расщепляется на два и частично проходит через одну щель, а частично — через другую? Большинство физиков будут возражать против такой постановки вопроса. По их мнению оба маршрута, открытых перед частицей, должны вносить вклад в конечный результат, они — всего лишь дополнительные способы движения, и не следует думать, будто частица должна расщепиться на две, чтобы пройти через щели. В подтверждение той точки зрения, что частица не проходит частично через одну щель и частично — через другую, можно рассмотреть видоизмененную ситуацию, в которой около одной из щелей помещен детектор частиц. В этом случае фотон (или любая другая частица) всегда появляется как единое целое, а не как некоторая доля целого: ведь наш детектор регистрирует либо целый фотон, либо полное отсутствие фотонов. Однако, если детектор расположен достаточно близко к одной из щелей, чтобы наблюдатель мог различить, через какую из них прошел фотон, то интерференционная картина на экране исчезает. Для того, чтобы имела место интерференция, по-видимому, необходимо «отсутствие знания» относительно того, через какую из щелей «действительно» прошла частица. Чтобы получить интерференцию, обе альтернативы должны дать свой вклад, иногда «суммируясь», усиливая друг друга в два раза больше, чем можно было бы ожидать, а иногда «вычитаясь», чтобы загадочным образом погасить друг друга. Фактически же согласно правилам квантовой механики в действительности происходит нечто еще более загадочное! Конечно, альтернативы могут суммироваться (самые яркие точки на экране), альтернативы могут вычитаться (темные точки), но они также могут образовывать и такие странные комбинации, как: альтернатива А + i х альтернатива В, где i — «квадратный корень из минус единицы» (i = √-1), с которым мы уже встречались в главе 3 (в точках на экране с промежуточной интенсивностью освещенности). В сущности любое комплексное число может играть роль коэффициента в «комбинации альтернатив»! Возможно, читатель уже вспомнил высказанное мной в главе 3 предупреждение о том, что комплексные числа играют «абсолютно фундаментальную роль в структуре квантовой механики». Комплексные числа — не просто математические диковинки. Физиков вынудили обратить на них внимание убедительные и неожиданные экспериментальные факты. Чтобы понять квантовую механику, мы должны поближе познакомиться с языком комплекснозначных весовых коэффициентов. Давайте же рассмотрим, к каким это приводит последствиям.
Рис. 6.8. Амплитуда вероятности представлена как точка z внутри единичной окружности на плоскости Аргана. Квадрат расстояния |z|2 от центра может стать действительной вероятностью, если эффекты увеличены до классического уровняОднако иногда возникает необходимость рассматривать комбинации ω х альтернатива А + z х альтернатива В, где ω и z — всего лишь пропорциональны амплитудам вероятностей и поэтому не должны лежать внутри единичной окружности. Условие их нормированности (и, следовательно, того, что они дают настоящие амплитуды вероятностей) заключается в том, что сумма квадратов их модулей должна быть равна единице: |ω|2 + |z|2 = 1. Если числа ω и z не удовлетворяют этому условию нормировки, то настоящими амплитудами вероятностей альтернатив А и В, соответственно, служат величины которые лежат внутри единичной окружности. Теперь мы видим, что амплитуда вероятности в конечном счете представляет собой аналог не настоящей вероятности, а скорее «комплексного квадратного корня» из вероятности. Что происходит с ней, когда эффекты квантового уровня увеличиваются настолько, что достигают классического уровня? Напомним, что, манипулируя с вероятностями и амплитудами, мы иногда сталкивались с необходимостью производить их умножение и сложение. Прежде всего заметим, что операция умножения не сопряжена с какими-либо проблемами при переходе от квантовых правил к классическим. Происходит это вследствие замечательного математического факта: квадрат модуля произведения двух комплексных чисел равен произведению квадратов модулей каждого из чисел: |zω|2 = |z|2 |ω|2. (Это свойство непосредственно следует из геометрического смысла произведения двух комплексных чисел, приведенного в главе 3, но на языке действительной и мнимой частей z = х + iу, ω = u+iv; это — прекрасное маленькое чудо. Проверьте сами!) Из этого факта следует, что если в эксперименте с двумя щелями для частицы существует только один маршрут (открыта только одна щель, например t), то рассуждения можно строить «классически», и вероятности получатся одними и теми же, независимо от того, наблюдаем ли мы за прохождением частицы в промежуточных точках ее пути (в щели t)[142]. А квадраты модулей можно будет взять на любой стадии наших вычислений, например, |A(s, t)|2 х |A(t, p)|2 = |A(s,t) х A(t,p)|2. Ответ — результирующая вероятность — получится одним и тем же. Но если перед частицей открыт более чем один маршрут (например, если открыты обе щели), то необходимо образовывать сумму, и здесь-то и начинают обнаруживаться характерные особенности квантовой механики. Когда мы образуем квадрат модуля суммы ω + z двух комплексных чисел ω и z, мы обычно не получаем только лишь сумму квадратов модулей этих чисел; существует дополнительный «поправочный член»: |ω + z|2 = |ω|2 + |z|2 + 2|ω||z| cosθ, где θ — угол, образуемый направлениями на точки z и ω из начала координат на плоскости Аргана (рис. 6.9). (Напомним, что косинус угла есть отношение «прилежащий к углу катет/гипотенуза» для прямоугольного треугольника. Пытливый читатель, незнакомый с этой формулой, может попытаться самостоятельно вывести ее, используя геометрию, изложенную в главе 3. В сущности эта формула есть не что иное, как слегка «замаскированное» хорошо известное «правило косинуса»!) Именно поправочный член 2|ω||z|cosθ описывает квантовую интерференцию между квантовомеханическими альтернативами. Значение cosθ заключено между -1 и 1. При θ =0° мы имеем cosθ =1, и две альтернативы усиливают друг друга так, что полная вероятность оказывается больше суммы отдельных вероятностей. При θ = 180° мы имеем cosθ = -1, и две альтернативы стремятся погасить друг друга, в результате чего полная вероятность оказывается меньше суммы отдельных вероятностей (деструктивная интерференция). При θ = 90° мы имеем cosθ =0, и получается ситуация, промежуточная между двумя упомянутыми выше: две вероятности просто суммируются. Для больших или сложных систем поправочные члены обычно «усредняются», так как «среднее» значение cosθ равно нулю, и мы получаем обычные правила классической вероятности! Но на квантовом уровне эти члены описывают важные интерференционные эффекты. Рассмотрим эксперимент с двумя щелями, когда обе щели открыты. Амплитуда того, что фотон достигает точки р, равна сумме ω + z, где ω = A(s, t) x A(t,p) и z = A(s, b) x A(b, p). В самых ярких точках экрана имеем: ω = z (так что cosθ = 1), откуда |ω + z|2 = |2ω|2 = 4 |ω|2, что в 4 раза больше вероятности |ω|2, когда открыта только верхняя щель, и приводит к увеличению интенсивности потока большого числа фотонов в 4 раза, в полном согласии с экспериментом. В темных точках экрана имеем ω = — z (так что cosθ = -1), откуда |ω + z|2 = |ω — ω|2 = 0, т. е. интенсивность равна нулю (деструктивная интерференция!) также в соответствии с наблюдением. Точно посередине между этими точками мы имеем: ω = iz или ω = — iz (так что cosθ =0), откуда |ω + z|2 — |ω ± iω|2 = |ω|2 + |ω|2 = 2|ω|2, что дает вдвое бо́льшую интенсивность освещенности по сравнению с освещенностью только при одной щели (как в случае с классическими частицами). В конце следующего раздела мы узнаем, как рассчитывать, где именно расположены яркие, темные точки и точки с промежуточной интенсивностью освещенности. И в заключение одно замечание. Когда открыты обе щели, амплитуда того, что частица достигнет точки р через щель t, в самом деле равна ω = A(s, t) х A(t, p), но мы не можем интерпретировать квадрат ее модуля |ω|2 как вероятность того, что частица «действительно» прошла через верхнюю щель, чтобы достигнуть точки р. Такая интерпретация привела бы нас к бессмысленным ответам, в особенности, если точка р находится в темном месте на экране. Но если мы захотим «зарегистрировать» присутствие фотона в щели t, то усиливая эффект его присутствия (или отсутствия) там до классического уровня, мы можем использовать величину |A(s, t)|2 в качестве вероятности того, что фотон действительно присутствует в щели t. Но такое наблюдение нарушило бы картину распределения волн. Для того, чтобы произошла интерференция, нам необходимо убедиться в том, что прохождение фотона через щели остается на квантовом уровне, так чтобы оба альтернативных маршрута давали свой вклад и иногда могли гасить друг друга. На квантовом уровне отдельные альтернативные маршруты обладают только амплитудами, но не вероятностями.
Рис. 6.10.а) График действительной функции действительной переменной хНо в данном случае для изображения значения комплексной функции ψ нам требуется «комплексная ось у» — плоскость Аргана. Для этой цели вообразим, что мы можем использовать два других пространственных измерения: например, у-направление в качестве действительной оси плоскости Аргана, а z-направление — как мнимую ось. Для получения правильной картины волновой функции мы можем изобразить ψ (х) (значение функции в точке х) точкой на этой плоскости Аргана (т. е. на плоскости yz, проходящей через каждую точку оси х). Когда положение точки х изменяется, то изменяется также и положение точки на плоскости Аргана. При этом точка описывает некоторую кривую в пространстве, извивающуюся вокруг оси х (рис. 6.10 b).
Рис. 6.10.б) график комплексной функции V действительной переменной хНазовем эту кривую ψ — кривой рассматриваемой частицы. Если бы мы поместили в некоторой точке х детектор, то вероятность обнаружить частицу в данной точке можно найти, вычислив квадрат модуля амплитуды ψ(х), т. е. |ψ(x)|2 равный квадрату расстояния ψ-кривой от оси x[143]. Чтобы изобразить подобным образом волновую функцию, определенную на всем трехмерном физическом пространстве, понадобилось бы пять измерений: три — для физического пространства и два — для плоскости Аргана в каждой точке, в которой мы строим график функции ψ(х). Однако наша упрощенная картина еще нам пригодится. Если мы захотим изучить поведение волновой функции вдоль произвольного направления в физическом пространстве, то для этого необходимо просто выбрать ось х вдоль этой линии, а два других пространственных измерения временно использовать в качестве действительной и мнимой осей на плоскости Аргана. Этот способ поможет нашему осмыслению эксперимента с двумя щелями. Как я упоминал выше, в классической физике для того, чтобы определить, что будет происходить дальше, необходимо знать скорость (или импульс) частицы. В квантовой механике нам представляется значительная экономия. Волновая функция ψ уже содержит различные амплитуды для различных возможных импульсов! (Кое-кто из недовольных читателей может возразить, что «самое время» говорить об экономии, если принять во внимание, как сильно нам пришлось усложнить простую классическую картину точечной частицы. Хотя я во многом согласен с таким читателем, я все же советую не отвергать те лакомые кусочки, которые ему преподносят, ибо худшее еще впереди!) Каким образом амплитуды скоростей определяются волновой функцией ψ? На самом же деле лучше думать в терминах амплитуд импульсов. (Напомним, что импульс, или количество движения, равен скорости, умноженной на массу частицы, см. гл.6 «Уравнение Шредингера; уравнение Дирака») Для этого следует применить к волновой функции ψ так называемый гармонический анализ. Подробно объяснять здесь, что это такое, было бы неуместно, скажу только, что он тесно связан с тем, что происходит с музыкальными звуками. Волну любой формы можно разложить в сумму различных «гармоник» (отсюда и термин «гармонический анализ»), которые представляют собой чистые тона различной высоты (т. е. с различными частотами). В случае волновой функции ψ «чистые тона» соответствуют различным возможным значениям импульса, которые может иметь частица, а величина вклада каждого «чистого тона» в ψ определяет амплитуду соответствующего значения импульса. Сами «чистые тона» называются импульсными состояниями. Как выглядит импульсное состояние, представленное ψ — функцией? Оно похоже на кривую, напоминающую по форме штопор, официальное математическое название которой — винтовая линия (рис. 6.11)[144].
Рис. 6.11. Импульсное состояние имеет ψ-кривую в форме штопораШтопоры с частыми витками соответствуют большим импульсам, а штопоры, которые едва вращаются, — очень малым импульсам. Существует предельный случай, когда ψ-кривая вообще не делает витков и вырождается в прямую в случае нулевого импульса. В поведении винтовой линии неявно скрыто знаменитое соотношение Планка. Так как энергия Е всегда пропорциональна частоте v (Е = hv), то частые витки означают короткую длину волны, большую частоту и, следовательно, большой импульс и высокую энергию, а редкие витки означают малую частоту и низкую энергию. Если плоскости Аргана ориентированы обычным способом (т. е. когда оси х, у, z образуют, как описано выше, правую тройку), то импульсы, направленные в положительном направлении оси х, соответствуют правым штопорам (которые обычно и используются). Иногда квантовые состояния полезно описывать не в терминах обычных волновых функций, как это было сделано выше, а в терминах волновых функций импульсов. Это сводится к рассмотрению разложения волновой функции ψ по различным импульсным состояниям и построению новой функции ψ′, зависящей на этот раз не от положения х, а от импульса р; значение ψ′(p) при любом р задает величину вклада состояния с импульсом р в ψ-функцию. (Пространство величин р называется импульсным пространством.) Смысл ψ′ состоит в том, что при каждом конкретном выборе р комплексное число ψ′(р) задает амплитуду того, что частица имеет импульс р. Существует математическое название для соотношения между функциями ψ и ψ′. Каждая из этих функций называется преобразованием Фурье другой — в честь французского инженера и математика Жозефа Фурье (1768–1830). Я ограничусь здесь лишь несколькими замечаниями по поводу преобразования Фурье. Первое замечание: между ψ и ψ′ существует замечательная симметрия. Чтобы перейти от ψ назад к ψ′, мы по существу прибегаем к той же процедуре, которую использовали при переходе от ψ к ψ′. Теперь ψ′ становится объектом гармонического анализа. «Чистые тона» (т. е. штопоры в пространстве импульсов) на этот раз называются конфигурационными состояниями. Каждое положение х определяет такой «чистый тон» в пространстве импульсов, а величина такого вклада «чистого тона» в ψ дает значение ψ(x). Конфигурационное состояние соответствует (в терминах обычного пространства) некоторой функции ψ, имеющей острый пик в рассматриваемой точке х, а это значит, что все амплитуды равны нулю, за исключением амплитуды в данной точке. Такая функция называется дельта-функцией (Дирака), хотя, строго говоря, это — не совсем «функция» в обычном смысле, так как ее значение в точке х бесконечно велико. Аналогичным образом импульсные состояния (винтовые линии в конфигурационном пространстве) порождают дельта-функции в пространстве импульсов (рис. 6.12). Таким образом, оказывается, что преобразование Фурье винтовой линии есть дельта-функция и наоборот!
Рис. 6.12. Дельта-функция в конфигурационном пространстве переходит в штопор в импульсном пространстве и наоборотОписание в терминах конфигурационного пространства полезно всякий раз, когда требуется произвести измерение возможного положения частицы в пространстве, которое сводится к увеличению до классического уровня эффектов различных возможных положений частицы. (Грубо говоря, фотоэлементы и фотографические пластинки осуществляют измерение положения фотонов в пространстве.) Описание на языке импульсного пространства полезно, когда требуется измерить импульс частицы, т. е. увеличить до классического уровня эффекты различных возможных импульсов. (Эффекты отдачи или дифракции на кристаллах могут быть использованы для измерений импульса.) В каждом случае квадрат модуля соответствующей волновой функции (ψ или ψ′) дает искомую вероятность результата производимого измерения. В заключение этого раздела обратимся еще раз к эксперименту с двумя щелями. Мы узнали, что согласно квантовой механике даже одна частица сама по себе должна обладать волновым поведением. Такая волна описывается волновой функцией ψ. Более всего похожи на волны волновые функции импульсных состояний. В эксперименте с двумя щелями мы рассматривали фотоны с определенной частотой; так что волновая функция фотона состояла из импульсных состояний различных направлений, в которых расстояние между соседними витками штопора — длина волны — было одно и то же на протяжении всей винтовой линии. (Длина волны определяется частотой.) Волновая функция каждого фотона распространяется первоначально из источника в точке S и (если мы не следим за прохождением фотона через щели) проходит к экрану через обе щели. Однако только небольшая часть волновой функции проходит через щели, поэтому мы можем мысленно рассматривать щели как новые источники, каждый из которых по отдельности испускает волновую функцию. Эти две части волновой функции интерферируют одна с другой так, что когда они доходят до экрана, в одних его точках они суммируются, а в других погашают друг друга. Чтобы выяснить, где волны суммируются и где гасят друг друга, выберем на экране некоторую точку р и рассмотрим прямые, проведенные к точке р от каждой из щелей t u b. Вдоль отрезка tp мы имеем одну винтовую линию, а вдоль отрезка bр — другую винтовую линию. (Мы также имеем винтовые линии вдоль линий st и sb, но если предположить, что источник находится на одном и том же расстоянии от обеих щелей, то на пути к щелям винтовые линии успеют совершить одинаковое число витков.) Число витков, которые винтовые линии совершат к тому моменту, когда они достигнут экран в точке р, зависит от длины отрезков tp и bр. Если эти длины отличаются на целое число длин волн, то в точке р винтовые линии окажутся совмещенными в одном направлении относительно своих осей (т. е. θ = 0°, где θ определено в предыдущем разделе), так что соответствующие амплитуды сложатся и дадут яркое пятно. Если же эти линии отличаются по длине на целое число длин волн плюс половина длины волны, то в точке р винтовые линии окажутся совмещенными в противоположных направлениях относительно своих осей (θ = 180°), поэтому соответствующие амплитуды погасят друг друга, и мы получим темное пятно. Во всех остальных случаях между смещениями винтовых линий в точке р образуется некоторый угол, поэтому соответствующие амплитуды будут суммироваться некоторым промежуточным образом, и мы получим пятно с промежуточной интенсивностью освещенности (рис. 6.13).
Рис. 6.13. Анализ эксперимента с двумя щелями в терминах штопорообразного представления импульсных состояний фотона
Рис. 6.14. Волновые пакеты, локализованные как в конфигурационном пространстве, так и в импульсном пространствеОбратите внимание на то, что расстояние от каждой из кривых до оси существенно отлично от нуля лишь в весьма малой области. Вдали от этой области кривые очень плотно прижимаются к оси. Это означает, что квадраты модуля заметно отличны от нуля только в очень ограниченной области как в конфигурационном пространстве, так и в импульсном пространстве. В этом случае частица может быть локализована в пространстве, хотя соответствующий пик имеет некоторую ширину; аналогичным образом, импульс также достаточно хорошо определен, поэтому частица движется с достаточно хорошо определенной скоростью, а расплывание пика, характеризующего ее положение в пространстве, происходит не слишком быстро. Такое квантовое состояние принято называть волновым пакетом; обычно волновой пакет считается лучшим квантовотеоретическим приближением к классической частице. Однако из-за «размазанности» в значении импульса (т. е. скорости) следует, что волновой пакет со временем расплывается. И чем более он локализован в начальный момент времени в пространстве, тем быстрее он расплывается.
Рис. 6.15. Так как волновая функция фотона возникает от пары щелей, она имеет пики сразу в двух местахВ вертикальном направлении форма волновой функции ψ имела бы два острых пика — по одному на каждой из щелей, являясь суммой[146] волновой функции ψt имеющей пик на верхней щели, и волновой функции ψb, имеющей пик на нижней щели: ψ(x) = ψt(x) + ψb(x). Если мы примем волновую функцию ψ как «реально» представляющую состояния частицы, то нам придется признать, что частица в самом деле находится в двух местах одновременно! С этой точки зрения частица реально прошла сразу через две щели. Стандартное возражение против утверждения о том, что частица реально «проходит сразу через две щели» сводится к следующему: если мы выполним измерение на щелях, чтобы определить, через какую из них прошла частица, то всегда обнаружим, что частица целиком проходит либо через одну, либо через другую щель. Но так происходит потому, что мы производим измерение положения частицы, поэтому ψ в этом случае дает только распределение вероятности |ψ|2 для положения частицы — в соответствии с процедурой, основанной на вычислении квадрата модуля, и мы находим частицу либо в одном, либо в другом месте. Но существуют и другие типы измерений, которые можно производить на щелях, и эти измерения отличны от измерения положения. Для таких измерений нам необходимо было бы знать волновую функцию ψ с двумя пиками, а не только |ψ|2, для различных положений x. При помощи таких измерений мы могли бы отличить состояние с двумя пиками ψ = ψt + ψb приведенное выше, от других состояния с двумя пиками, таких, как ψt — ψb или ψt + iψb (кривые ψ для каждого из этих различных случаев представлены на рис. 6.16). Так как измерения, различающие эти возможности, действительно существуют, они должны исчерпывать все различные возможные «реальные» способы существования фотона!
Рис. 6.16. Три различных способа, как можно получить волновую функцию фотона с двумя пикамиЩели не обязательно должны располагаться поблизости друг от друга для того, чтобы фотон мог пройти сквозь них одновременно. Чтобы понять, каким образом квантовая частица может находиться «в двух местах сразу» независимо от того, как далеко друг от друга расположены эти места, рассмотрим экспериментальную установку, немного отличающуюся от эксперимента с двумя щелями. Как и прежде, у нас имеется лампа, испускающая монохроматический свет, по одному фотону за раз; но вместо того, чтобы пропускать свет через две щели, отразим его от полупосеребренного зеркала, наклоненного к пучку под углом 45°. (Полупосеребренным называется зеркало, отражающее равно половину падающего на него света, тогда как вторая половина проходит прямо сквозь зеркало.) После встречи с зеркалом волновая функция фотона разделяется на две части, одна из которых отражается в сторону, а вторая продолжает распространяться в том же направлении, в котором первоначально двигался фотон. Как и в случае фотона, возникающего из двух щелей, волновая функция имеет два пика, но теперь эти пики разнесены на большее расстояние — один пик описывает отраженный фотон, другой — фотон, прошедший сквозь зеркало (рис. 6.17).
Рис. 6.17. Максимумы волновой функции с двумя пиками могут быть разнесены на расстояние в несколько световых лет. Этого можно достичь с помощью полупосеребренного зеркалаКроме того, со временем расстояние между пиками становится все больше и больше, увеличиваясь беспредельно. Представьте себе, что эти две части волновой функции уходят в пространство, и что мы ждем целый год. Тогда два пика волновой функции фотона окажутся на расстоянии светового года друг от друга. Каким-то образом фотон оказывается сразу в двух местах, разделенных расстоянием более чем в один световой год! Есть ли какое-нибудь основание принимать такую картину всерьез? Разве мы не можем рассматривать фотон просто как некий объект, находящийся с вероятностью 50 % в одном месте, и с вероятностью 50 % — в другом! Нет, это невозможно! Независимо от того, как долго фотон находился в движении, всегда существует возможность того, что две части фотонного пучка могут быть отражены в обратном направлении и встретиться, в результате чего могут возникнуть интерференционные эффекты, которые не могли бы возникнуть из вероятностных весов двух альтернатив. Предположим, что каждая часть фотонного пучка встречает на своем пути полностью посеребренное зеркало, наклоненное под таким углом, чтобы свести обе части вместе, и что в точке встречи двух частей помещено еще одно полупосеребренное зеркало, наклоненное под таким же углом, как и первое зеркало. Пусть на прямых, вдоль которых распространяются части фотонного пучка, расположены два фотоэлемента (рис. 6.18). Что мы обнаружим?
Рис. 6.18. Два пика волновой функции нельзя считать просто вероятностными весами локализации фотона в одном или другом меае. Два маршрута, избираемые фотоном, можно заставить интерферировать друг с другомЕсли бы было справедливо, что фотон следует с вероятностью 50 % по одному маршруту и с вероятностью 50 % — по другому, то мы обнаружили бы, что оба детектора зафиксировали бы фотон каждый с вероятностью 50 %. Однако в действительности происходит нечто иное. Если два альтернативных маршрута в точности равны по длине, то с вероятностью 100 % фотон попадет в детектор А, расположенный на прямой, вдоль которой первоначально двигался фотон, и с вероятностью 0 — в любой другой детектор В. Иными словами фотон с достоверностью попадет в детектор А! (В этом можно убедиться, используя представление в форме винтовых линий, приведенное выше для случая эксперимента с двумя щелями.) Разумеется, такой эксперимент никогда не был поставлен для расстояний порядка светового года, но сформулированный выше результат не вызывает серьезных сомнений (у физиков, придерживающихся традиционной квантовой механики!) Эксперименты такого типа в действительности выполнялись для расстояний порядка многих метров или около того, и результаты оказывались в полном согласии с квантово-механическими предсказаниями (см. Уилер [1983]). Что же теперь можно сказать о реальности существования фотона между первой и последней встречей с полуотражающим зеркалом? Напрашивается неизбежным вывод, согласно которому фотон должен в некотором смысле действительно пройти оба маршрута сразу! Ибо если бы на пути любого из двух маршрута был помещен поглощающий экран, то вероятности попадания фотона в детектор А или В оказались бы одинаковыми! Но если открыты оба маршрута (оба одинаковой длины), то фотон может достичь только А. Блокировка одного из маршрутов позволяет фотону достичь детектора В! Если оба маршрута открыты, то фотон каким-то образом «знает», что попадание в детектор В не разрешается, и поэтому он вынужден следовать сразу по двум маршрутам. Точка зрения Нильса Бора, согласно которой существованию фотона между моментами, когда производятся измерения, нельзя придать объективный «смысл», представляется мне слишком пессимистической относительно реальности состояния фотона. Квантовая механика дает нам волновую функцию для описания «реальности» положения фотона, и между полупосеребренными зеркалами волновая функция фотона как раз описывает состояние с двумя пиками, причем расстояние между пиками иногда бывает весьма значительным. Заметим также, что утверждение «находится сразу в двух определенных местах» не полностью характеризует состояние фотона: нам необходимо отличать состояние ψt + ψb, например, от состояния ψt — ψb (или, например, от состояния ψt + iψb), где ψt и ψb теперь относятся к положениям фотона на каждом из двух маршрутов (соответственно «прошедшем» и «отраженном»!). Именно такого рода различие определяет, достигнет ли фотон с достоверностью детектора А, пройдя до второго полупосеребренного зеркала, либо он с достоверностью достигнет детектора В (или же он попадет в детекторы А и В с некоторой промежуточной вероятностью). Эта загадочная особенность квантовой реальности, состоящая в том, что мы всерьез должны принимать во внимание, что частица может различными способами «находиться в двух местах сразу», проистекает из того, что нам приходится суммировать квантовые состояния, используя комплекснозначные веса для получения других квантовых состояний. Такого рода суперпозиция состояний является общей (и важной) особенностью квантовой механики, известной под названием квантовой линейной суперпозиции. Именно эта особенность квантовой механики позволяет нам образовывать импульсные состояния из конфигурационных состояний и конфигурационные состояния — из импульсных. В этих случаях линейная суперпозиция применяется к бесконечному массиву различных состояний, т. е. ко всем различным конфигурационным состояниям или ко всем различным импульсным состояниям. Но, как мы видели выше, квантовая линейная суперпозиция весьма озадачивает, даже если мы применяем ее всего лишь к двум состояниям. По правилам квантовой механики любые два состояния, сколь бы сильно они ни отличались друг от друга, могут сосуществовать в любой комплексной линейной суперпозиции. Более того, любой объект, состоящий из отдельных частиц, должен обладать способностью существовать в такой суперпозиции пространственно далеко разнесенных состояний и тем самым «находиться в двух местах сразу»! В этом отношении формализм квантовой механики не проводит различия между отдельными частицами и сложными системами, состоящими из многих частиц. Почему же тогда мы не наблюдаем в повседневной жизни макроскопические тела, например, крикетные шары или даже людей, находящиеся в двух совершенно различных местах? Это — глубокий вопрос, и современная квантовая теория по сути дела не дает нам удовлетворительного ответа на него. В случае объекта, сравнимого с крикетным шаром, нам необходимо рассматривать систему на «классическом уровне». Или, как принято обычно говорить, производить «наблюдение» или «измерение» над крикетным шаром. Но в этом случае в качестве вероятностей, описывающих реальные альтернативы, необходимо рассматривать квадраты модулей комплекснозначных амплитуд вероятности, входящие в наши линейные суперпозиции в виде весов. Однако при этом сразу возникает сомнение в правомерности замены подобным способом квантовой U-процедуры на R-процедуру. К этому вопросу мы еще вернемся в дальнейшем.
Рис. 6.19. Сложение и умножение на скаляры векторов в гильбертовом пространстве можно наглядно представить как соответствующие операции для векторов в обычном пространствеОперация умножения вектора на положительное (вещественное) число сводится в таком представлении просто к умножению длины рассматриваемой стрелки на заданное число (направление стрелки при этом остается неизменным). Если же мы умножаем стрелку на отрицательное число, то направление стрелки изменяется на противоположное. Если число, на которое требуется умножить стрелку, равно 0, то мы получаем нулевой вектор 0, который не имеет направления. (Вектор 0 представлен «нулевой стрелкой», имеющей нулевую длину.) Одним из примеров векторной величины может служить сила, действующая на частицу. Другими примерами могут служить классические скорости, ускорения и импульсы. Существуют также 4-векторы импульса, которые мы рассматривали в конце предыдущей главы. Это — векторы не в двумерном и не в трехмерном пространстве, а в четырехмерном. Но для гильбертова пространстванам понадобятся векторы с гораздо большим числом измерений (в действительности, часто даже бесконечномерные, но для нас это обстоятельство сейчас несущественно). Напомним, что мы всегда использовали стрелки, чтобы изобразить векторы в классическом фазовом пространстве, которое могло иметь очень высокую размерность. Говоря об «измерениях» фазового пространства, как и об «измерениях» гильбертова пространства, мы не имеем в виду обычные пространственные направления. Отнюдь! Каждое измерение гильбертова пространства соответствует одному из различных независимых физических состояний квантовой системы. Вследствие эквивалентности между |ψ) и z|ψ), физическое состояние в действительности соответствует целой прямой, проходящей через начало координат 0, (или лучу) в гильбертовом пространстве (описываемом всеми кратными некоторого вектора), а не просто каким-то конкретным вектором, лежащим на этой прямой. Луч состоит из всех возможных кратных некоторого конкретного вектора состояния |ψ). (Следует иметь в виду, что речь идет о комплексных кратных, поэтому прямая в действительности представляет собой комплексную прямую, но об этом пока лучше не беспокоиться!) (См. рис. 6.20.)
Рис. 6.20. Физические квантовые состояния описываются лучами в гильбертовом пространствеСкоро пред нами предстанет весьма изящная картина такого пространства лучей для случая двумерного гильбертова пространства. Другой предельный случай — бесконечномерное гильбертово пространство. Бесконечномерное гильбертово пространство возникает даже в простой ситуации локализации одной частицы. Тогда для каждого возможного положения, которое могла бы занимать частица, существует целое измерение! Каждое положение частицы определяет в гильбертовом пространстве целую «координатную ось», поэтому с учетом бесконечно многих различных положений частицы мы имеем бесконечно много различных независимых направлений (или «измерений») в гильбертовом пространстве. Импульсные состояния также могут быть представлены в том же самом гильбертовом пространстве. Поскольку импульсные состояния представимы в виде комбинаций конфигурационных состояний, то они соответствуют осям, идущим «по диагонали» — наклоненным относительно осей в конфигурационном пространстве. Совокупность всех импульсных состояний дает нам новую систему осей, и переход от осей конфигурационного пространства состояний к осям импульсного пространства состояний сводится к повороту в гильбертовом пространстве. Не следует пытаться наглядно представить себе это сколько-нибудь точно. Такая попытка была бы неразумной! Однако некоторые идеи, почерпнутые из обычной евклидовой геометрии, могут оказаться очень полезными. В частности, рассматриваемые нами оси (либо все оси в конфигурационном пространстве состояний, либо все оси в импульсном пространстве состояний) следует считать взаимно ортогональными, т. е. расположенными под «прямыми» углами друг к другу. «Ортогональность» лучей — понятие, важное для квантовой механики. Ортогональные лучи соответствуют состояниям, которые независимы друг от друга. Различные возможные конфигурационные состояния частицы все взаимноортогональны, как и все различные возможные импульсные состояния. Но конфигурационные состояния не ортогональны импульсным состояниям. Весьма схематично эта ситуация представлена на рис. 6.21.
Рис. 6.21. Конфигурационные состояния и импульсные состояния приводят к различному выбору ортогональных осей в одном и том же гильбертовом пространстве
Рис. 6.22. Величины ортогональных проекций состояния |ψ) на оси |0), |1), |2)…. дают требуемые амплитуды z0, z1, z2 ….Сразу возникает желание истолковать комплексные числа z0, z1, z2 … как искомые амплитуды вероятности, квадраты модулей которых давали бы различные вероятности того, что после измерения наша система будет находиться, соответственно, в состояниях |0), |1), |2), |3)…. Однако этого еще нельзя сделать, пока не определена «шкала» различных базисных векторов |0), |1), |2)…. Для этого мы должны оговорить, что в некотором смысле эти векторы являются единичными (т. е. имеют единичную длину), и, таким образом, они образуют так называемый ортонормированный базис (элементы которого попарно ортогональны и нормированы на единицу)[151]. Если вектор |ψ) также нормирован на единицу, то искомые амплитуды действительно станут коэффициентами z0, z1, z2 …, вектора |ψ), а вероятности, которые требуется найти, будут равны |z0|2, |z1|2, |z2|2….. Если |ψ) — не единичный вектор, то приведенные выше числа пропорциональны, соответственно, искомым амплитудам и вероятностям. Действительные амплитуды будут равны где |ψ) — «длина» вектора состояния |ψ). Эта «длина» — положительное действительное число, определенное для каждого вектора состояния (0 имеет нулевую длину), и |ψ| = 1, если |ψ) — единичный вектор. Полное измерение представляет собой весьма идеализированный тип измерения. Например, полное измерение положения частицы потребовало бы от нас способности локализовать частицу с бесконечной точностью, где бы во вселенной она ни находилась! К более элементарному типу измерения относится такое измерение, когда мы просто задаем вопрос типа «да или нет», например, такой: «Расположена ли частица справа (или слева) от некоторой прямой?» или «Лежит ли импульс частицы в некотором интервале?» и т. д. Измерения типа «да или нет» в действительности представляют собой наиболее фундаментальный тип измерения. (Например, используя только лишь измерения типа «да или нет», можно сколь угодно близко подойти к точному значению положения или импульса частицы.) Предположим, что результатом измерения типа «да или нет» оказывается ДА. Тогда вектор состояния должен находиться в области «ДА» гильбертова пространства, которую я обозначу Y (от англ. yes — «да». — Прим. ред.). С другой стороны, если результатом измерения типа «да или нет» оказывается НЕТ, то вектор состояния должен находиться в области «НЕТ» гильбертова пространства, которую я обозначу N (от англ. no — «нет». — Прим. ред.). Области Y и N полностью ортогональны друг другу в том смысле, что любой вектор состояния из области Y должен быть ортогонален любому вектору состояния из области N (и наоборот). Кроме того, любой вектор состояния |ψ) может быть (единственным образом) представлен в виде суммы векторов, принадлежащих каждой из областей Y и N. Если воспользоваться математической терминологией, то можно сказать, что области Y и N являются ортогональными дополнениями друг друга. Таким образом, |ψ) однозначно представи́м в виде |ψ) = |ψY) + |ψN) где |ψY) принадлежит Y, a |ψN) принадлежит N. Здесь |ψY) означает ортогональную проекцию состояния |ψ) на Y, a |ψN) — ортогональную проекцию состояния |ψ) на N (рис. 6.23).
Рис. 6.23. Редукция вектора-состояния. Измерение может быть описано в терминах пары подпространств Y и N, каждое из которых является ортогональным дополнением другого. После измерения состояние |ψ) скачком переходит в свою проекцию на одно из этих подпространств с вероятностью, задаваемой множителем, показывающим, во сколько раз квадрат длины вектора состояния уменьшается при переходе к проекцииЕсли результат измерения есть ДА, то |ψ) скачком переходит в |ψY), а если результат есть НЕТ, то в |ψN). Если вектор состояния |ψ) нормирован, то соответствующие вероятности того и другого исхода равны квадратам длин |ψY|2 и |ψN|2 состояний-проекций. Если же вектор |ψ) не нормирован, то каждый из этих квадратов необходимо разделить на |ψ|2. (По «теореме Пифагора» |ψ|2 = |ψY|2 + |ψN|2, т. е. сумма вероятностей, как и должно быть, равна единице!) Заметим, что вероятность скачкообразного перехода состояния |ψ) в состояние |ψY) определяется отношением, показывающим, во сколько раз квадрат длины вектора |ψ) уменьшается при таком проецировании. В заключение необходимо сделать одно замечание относительно таких «актов измерения», которые можно производить над квантовой системой. Из самих основ квантовой теории следует, что для любого состояния, скажем, для |X), существует измерение типа «да или нет»[152], результатом которого будет ДА, если измеряемое состояние пропорционально |X), и НЕТ, если оно ортогонально |X). Таким образом, введенная выше область Y могла бы состоять из всех состояний, кратных любому выбранному состоянию |X). Из этого утверждения, по-видимому, следует весьма сильное заключение о том, что векторы состояния должны быть объективно реальными. Каким бы ни было состояние физической системы (давайте назовем его |X)), существует в принципе выполнимое измерение, для которого |X) — единственное (с точностью до пропорциональности) состояние, с достоверностью приводящее к результату ДА. Может оказаться, что для некоторых состояний |X) выполнить такое измерение будет чрезвычайно трудно, а порою практически «невозможно». Но тот факт, что согласно теории существует принципиальная возможность такого измерения, приведет позднее в этой главе к некоторым поразительным следствиям.
Рис. 6.24. Базис спиновых состояний электрона состоит всего лишь из двух состояний. В качестве них принято выбирать состояния спин вверх и спин внизСостояния |↑) и |↓) взаимно ортогональны, и мы считаем их нормализованными (|↑|2 и |↓|2 = 1). Любое возможное состояние спина электрона представимо в виде линейной суперпозиции, например, ω|↑) + z|↓), именно этих двух ортонормированных состояний |↑) и |↓), т. е. состояний спин вверх и спин вниз. Нужно сказать, что в состояниях спин вверх и спин вниз нет ничего особенного. С тем же успехом мы могли бы описывать спин, вращающийся слева направо вокруг любого другого направления, например, слева-направо |→) и противоположного ему справа-налево |←). Тогда (при подходящем выборе комплексных весов) мы получили бы для |↑) и |↓) [155]: |→) = |↑) + |↓) и |←) = |↑) — |↓). Это позволяет нам по-новому взглянуть на ситуацию. Любое спиновое состояние электрона есть линейная суперпозиция двух ортогональных состояний |→) и |←),т. е. спинов направо и налево. Можно выбрать какое-нибудь совершенно произвольное направление, например, вектор состояния. Он также является линейной комбинацией спинов |↑) и |↓) с некоторыми комплексными коэффициентами, скажем, а любое спиновое состояние было бы представимо в виде линейной комбинации этого состояния и ортогонального ему[156] состояния (Заметим, что понятие «ортогональный» в гильбертовом пространстве не обязательно означает «образующий прямой угол с…» в обычном пространстве. Ортогональные вектора состояния в гильбертовом пространстве в данном случае соответствуют диаметрально противоположным направлениям, а не образующим друг с другом прямой угол.) Каково геометрическое соотношение между направлением в пространстве, определяемым спином и двумя комплексными числами ω и z? Так как физическое состояние, задаваемое спином останется неизменным, если мы умножим на любое ненулевое комплексное число, то значение имеет только отношение числа z к числу ω. Обозначим это отношение через q = z/ω . Тогда q будет обычным комплексным числом за исключением того, что теперь ему разрешено принимать значение q = ∞, чтобы не упускать из рассмотрения ситуацию с ω = 0, т. е. когда спин направлен вертикально вниз. Если q ≠ ∞, то мы можем представить q как точку на плоскости Аргана, как мы делали это в главе 3. Представим себе, что эта плоскость Аргана расположена горизонтально в пространстве, причем действительная ось направлена вправо в вышеуказанном смысле (т. е. в направлении спинового состояния |→) ). Представим теперь сферу единичного радиуса, центр которой совпадает с началом координат плоскости Аргана, а точки 1, i, — 1, -i лежат на экваторе этой сферы. Рассмотрим точку, совпадающую с южным полюсом этой сферы, который мы обозначим ∞. Осуществляя проекцию из южного полюса, мы отобразим всю плоскость Аргана на нашу единичную сферу. В результате любая точка q на плоскости Аргана окажется поставленной в соответствие единственной точке q на этой сфере, лежащей на прямой, соединяющей эти две точки с южным полюсом (рис. 6.25).
Рис. 6.25. Сфера Римана, представленная как пространство физически различных спиновых состояний частицы со спином 1/2. Сфера Римана стереографически спроецирована из ее южного полюса (∞) на плоскость Аргана, проходящую через экватор сферыТакое соответствие называется стереографической проекцией и обладает многими красивыми геометрическими свойствами (например, сохраняет углы и отображает окружности в окружности). Такая проекция позволяет нам параметризовать точки сферы комплексными числами вместе с ∞, т. е. множеством возможных комплексных отношений q. Сфера, параметризованная таким образом, называется сферой Римана. Геометрический смысл сферы Римана для спиновых состояний электрона состоит в том, что направление спина, задаваемое соотношением определяется реальным направлением из центра в точку q = z/ω, как показано на изображении сферы Римана. Заметим, что северный полюс соответствует состоянию |↑), задаваемому соотношением z = 0, т. е. q = 0, а южный полюс — состоянию |↓), задаваемому соотношением ω = 0, т. е. q = ∞. Самая правая точка сферы Римана помечена значением q = 1, что соответствует состоянию |→) = |↑) + |↓) а самая левая точка сферы Римана соответствует q = -1, что дает спиновое состояние |←) = |↑) — |↓). Самая дальняя задняя точка сферы Римана помечена значением q = i, соответствующим состоянию |↑) + i |↓), в котором спин направлен прямо от нас, а самая близкая точка сферы Римана помечена значением q = — i, соответствующим состоянию |↑) — i |↓), в котором спин направлен прямо к нам. Произвольная точка, помеченная q, соответствует состоянию |↑) + q |↓). Как все это связано с измерением, которое можно было бы произвести над спином электрона?[157] Выберем некоторое направление в пространстве и обозначим его а. Если мы измеряем спин электрона в этом направлении, то ответ ДА означает, что электрон (теперь) действительно вращается слева направо вокруг направления а, в то время как ответ НЕТ означает, что электрон вращается слева направо вокруг направления, противоположного α. Предположим, что мы получили ответ ДА, и обозначим результирующее состояние |α). Если мы просто повторим измерение, используя в точности такое же направление α, как прежде, то с вероятностью 100 % обнаружим, что ответ будет ДА. Но если при втором измерении мы изменим направление и выберем новое направление β, то обнаружим, что вероятность ответа ДА (состояние перепрыгивает в |β)) будет несколько меньшей, и существует некоторая возможность появления во втором измерении ответа НЕТ (состояние перепрыгивает в направление, противоположное β). Как нам вычислить эту вероятность? Ответ на этот вопрос содержится в предписаниях, приведенных в конце предыдущего раздела. Вероятность ответа ДА для второго измерения оказывается равной 1/2 (1+cos v) где v — угол между направлениями[158] α и β. Соответственно, вероятность ответа НЕТ для второго измерения равна 1/2 (1 — cos v) Отсюда видно, что если второе измерение производится под прямым углом к первому, то вероятность составляет 50 % в обоих случаях (cos 90° = 0); результат второго измерения полностью случаен! Если угол между двумя измерениями острый, то ответ ДА более вероятен, чем ответ НЕТ. Если этот угол — тупой, то ответ НЕТ более вероятен, чем ДА. В предельном случае, когда направление β противоположно направлению α, вероятность равна 0 для ответа ДА и 100 % для ответа НЕТ, т. е. результат второго измерения заведомо обратен результату первого измерения. (См. Фейнман и др. [1965] для дальнейшего знакомства со спином.) Сфера Римана действительно играет фундаментальную (но не всегда признанную) роль в любой квантовой системе с двумя состояниями, описывая (с точностью до коэффициента пропорциональности) набор возможных квантовых состояний. Для частицы с полуцелым спином ее геометрическая роль особенно очевидна, так как точки сферы соответствуют возможным пространственным направлениям спиновых осей. Увидеть роль сферы Римана во многих других ситуациях труднее. Рассмотрим фотон, только что прошедший через две щели или отразившийся от полупосеребренного зеркала. Состояние фотона есть некоторая линейная комбинация типа |ψt) + |ψb), |ψt) — |ψb) или |ψt) + i |ψb) двух состояний |ψt) и |ψb), описывающих две совершенно различные локализации. Сфера Римана по-прежнему описывает набор физически различных возможностей, но теперь лишь абстрактно. Состояние |ψt) представлено северным полюсом («верхушкой») сферы, а состояние |ψb) — южным полюсом («дном») сферы. Соответственно, состояния |ψt) + |ψb), |ψt) — |ψb) и |ψt) + i |ψb) представлены различными точками на экваторе, и в общем случае состояние ω|ψt) + z|ψb) представлено точкой, задаваемой отношением q = z/ω. Во многих случаях (как и в рассматриваемом примере) возможности «богатства сферы Римана» довольно глубоко упрятаны, не имея прямого отношения к геометрии пространства!
Рис. 6.26. Плоскополяризованная электромагнитная волнаКаждый фрагмент поляроида пропускает свет, плоскость поляризации которого направлена вдоль структуры поляроида. Когда структура второго поляроида ориентирована так же, как структура первого, то весь свет, прошедший сквозь первый поляроид, проходит и сквозь второй. Но когда структуры двух поляроидов образуют прямой угол, то второй поляроид отсекает весь свет, прошедший сквозь первый поляроид. Если же два поляроида ориентированы друг относительно друга под некоторым углом φ, то второй поляроид пропускает долю, равную cos2φ, света, прошедшего сквозь первый поляроид. В корпускулярной картине мы должны считать, что каждый индивидуальный фотон обладает поляризацией. Первый поляроид действует как измеритель поляризации, давая ответ ДА, если фотон действительно поляризован в соответствующем направлении. В этом случае фотону разрешается пройти сквозь поляроид. Если же фотон поляризован в ортогональном направлении, то измерение первым поляроидом даст ответ НЕТ, и фотон будет поглощен. (В данном случае «ортогональность» в гильбертовом пространстве соответствует прямому углу между направлениями в обычном пространстве!) Предположим, что фотон проходит сквозь первый поляроид, после чего второй поляроид задает ему соответствующий вопрос, но уже относительно некоторого другого направления. Угол между этими двумя направлениями равен φ, как в упомянутом выше случае. Тогда мы имеем cos2φ в качестве вероятности того, что фотон пройдет сквозь второй поляроид при условии, что он уже прошел сквозь первый поляроид. Где же здесь появляется сфера Римана? Чтобы получить полный набор состояний поляризации, описываемый комплексными числами, нам необходимо рассмотреть круговую и эллиптическую поляризацию. Для классической волны эти разновидности поляризации представлены на рис. 6.27.
Рис. 6.27. Электромагнитная волна с круговой поляризацией. (Эллиптическая поляризация занимает промежуточное положение между плоской (рис. 6.26) и круговой (рис. 6.27) поляризацией.)При круговой поляризации электрическое и магнитное поля не осциллируют, а согласованно вращаются, по-прежнему образуя между собой прямой угол. При эллиптической поляризации существует некоторая комбинация вращательного и колебательного движений, а вектор электрического поля «вычерчивает» в пространстве эллипс. В квантовом описании каждому индивидуальному фотону разрешается находиться в любом из спиновых состояний, т. е. быть поляризованным любым из названных выше способов. Чтобы понять, как набор возможных поляризаций снова образует сферу Римана, представим себе фотон, который движется вертикально вверх. Северный полюс теперь представляет состояние |R) — правовинтовой спин. Это означает, что электрический вектор движущегося фотона вращается против часовой стрелки относительно вертикали (если смотреть сверху). Южный полюс представляет состояние |L) — левовинтовой спин. (Фотоны можно представлять вращающимися наподобие ружейной пули, либо слева направо, либо справа налево.) Общее спиновое состояние |R) + q|L) представляет собой комплексную линейную комбинацию двух состояний |R) и |L) и соответствует точке на сфере Римана, помеченной значением q. Чтобы установить связь между значением q и эллипсом поляризации, мы прежде всего извлечем из q квадратный корень и получим другое комплексное число р: р = √q Затем нанесем р вместо q на сферу Римана и рассмотрим плоскость, проходящую через центр сферы перпендикулярно прямой, соединяющей центр сферы с точкой р. Эта плоскость пересекает сферу по окружности, проектируя которую на горизонталь, мы получаем эллипс поляризации (рис. 6.28)[160].
Рис. 6.28. Сфера Римана (но теперь со значениями √q) также описывает состояния поляризации фотона. (Вектор, направленный в точку √q, называется вектором Стока.)Сфера Римана со значениями q по-прежнему описывает совокупность поляризованных состояний фотона, но квадратный корень р из q дает нам ее пространственную реализацию. Чтобы вычислить вероятности, мы можем воспользоваться той же самой формулой 1/2(1 + cos v), которой мы пользовались для электрона, применив ее к q, а не к р. Рассмотрим плоскую поляризацию. Мы измеряем поляризацию фотона сначала в одном направлении, затем в другом направлении, образующем с первым угол φ. Эти два направления соответствуют двум значениям р на экваторе сферы, стягивающим угол φ в центре сферы. Так как величины р — квадратные корни из величин q, угол v, под которым из центра видны q-точки, вдвое больше угла, под которым из центра видны p-точки: v = 2φ. Таким образом, вероятность получения ответа ДА после второго измерения при условии, что после первого измерения был получен ответ ДА (т. е. вероятность прохождения фотона через второй поляроид при условии, что он прошел сквозь первый поляроид) равна 1/2(1 + cos φ), что, как показывают несложные тригонометрические преобразования, в точности совпадает с cos2φ и утверждалось выше.
Рис. 6.29. Общее состояние с высшим спином для массивной частицы может быть описано как совокупность состояний со спином 1/2, ориентированных в произвольных направленияхВ частном случае при n = 1, как в приведенном выше примере с электроном, мы получим одну точку на сфере Римана. Это — просто точка, помеченная значением q в приведенных выше описаниях. Но для состояний с высшим спином картина, как я только что описал, значительно усложняется, хотя надо заметить, что это описание почему-то не очень знакомо физикам. В этом описании есть нечто весьма удивительное. Часто высказывают мнение, что в некотором подходящем пределе квантовые описания атомов (или элементарных частиц, или молекул) с необходимостью переходят в классические ньютоновские описания, когда система увеличивается в размерах и усложняется. Но в такой формулировке такое утверждение просто неверно. Ибо, как мы только что видели, спиновые состояния объекта с большим угловым моментом соответствуют большому числу точек, разбросанных по сфере Римана[161]. Мы можем мысленно представлять себе спин объекта как состоящим из целого множества спинов 1/2, ориентированных по всем различным направлениям, задаваемыми этими точками. Лишь весьма немногие из таких комбинированных состояний, а именно когда большинство точек концентрируются вместе в небольшой области на сфере (т. е. когда большинство спинов 1/2 направлены примерно в одном и том же направлении), соответствуют реальным состояниям углового момента, которые мы обычно обнаруживаем у классических объектов, например, у крикетных шаров. Мы могли бы ожидать, что если выбрать спиновое состояние, в котором полный спин окажется равным (в единицах ħ/2) некоторому очень большому числу, а в остальном это выбор будет «случайным», то начнет возникать нечто похожее на классический спин. Но в действительности все происходит совсем не так. В общем случае квантовые спиновые состояния с большим полным спином совсем не похожи на классические спиновые состояния! Как же в таком случае следует устанавливать соответствие с угловым моментом из классической физики? Хотя большинство квантовых состояний с большим спином не похожи на классические состояния, они представляют собой линейные комбинации (ортогональных) состояний, каждое из которых похоже на классическое состояние. Каким-то образом над системой оказывается произведенным «измерение», и состояние «скачком» переходит в то или другое состояние, похожее на классическое. Ситуация здесь аналогична той, которая складывается с любым другим классически измеримым свойством системы, а не только с угловым моментом. Именно этот аспект квантовой механики должен вступать в игру всякий раз, когда система «выходит на классический уровень». Более подробно я расскажу об этом в дальнейшем, но прежде чем мы сможем обсудить такие «большие» или «сложные» квантовые системы, нам необходимо хотя бы несколько разобраться в том странном способе, которым квантовая механика пользуется при рассмотрении систем, состоящих более чем из одной частицы.
«Квантовая механика производит очень внушительное впечатление. Но внутренний голос говорит мне, что это еще не настоящая „вещь“. Квантовая теория дает очень многое, но вряд ли способна приблизить нас к разгадке секрета Старика. Я глубоко убежден, что Он не играет в кости».Однако, как оказывается, еще больше, чем такой физический индетерминизм, Эйнштейна беспокоило кажущееся отсутствие объективности в том, каким образом должна описываться квантовая теория. В моем изложении квантовой теории я пытался подчеркнуть, что описание мира, даваемое этой теорией, в действительности вполне объективно, хотя и кажется часто весьма странным и противоречащим интуиции. С другой стороны, Бор, по-видимому, считал, что квантовое состояние системы (между измерениями) не обладает настоящей физической реальностью, а действует лишь как свод «знаний некоторого субъекта» о рассматриваемой системе. Но разве различные наблюдатели не могут обладать различными знаниями о системе, тогда волновая функция должна была бы быть чем-то существенно субъективным, или «целиком существовать в уме физика»? Наша замечательно точная физическая картина мира, создававшаяся на протяжении многих столетий, не должна испариться целиком; поэтому Бору пришлось рассматривать мир на классическом уровне как действительно обладающий объективной реальностью. Но в состояниях на квантовом уровне, которые, казалось бы, лежат в основе всего, никакой «реальности» он не усматривал. Такая картина была неприемлема для Эйнштейна, который был глубоко убежден в том, что объективный физический мир должен действительно существовать, даже на микроскопических масштабах квантовых явлений. В своих многочисленных дискуссиях с Бором Эйнштейн пытался (но неудачно) показать, что квантовой картине присущи внутренние противоречия, и что за квантовой теорией должна стоять какая-то более глубокая структура, возможно, более похожая на картины классической физики. Возможно, вероятностное поведение квантовых систем является проявлением статистических эффектов более малых компонентов, или частей, системы, о которых мы не располагаем непосредственным знанием. Последователи Эйнштейна, в особенности Давид Бом, развили высказанную им идею о «скрытых переменных», согласно которой должна существовать некоторая вполне определенная реальность, но параметры, точно определяющие систему, не доступны нам непосредственно, и квантовые вероятности возникают из-за того, что значения этих параметров неизвестны до измерения. Согласуется ли теория скрытых переменных со всеми наблюдаемыми фактами квантовой физики? Похоже, что ответ на этот вопрос должен быть утвердительным, но только если эта теория по существу нелокальна в том смысле, что скрытые параметры должны иметь возможность мгновенно влиять на элементы системы в сколь угодно далеких областях! Такая ситуация не понравилась бы Эйнштейну, особенно в связи с возникающими трудностями в специальной теории относительности. К ним я еще вернусь в дальнейшем. Наиболее успешная теория скрытых переменных известна как модель де Бройля (де Бройль [1956], Бом [1952]). Я не буду обсуждать здесь эти модели, так как в этой главе моя цель состоит только в том, чтобы дать общий обзор стандартной квантовой теории, а не различных соперничающих с ней положений. Если кто-нибудь жаждет физической реальности, но готов пожертвовать детерминизмом, то самой стандартной теории вполне достаточно. Он просто рассматривает вектор состояния как описывающий «реальность» — обычно изменяющийся во времени в соответствии с гладкой детерминистской U-процедурой, но время от времени совершающий причудливые «прыжки» в соответствии с R-процедурой всякий раз, когда эффект увеличивается до классического уровня. Но проблема нелокальности и явных трудностей с относительностью сохраняются. Рассмотрим некоторые из них. Предположим, что у нас имеется физическая система, состоящая из двух подсистем А и В. Пусть, например, А и В — две различные частицы. Предположим, что для состояния частицы А существуют две (ортогональные) альтернативы |α) и |ρ), а для состояния частицы В — две (ортогональные) альтернативы |β) и |σ). Как мы уже видели выше, общее комбинированное состояние системы будет не просто произведением (конъюнкцией «и») некоторого состояния частицы А и некоторого состояния частицы В, а суперпозицией («плюс») таких произведений. (Тогда мы говорим, что А и В коррелированы.) Пусть состояние системы представимо суперпозицией |α)|β) + |ρ)|σ). Произведем измерение типа «да или нет» над частицей А, которое отличает состояние |α) (ДА) от состояния |ρ) (НЕТ). Что произойдет при этом с частицей B? Если измерение даст ответ ДА, то результирующим должно быть состояние |α)|β), а если измерение даст ответ НЕТ, то |ρ)|σ) Таким образом, измерение, производимое нами над частицей А, заставляет состояние частицы В измениться скачком: перейти в |β), если получен ответ ДА, и перейти в |σ), если получен ответ НЕТ! Частица В не обязательно должна находиться поблизости от частицы А; частицы могут быть разделены расстоянием в несколько световых лет. И все же частица В скачком переходит из одного состояния в другое одновременно с измерением, производимым над частицей А! «Но постойте», — вполне может сказать читатель. К чему все эти подозрительные «скачки»? Почему не происходит просто следующее: представьте себе ящик, о котором известно, что в нем лежит один черный и один белый шар. Предположим, что некто извлек шары из ящика и, не глядя, отнес их в противоположные углы комнаты. Затем он взглянул на один шар и обнаружил, что он белый (аналог упоминавшегося выше состояния |α)), тогда — алле-оп! — другой шар оказывается черным (аналог состояния |β))! С другой стороны, если первый шар оказался черным (аналог состояния |ρ)), то в мгновение ока состояние второго шара скачком переходит в «заведомо белый» (аналог состояния |σ)). Никто из читателей или читательниц в здравом уме не станет упорно приписывать внезапный переход второго шара из состояния «неопределенности» в состояние «определенно черный» или «определенно белый» некоторому таинственному нелокальному «влиянию», мгновенно доходящему до него от первого шара в тот самый момент, когда наблюдатель рассмотрел первый шар. Но природа действует еще более изощренно. Действительно, в приведенном выше примере можно было бы представить, что система уже «знала», что частица В находилась в состоянии |β), а частица А — в состоянии |α) (или что частица В находилась в состоянии |σ), а частица А — в состоянии |ρ)) до того, как над А было произведено измерение; и только экспериментатору состояния частиц не были известны. Обнаружив, что частица А находится в состоянии |α), он просто заключил, что частица В находится в состоянии |β). Такая точка зрения была бы «классической» — как в локальной теории скрытых переменных — и никаких скачкообразных физических переходов из одного состояния в другое в действительности не происходит. (Все это происходит лишь в уме экспериментатора!) Согласно такой точке зрения любая часть системы заранее «знает» результаты любого эксперимента, который мог бы быть произведен над ней. Вероятности возникают только из-за отсутствия такого знания у экспериментатора. Достойно удивления, что, как оказывается, эта точка зрения не срабатывает для объяснения всех загадочных нелокальных вероятностей, возникающих в квантовой теории! Чтобы убедиться в этом, рассмотрим ситуацию, аналогичную изложенной выше, но такую, что выбор измерения, производимого над системой А, остается нерешенным до тех пор, пока системы A и B не окажутся пространственно разделенными. Тогда, как представляется, факт выбора измерения мгновенно окажет влияние на поведение системы B! Этот кажущийся парадоксальным «мысленный эксперимент» (ЭПР-типа) был предложен Альбертом Эйнштейном, Борисом Подольским и Натаном Розеном [1935]. Я опишу его вариант, предложенный Давидом Бомом [1951]. То, что никакое локальное «реалистическое» (т. е. типа скрытых переменных или «классического типа») описание не может дать правильные квантовые вероятности, следует из одной замечательной теоремы Джона С. Белла (Белл [1987], Рэй [1986], Сквайерс [1986]). Предположим, что две частицы со спином 1/2, которые я буду называть электроном и позитроном (т. е. антиэлектроном), возникли в результате распада одной частицы со спином 0 в некоторой точке (центре), и что они движутся от центра в противоположных направлениях (рис. 6.30).
Рис. 6.30. Частица с нулевым спином распадается на две частицы с половинным спином — электрон Б и позитрон Р. Представляется, что измерение спина одной из частиц со спином 1/2 мгновенно фиксирует состояние спина другой частицыИз закона сохранения углового момента следует, что спины электрона и позитрона в сумме должны давать 0, так как угловой момент исходной частицы был равен 0. Отсюда следует, что когда мы измеряем спин электрона в каком-нибудь направлении, то, какое направление мы бы ни выбрали, спин позитрона окажется направленным в противоположную сторону! Электрон и позитрон могут быть разделены расстоянием в несколько миль или даже световых лет, тем не менее кажется, что сам выбор измерения, производимого над одной частицей, мгновенно фиксирует ось спина другой частицы! Попытаемся теперь выяснить, как квантовый формализм приводит нас к такому заключению. Представим состояние двух частиц с суммарным нулевым угловым моментом вектором состояния |Q). Тогда имеем соотношение |Q) = |E↑) |P↓) — |E↓) |P↑), где Е означает электрон, а Р — позитрон. Здесь все описывается в терминах направлений спина «вверх/вниз». Мы видим, что полное состояние является линейной суперпозицией электрона со спином вверх и позитрона со спином вниз, а также электрона со спином вниз и позитрона со спином вверх. Таким образом, если мы измеряем спин электрона в направлении «вверх/вниз» и обнаруживаем, что спин направлен вверх, то мы должны скачком перейти к состоянию |E↑) |P↓), поэтому спиновое состояние позитрона должно быть направлено вниз. С другой стороны, если мы обнаруживаем, что спин электрона направлен вниз, то состояние скачком переходит в |E↓) |P↑), поэтому спин позитрона направлен вверх. Предположим, что мы выбрали какую-то другую пару противоположных направлений, например, вправо и влево, где |E→) = |E↑) + |E↓), |P→) = |P↑) + |P↓) и |E←) = |E↑) — |E↓), |P←) = |P↑) — |P↓). Тогда мы находим (если угодно, можете проверить выкладки): |E→) |P←) — |E←) |P→) = (|E↑) + |E↓) (|P↑) — |P↓) — (|E↑) — |E↓)) (|P↑) + |P↓)) = |E↑)|P↑) + |E↓)|P↑) — |E↑)|P↓) — |E↓)|P↓) — |E↑)|P↑) + |E↓)|P↑) — |E↑)|P↓) + |E↓)|P↓) = -2(|E↑)|P↓) — |E↓)|P↑) = -2|Q) т. е. мы получили (с точностью до несущественного множителя -2) то же самое состояние, из которого мы «стартовали». Таким образом, наше исходное состояние можно одинаково хорошо считать линейной суперпозицией электрона со спином вправо, позитрона со спином влево, и электрона со спином влево, позитрона со спином вправо! Выписанное выше выражение полезно, если мы решили измерять спин электрона в направлении вправо-влево вместо направления вверх-вниз. Если мы обнаружим, что спин электрона действительно направлен вправо, то состояние системы скачком переходит в |E→) |P←), поэтому спин позитрона направлен влево. С другой стороны, если мы обнаружим, что спин электрона направлен влево, то состояние системы скачком переходит в |E←) |P→), поэтому спин позитрона направлен вправо. Если бы мы стали измерять спин электрона в любом другом направлении, то получили бы соответствующую ситуацию: спиновое состояние позитрона мгновенно перешло бы скачком либо в измеряемое направление, либо в противоположное направление, в зависимости от измерения спина электрона. Почему мы не можем моделировать спины наших частиц — электрона и позитрона аналогично тому, как мы поступили в приведенном выше примере с черным и белым шарами, извлекаемыми из ящика? Будем рассуждать на самом общем уровне. Вместо черного и белого шаров мы могли бы взять два каких-нибудь технических устройства Е и Р, первоначально образовывавших единое целое, а затем начавших двигаться в противоположные стороны. Предположим, что каждое из устройств Е и Р способно давать ответ ДА или НЕТ на измерение спина в любом заданном направлении. Этот ответ может полностью определяться технической начинкой устройства при любом выборе направления — или, может быть, устройство дает только вероятностные ответы (вероятность определяется его технической начинкой) — но при этом мы предполагаем, что после разделения каждое из устройств Е и Р ведет себя совершенно независимо от другого. Поставим с каждой стороны измерители спина, один из которых измеряет спин Е, а другой — спин Р. Предположим, что каждый измеритель обладает тремя настройками для измерения направления спина при каждом измерении, например, настройками А, В, С для измерителя спина Е и настройками А', В', С' для измерителя спина Р. Направления А', В', С' должны быть параллельны, соответственно, направлениям А, В, и С. Предполагается также, что все три направления А, В, и С лежат в одной плоскости и образуют между собой попарно равные углы, т. е. углы в 120° (рис. 6.31).
Рис. 6.31. Простая версия парадокса ЭПР, принадлежащая Дэвиду Мермину, и теорема Белла, показывающие, что существует противоречие между локальным реалистическим взглядом на природу и результатами квантовой теории, E-измеритель и Р-измеритель каждый независимо имеет по три настройки для направлений, в которых они могут измерять спины соответствующих частиц (электрона и позитрона)Предположим теперь, что эксперимент повторяется многократно и дает различные результаты для каждой из настроек. Иногда E-измеритель фиксирует ответ ДА (т. е. спин направлен вдоль измеряемого направления А, В, и С), иногда фиксирует ответ НЕТ (т. е. спин имеет направление, противоположное тому, в котором производится измерение). Аналогично, Р-измеритель фиксирует иногда ответ ДА, иногда — НЕТ. Обратим внимание на два свойства, которыми должны обладать настоящие квантовые вероятности: (1) Если настройки устройств Е и Р одинаковы (т. е. А совпадает с A' и т. д.), то результаты измерений, производимых с помощью устройств Е и Р, всегда не согласуются между собой (т. е. E-измеритель фиксирует ответ ДА всякий раз, когда Р-измеритель дает ответ НЕТ, и ответ НЕТ всякий раз, когда Р-измеритель дает ответ ДА). (2) Если лимбы настроек могут вращаться и установлены случайно, т. е. полностью независимо друг от друга, то два измерителя равновероятно дают как согласующиеся, так и не согласующиеся результаты измерений. Нетрудно видеть, что свойства (1) и (2) непосредственно следуют из приведенных выше правил квантовых вероятностей. Мы можем предположить, что E-измеритель срабатывает первым. Тогда Р-измеритель обнаруживает частицу, спиновое состояние которой имеет направление, противоположное измеренному E-измерителем, поэтому свойство (1) следует немедленно. Чтобы получить свойство (2), заметим, что для измеряемых направлений, образующих между собой углы в 120°, если E-измеритель дает ответ ДА, то Р-направление расположено под углом 60° к тому спиновому состоянию, на которое действует Р-измеритель, а если E-измеритель дает ответ НЕТ, то Р-направление образует угол 120° с этим спиновым состоянием. С вероятностью 3/4 = (1/2)(1 + cos60°) измерения согласуются, и с вероятностью 1/4 = (1/2)(1 + cos 120°) они не согласуются. Таким образом, усредненная вероятность для трех настроек Р-измерителя при условии, что E-измеритель дает ответ ДА, составляет (1/3)(0 + 3/4 + 3/4) = 1/2 для ответа ДА, даваемого Р-измерителем, и (1/3)(1 + 1/4 + 1/4) = 1/2 для ответа НЕТ, даваемого Р-измерителем, т. е. результаты измерений, производимых Е- и Р-измерителями, равновероятно согласуются и не согласуются. Аналогичная ситуация возникает и в том случае, когда E-измеритель дает ответ НЕТ. Это и есть свойство (2) (см. Глава 6. «Спин и сфера Римана состояний»). Замечательно, что свойства (1) и (2) не согласуются с любой локальной реалистической моделью (т. е. с любой разновидностью устройств рассматриваемого типа)! Предположим, что у нас есть такая модель, E-машину следует приготовить для каждого из возможных измерений А, В или С. Заметам, что если бы ее следовало готовить только дам получения вероятностного ответа, то P-машина (в соответствии со свойством (1)) не могла бы достоверно давать результаты измерения, не согласующиеся с результатами измерения E-машины. Действительно, обе машины должны давать свои ответы, определенным образом приготовленные заранее, на каждое из трех возможных измерений. Предположим, например, что эти ответы должны быть ДА, ДА, ДА, соответственно, для настроек А, В, С; тогда правая частица должна быть приготовлена так, чтобы давать ответы НЕТ, НЕТ, НЕТ при соответствующих трех настройках. Если же вместо этого приготовленные ответы левой частицы гласят: ДА, ДА, НЕТ, то ответами правой частицы должны быть НЕТ, НЕТ, ДА Все остальные случаи по существу аналогичны только что приведенным. Попытаемся теперь выяснить, согласуется ли это со свойством (2). Наборы ответов ДА, ДА, ДА / НЕТ, НЕТ, НЕТ не слишком многообещающи, так как дают 9 случаев несоответствия и 0 случаев соответствия при всех возможных парах настроек А/А', А/В', А/С', В/А' и т. д. А как обстоит дело с наборами ДА, ДА, НЕТ / НЕТ, НЕТ, ДА и тому подобными ответами? Они дают 5 случаев несоответствия и 4 случая соответствия. (Чтобы убедиться в правильности последнего утверждения, произведем подсчет случаев: Д/Н, Д/Н, Д/Д, Д/Н, Д/Н, Д/Д, Н/Н, Н/Н, Н/Д. Мы видим, что в 5 случаях ответы не согласуются и в 4 случаях согласуются.) Это уже гораздо ближе к тому, что требуется для свойства (2), но еще недостаточно хорошо, так как случаев несоответствия ответов должно быть столько же, сколько случаев соответствия! Для любой другой пары наборов возможных ответов, согласующихся со свойством (1), мы снова получили бы соотношение 5 к 4 (за исключением наборов НЕТ, НЕТ, НЕТ / ДА, ДА, ДА, дам которых соотношение было бы хуже — снова 9 к 0). Не существует набора приготовленных ответов, который могли бы дать квантово-механические вероятности. Локальные реалистические модели исключаются![164]
Рис. 6.32. У двух различных наблюдателей формируются взаимно несогласованные картины «реальности» в эксперименте ЭПР, в котором два фотона в состоянии со спином 0 испускаются в противоположных направлениях. С точки зрения наблюдателя, движущегося вправо, левая часть состояния совершает скачок до того, как производится измерение, где скачок обусловлен измерением, производимым над правой частью состояния. Наблюдатель, движущийся влево, придерживается противоположного мнения!Если «наблюдатель» достаточно быстро движется вправо, то измерение, производимое справа, он считает происходящим первым; а если «наблюдатель» движется влево, то первым он считает измерение, производимое слева. Но если мы сочтем, что первым был измерен правый фотон, то получим совершенно другую картину физической реальности, чем та, которая получается, если мы сочтем, что первым был измерен левый фотон! (Это — другое измерение, вызывающее нелокальный «скачок».) Между нашей пространственно-временной картиной физической реальности (даже правильной нелокальной квантово-механической картиной) и специальной теорией относительности имеется существенное противоречие! Это — трудная задача, адекватное решение которой не удалось пока решить «квантовым реалистам» (см. Ааронов, Альберт [1981]). К этому вопросу мне еще придется вернуться в дальнейшем.
Рис. 6.33. «Кошка Шредингера» — с дополнениямиОтражение от зеркала расщепляет волновую функцию фотона на две отдельные части, одна из которых отражается, а другая проходит сквозь зеркало. Отраженная часть волновой функции фотона фокусируется на фотоэлементе так, что если фотон регистрируется фотоэлементом, то это означает, что он отразился. В этом случае синильная кислота выделяется и кошка погибает. Если же фотоэлемент не срабатывает, то это означает, что фотон прошел сквозь полупосеребренное зеркало до стенки контейнера, расположенной за зеркалом, и кошка осталась жива. С точки зрения (довольно рискованного) наблюдателя, находящегося внутри контейнера, именно таким было бы описание событий, происходящих внутри контейнера. Либо считается, что фотон отразился, так как по свидетельству наблюдателя фотоэлемент зарегистрировал фотон, и кошка погибла, либо считается, что фотон прошел сквозь зеркало, так как по свидетельству наблюдателя фотоэлемент не зарегистрировал фотон, и кошка осталась жива. Либо одно, либо другое действительно происходит: реализуется R-процедура, и вероятность каждой возможности составляет 50 % (потому что зеркало полупосеребренное). Но взглянем теперь на события с точки зрения наблюдателя, находящегося снаружи контейнера. Мы можем считать, что начальный вектор состояния содержимого контейнера был «известен» наблюдателю до того, как контейнер был герметически запечатан. (Я отнюдь не хочу сказать, что вектор состояния содержимого контейнера мог быть известен на практике, но ничто в квантовой теории не утверждает, что он не мог бы в принципе быть известен наблюдателю.) Согласно внешнему наблюдателю никакое «измерение» в действительности не производилось, поэтому вся эволюция вектора состояния должна была бы происходить в соответствии с U-процедурой. Фотон испускается источником в определенном состоянии (в этом оба наблюдателя сходятся во мнении), и его волновая функция расщепляется на две части с амплитудой 1/√2 для каждой из частей (тогда квадрат модуля действительно даст вероятность 1/2). Так как все содержимое контейнера рассматривается внешним наблюдателем как одна квантовая система, линейная суперпозиция альтернатив должна выполняться вплоть до масштабов кошки. Существует амплитуда 1/√2 того, что фотоэлемент зарегистрирует фотон, и амплитуда 1/√2 того, что он фотон не зарегистрирует. Обе альтернативы должны быть представлены в состоянии и участвовать в квантовой линейной суперпозиции с равными весами. С точки зрения внешнего наблюдателя кошка есть не что иное, как линейная суперпозиция дохлой и живой кошек! Убеждены ли мы в том, что в действительности все обстоит именно так? Сам Шредингер ясно и определенно заявил о том, что так не считает. Действительно, свое мнение он аргументировал тем, что U-npoцедура квантовой механики не должна применяться к чему-нибудь столь большому или столь сложному, как кошка. При попытке применить U-процедуру к столь большому и сложному объекту уравнение Шредингера где-то должно утратить силу. Разумеется, Шредингер имел право рассуждать так о своем собственном уравнении, но все остальные из нас лишены такой прерогативы! Наоборот, многие физики (в действительности большинство физиков) склонны считать, что в настоящее время имеется весьма много экспериментальных фактов, свидетельствующих в пользу U-процедуры, и нет ни одного экспериментального факта, который свидетельствовал бы против U, поэтому мы не имеем никакого права отказываться от этого типа эволюции даже на уровне кошки. Если принять эту точку зрения, то мы, кажется, будем вынуждены прийти к весьма субъективному представлению о физической реальности. Для внешнего наблюдателя кошка действительно есть не что иное, как линейная комбинация дохлой и живой кошек, и только когда контейнер, наконец, будет вскрыт, вектор состояния кошки коллапсирует в вектор одного из этих двух состояний. С другой стороны, для внутреннего наблюдателя (надлежащим образом защищенного от воздействия синильной кислоты) вектор состояния кошки коллапсировал бы гораздо раньше, и линейная комбинация внешнего наблюдателя |ψ) = 1/√2 {|живая) + |дохлая)} не имела бы смысла. Создается впечатление, что вектор состояния в конечном счете существует «только в воображении» наблюдателя! Но можем ли мы принять такую субъективную точку зрения на вектор состояния? Предположим, что внешний наблюдатель не просто «заглядывает» в контейнер, а производит некую более изощренную процедуру. Предположим также, что, исходя из того, что он знает о начальном состоянии внутри контейнера, внешний наблюдатель сначала использует некоторый быстродействующий компьютер, чтобы на основании уравнения Шредингера вычислить, какое состояние действительно должно установиться внутри контейнера, и получить («правильный») ответ |ψ) (где |ψ) действительно включает в себя линейную суперпозицию дохлой кошки и живой кошки). Предположим далее, что внешний наблюдатель выполняет над содержимым контейнера тот самый эксперимент, который позволяет отличить состояние |ψ) от любого ортогонального ему состояния. (Как было показано выше, по правилам квантовой механики внешний наблюдатель в принципе может выполнить такой эксперимент, хотя осуществить его на практике было бы чрезвычайно трудно.) Вероятности двух исходов: «да, находится в состоянии |ψ)» и «нет, находится в состоянии, ортогональном |ψ)» — составляли бы, соответственно, 100 % и 0 %. В частности, для состояния |X) = |дохлая) — |живая), ортогонального |ψ), вероятность была бы равна 0. Невозможность состояния |X) в результате эксперимента может возникнуть только потому, что обе альтернативы |дохлая) и |живая) сосуществуют друг с другом. То же самое можно было бы утверждать и в том случае, если бы мы подобрали соответствующим образом длины путей фотона (или плотность посеребренного слоя на поверхности зеркала), так чтобы вместо линейной суперпозиции состояний |дохлая) + |живая) мы имели бы некоторую другую комбинацию, например, |дохлая) — i |живая) и т. д. Все эти различные комбинации приводят к различным экспериментальным следствиям (в принципе!). Таким образом уже говорится не «просто» о некоторой форме сосуществования межцу жизнью и смертью, от которой зависит судьба нашей несчастной кошки. Допустимы все возможные комплексные комбинации, и все они (в принципе) отличимы одна от другой! Однако наблюдателю, находящемуся внутри контейнера, все эти комбинации представляются несущественными. Кошка либо жива, либо мертва. Каким образом мы можем придать смысл такого рода несоответствию? Я кратко приведу несколько различных точек зрения, высказанных по этому (и аналогичным) вопросу, хотя не подлежит сомнению, что я не смогу всем им дать равнозначную оценку.
Рис. 7.1. Может ли время действительно «течь»? Для наблюдателя U, В может находиться в «фиксированном» прошлом, в то время как А лежит еще в «неопределенном» будущем. Наблюдатель V придерживается противоположной точки зрения!Мы не можем утверждать, что какое-либо из событий А или В остается неопределенным, в то время как другое из них уже определено. Вернемся к рассуждениям Главы 5. «Специальная теория относительноаи Эйнштейна и Пуанкаре» и рис. 5.22. Два человека разминулись на улице; для одного из них космическая флотилия Андромеды уже отправилась в путешествие, в то время как для другого решение о том, состоится путешествие или нет, еще даже не принято. Возможно ли это? Ведь если хотя бы один из людей уже знает, что решение было принято, тогда, казалось бы, никакой неопределенности здесь быть не может. Запуск космической флотилии — реальность. На самом деле, ни один из этих людей в момент наблюдения еще не может что-либо знать о запуске. Они узнают о нем позднее, когда наблюдения с Земли подтвердят, что флотилия действительно уже в пути. Тогда они могут еще раз сопоставить свои прошлые наблюдения[169] и прийти к заключению, что во время наблюдения для одного из них решение о запуске лежало в неопределенном будущем, тогда как для другого, — в определенном прошлом. Имеет ли смысл, в таком случае, говорить о какой-либо неопределенности будущего? А может быть будущее для них обоих было уже изначально «фиксированным»? Складывается впечатление, будто всякая определенность чего бы то ни было неизбежно приводит к определенности пространства-времени в целом! В этом случае вовсе нет никакого «неопределенного» будущего. Все пространство-время должно быть изначально фиксированным и никакой неопределенности просто нет места. Кажется, именно так думал и сам Эйнштейн (см. Пайс [1982], с. 444). Следуя этой логике, можно заключить, что нет и течения времени. Остается только «пространство-время», в котором нет места будущему, в чьи «владения» неумолимо вторгается определенное прошлое! (Читатель может в этом месте задаться вопросом о роли квантовомеханических «неопределенностей». Я вернусь к вопросам, навеянным квантовой механикой, в следующей главе. Сейчас будет лучше проводить все рассуждения в рамках чисто классической картины.) Мы видим, что налицо впечатляющие несоответствия между нашим субъективным ощущением потока времени и тем, как представляют нам физическую реальность наши (удивительно точные) теории. Эти несоответствия, скорее всего, свидетельствуют о существовании иных принципов, которые, по-видимому, и должны лежать глубоко в основе наших субъективных ощущений — предполагая (как мне кажется), что эти принципы могут быть адекватно выражены на языке некоторой физической теории. Во всяком случае, представляется бесспорным, что какая бы теория ни работала, она должна нести в себе существенно асимметричную во времени составляющую, т. е. должна, так или иначе, отделять прошлое от будущего. Но если уравнения физики никак не различают, как кажется, прошлое и будущее, и если даже сама идея «настоящего» так плохо согласуется с относительностью — тогда в какой же части мироздания нам следует искать ту область, где физические законы в большей степени соответствуют нашему восприятию мира? К счастью, если признаться честно, несоответствия не столь уж катастрофичны, как могло бы показаться. Наша физическая картина мира и в самом деле содержит некоторые фундаментальные составляющие, отличные от простых эволюционных уравнений, и при этом некоторые из них действительно несут в себе временную асимметрию. Наиболее важная из этих составляющих носит название «второго начала термодинамики». Давайте попробуем разобраться, о чем в данном случае идет речь.
Рис. 7.2. Законы механики обратимы во времени; однако последовательность событий в направлении справа налево никогда не наблюдается, в то время как последовательность слева направо была бы вполне обычнойА теперь попробуем прокрутить эту картину в обратном направлении. В силу обратимости во времени законов Ньютона, вода могла бы также легко истечь из ковра и из щелей в половицах, заполнить стакан, который в это время ловко собирал бы себя из множества отколовшихся осколков, а затем все это могло запрыгнуть на высоту стола и устроиться в равновесии на его краю. И все это, так же как и первоначальный процесс, происходило бы в полном соответствии с законами Ньютона! Читатель, быть может, спросит, откуда берется энергия, поднявшая стакан с пола на стол. Ответить на этот вопрос совсем несложно, поскольку, в то время, когда стакан падает со стола, энергия, которую он приобретает в процессе падения, должна куда-то деваться. На самом деле, энергия падающего стакана переходит в тепло. Атомы в осколках стакана, в воде, в ковре и половицах после удара стакана о пол будут хаотически колебаться чуть-чуть быстрее, чем до удара, т. е. осколки стакана, вода, ковер и половицы будут чуточку горячее, чем они были раньше (если пренебречь возможной потерей тепла за счет испарения, которое, однако, в принципе тоже обратимо). В силу закона сохранения энергии эта тепловая энергия будет в точности равна той, которая теряется стаканом с водой при его падении со стола. Таким образом, этой маленькой порции тепловой энергии было бы как раз достаточно, чтобы поднять стакан обратно на стол! Очень важно не забыть учесть вклад тепловой энергии в общий энергетический баланс. Закон сохранения энергии, в котором учитывается также и тепловая энергия, носит название первого начала термодинамики. Этот закон, будучи следствием ньютоновской механики, симметричен во времени. Он не накладывает каких-либо ограничений на стакан и воду, которые бы запрещали стакану собирать себя, заполняться водой и таким вот чудесным образом запрыгивать обратно на стол. Причина, по которой мы не наблюдаем ничего подобного в реальности, заключается в том, что «тепловое» движение атомов в осколках стекла, воде, половицах и ковре является совершенно беспорядочным, так что подавляющая часть атомов будет двигаться во всех возможных направлениях. Необходима невероятно точная координация их движений для того, чтобы восстановить стакан, вместе со всей собранной в него с пола водой, и аккуратно забросить его на стол. Можно даже утверждать, что такие слаженные движения невозможны. Точнее говоря, подобная скоординированность могла бы возникнуть только благодаря удивительной случайности, которую мы все равно отнесли бы к разряду «чудес», даже если бы она и произошла в действительности! Однако для другого направления времени такая согласованность движений атомов является вполне нормальной. Ведь мы почему-то не относим в разряд случайных те ситуации, в которых частицы движутся скоординированным образом после некоторого крупномасштабного изменения физического состояния (в нашем случае — разбивания стакана и расплескивания воды), а не до такого изменения. Движение частиц после подобного события как раз и должно быть в высокой степени согласованным, поскольку сама природа этого движения такова, что если бы мы могли в точности обратить движение каждого отдельного атома, результирующее движение было бы именно таким, какое необходимо для восстановления, заполнения и подъема стакана в его исходное положение. Высокая координация движения вполне приемлема и даже естественна в том случае, когда оно является следствием крупномасштабного изменения, а не его причиной. Но слова «причина» и «следствие», так или иначе, затрагивают вопрос о временнбй асимметрии. Используя эти термины в нашем повседневном разговорном языке, мы обычно подразумеваем, что причина должна предшествовать следствию. Но если мы пытаемся осознать физическое различие между прошлым и будущим, нам необходимо быть предельно осторожными, чтобы невольно не привнести в рассуждения наши житейские представления об этих понятиях. Я должен предупредить читателя, что избежать этого чрезвычайно трудно, но нам все же стоит попробовать. Мы должны попытаться использовать слова таким образом, чтобы они заранее не предрешали вопроса о физическом различии прошлого и будущего. В частности, если обстоятельства будут к тому располагать, нам придется иногда рассматривать причины некоторых явлений лежащими в будущем, а следствия — лежащими в прошлом! Детерминистские уравнения классической физики (или операция U в квантовой физике) никоим образом не выделяют эволюцию в направлении будущего. Они могут быть столь же хорошо применимы и для описания эволюции в прошлое. Будущее определяет прошлое точно так же, как и прошлое определяет будущее. Мы можем каким-либо образом зафиксировать некоторое состояние системы в будущем и затем использовать его для определения состояния системы в прошлом. Если, применяя наши уравнения к системе с обычным направлением времени в сторону будущего, мы можем считать прошлое причиной, а будущее — следствием, то в случае, когда мы также правомерно используем эти уравнения для описания эволюции в прошлое, мы будем вынуждены относить будущее к «причине», а прошлое — к «следствию». Есть, однако, еще один момент, связанный с использованием терминов «причина» и «следствие», который, на самом деле, никак не зависит от того, какие события мы относим к прошлому, а какие — к будущему. Вообразим себе гипотетическую вселенную, в которой справедливы те же симметричные во времени классические уравнения, что и в нашей вселенной, но в которой явления обычного порядка (такие, как разбивание и расплескивание стакана воды) сосуществуют с их обращениями во времени. Предположим, что наряду с обычными явлениями, стаканы воды иногда действительно собирают себя из отколовшихся кусочков, чудесным образом заполняются расплескавшейся водой и затем запрыгивают на стол; предположим также, что иногда, приготовленная яичница-болтунья снова превращается в исходный полуфабрикат, желток в ней отделяется от белка и, наконец, она запрыгивает обратно в сломанную яичную скорлупу, которая становится совершенно целой, вновь заключая в себя все свое содержимое; что кусочки сахара могут восстанавливаться из растворенного сахара в подслащенном кофе и затем самопроизвольно выпрыгивать из чашки прямо в чью-нибудь руку. Если бы мы жили в мире, в котором подобные вещи относились бы к разряду повседневных явлений, мы, очевидно, могли бы приписать «причины» таких событий не фантастической случайности, связанной с коррелированным поведением отдельных атомов, но некоторому «телеологическому воздействию», благодаря которому самовосстанавливающиеся объекты стремятся в конце концов достичь желаемой макроскопической конфигурации. «Смотрите! — могли бы воскликнуть мы. — Это повторяется. Та смесь намеревается собрать себя в другой стакан воды!» Мы, разумеется, можем принять точку зрения, согласно которой атомы направили сами себя именно так, потому что именно таким способом можно получить стакан воды на столе. Стакан на столе был бы в этом случае причиной, а явно беспорядочная смесь атомов на полу — «следствием» — несмотря на то, что это «следствие» теперь существует во времени раньше, чем причина. Точно также, внезапное упорядочивание движения атомов в приготовленной яичнице-болтунье не является «причиной» ее запрыгивания в целую яичную скорлупу, но есть следствие этого будущего состояния; и кусок сахара собирается и выскакивает из чашки не «потому, что» атомы движутся с такой необычайной точностью, но благодаря тому, что кто-то — находящийся в будущем — будет позднее держать этот кусок сахара в своей руке! Конечно, мы не наблюдаем ничего подобного в нашем мире — или, лучше сказать, что мы не обнаруживаем одновременного сосуществования подобных вещей с явлениями обычного порядка. Ведь если бы все, что мы видели, было бы явлениями обратного порядка, подобного описанному выше, у нас не было бы проблем. Нам нужно было бы просто поменять местами «прошлое» и «будущее», «до» и «после» и т. д. во всех наших описаниях. Время следовало бы тогда считать текущим в направлении обратном по отношению к первоначально выбранному, и такой мир мог бы описываться так же, как и наш. Здесь я, однако, хочу рассмотреть другую возможность, в точности согласующуюся с симметричными во времени уравнениями физики, а именно — когда разбивающийся и самовосстанавливающийся стаканы могут сосуществовать. В этом мире мы были бы не в состоянии восстановить привычные описания событий одним только изменением наших соглашений о направлении движения времени. Конечно, наш мир оказывается не таким — но почему? Чтобы разобраться с этим, я для начала попросил бы вас представить такой мир и подумать над тем, как описывать события, происходящие в нем. Согласитесь, что в подобном мире мы могли бы хорошо описывать крупные макроскопические конфигурации — такие как полные стаканы воды, неразбитые яйца, или кусочки сахара в руке, являющиеся «причинами»; и микроскопические, быть может, тонко скоррелированные движения отдельных атомов, представляющие «следствия» — независимо от того, лежат ли «причины» в прошлом или будущем своих «следствий». Почему же в мире, в котором живем мы, именно причины всегда предшествуют следствиям или, иными словами, почему точно скоординированные движения частиц возникают только после крупномасштабных изменений физического состояния, а не перед ними? Чтобы лучше разобраться в таком положении дел, мне нужно ввести понятие энтропии. Грубо говоря, энтропия системы есть мера ее явного беспорядка. (Позже я дам более точное определение.) Таким образом, разбитый стакан и разлитая по полу вода находятся в состоянии с большей энтропией, чем целый заполненный водой стакан на столе. Приготовленная яичница-болтунья обладает большей энтропией, чем свежее неразбитое яйцо; подслащенный кофе обладает большей энтропией, чем кофе с нерастворенным куском сахара в нем. Подобные низкоэнтропийные состояния выглядят как бы «специально упорядоченными» некоторым явным образом, а высокоэнтропийные состояния — менее «специально упорядоченными». Здесь важно подчеркнуть, что говоря о «специальности» (или, скажем, «особенности») состояния с низкой энтропией, мы, на самом деле, имеем ввиду именно явную «специальность». Если этого не оговорить, то при более детальном рассмотрении мы могли бы увидеть, что высокоэнтропийные состояния в подобных ситуациях будут такими же «специально упорядоченными», как и низкоэнтропийные, благодаря чрезвычайно точной координации движений отдельных частиц. Например, кажущееся случайным движение молекул воды, просочившейся между половицами после того, как стакан разбился, является, на самом деле, вполне специальным: эти перемещения настолько точны, что если их обратить, то получится то самое исходное низкоэнтропийное состояние, в котором восстановленный стакан покоится на столе. (Это должно быть именно так, поскольку обращение всех этих движений полностью соответствует обращению направления времени, в результате которого стакан, разумеется, восстановил бы себя и запрыгнул обратно на стол.) Но подобное скоординированное движение всех молекул воды — совсем не та «специальность», которую мы имеем ввиду, говоря о низкой энтропии. Энтропия относится к явному беспорядку. Порядок же, относящийся к точной координации движений частиц, не есть явный порядок, и потому он не приводит к понижению энтропии системы. Таким образом, упорядочивание молекул разлитой жидкости, в данном случае, не учитывается, и ее энтропия остается высокой. В то же время, явный порядок в восстановленном стакане воды дает низкое значение энтропии. Все дело здесь в том, что с конфигурацией восстановленного и заполненного стакана воды совместимо относительно немного возможных движений частиц; в то время как движений, совместимых с конфигурацией слегка нагретой воды, протекающей между щелями в половицах, — существенно больше. Второе начало термодинамики гласит, что энтропия изолированной системы возрастает со временем (или остается неизменной в случае обратимых систем). Теперь становится очевидным, что мы совершенно правильно не рассматриваем скоординированное движение частиц как признак низкой энтропии, поскольку в этом случае «энтропия» системы, в соответствии с ее определением, всегда оставалась бы постоянной. Понятие энтропии должно быть связано только с явным беспорядком. Для системы, изолированной от всей остальной вселенной, ее полная энтропия возрастает, так что, если подобная система начинает свою эволюцию из состояния с некоторой явной упорядоченностью, то с течением времени этот порядок неизбежно разрушается и присущие ей особые свойства превращаются в «бесполезно» скоординированное движение частиц. Может показаться, что второе начало действует как некий предвестник упадка, поскольку оно утверждает существование безжалостного универсального физического принципа, напоминающего нам о том, что всякое упорядоченное состояние подвержено непрерывному разрушению. Позднее мы увидим, что это пессимистическое заключение справедливо не всегда!
Рис. 7.3. Гранулирование фазового пространства на области, соответствующие макроскопически неотличимым состояниям. Энтропия пропорциональна логарифму фазового объемав каждой из которых различные точки изображают физические системы, отличающиеся на микроскопическом уровне расположением и скоростями частиц, но которые при этом совершенно неразличимы с точки зрения макроскопического наблюдателя, для которого все точки любой такой конкретной области будут описывать одну и ту же физическую систему. Подобное разбиение фазового пространства на области называется гранулированием фазового пространства. После такого группирования некоторые из областей могут приобрести подавляюще огромные размеры по сравнению с другими областями. Рассмотрим, к примеру, фазовое пространство газа, заключенного в ящике. Наибольшая область фазового пространства будет приходиться на состояния, в которых частицы газа практически равномерно распределены по ящику с некоторым характерным распределением скоростей, обеспечивающим однородные давление и температуру. Это характерное распределение, в некотором смысле наиболее случайное из всех возможных, называется распределением Максвелла — по имени Джеймса Клерка Максвелла, которого мы уже упоминали ранее. В этом случае про газ говорят, что он находится в состоянии теплового равновесия. Подавляющая часть точек всего фазового пространства соответствует этому тепловому равновесию, и эти точки изображают всевозможные микроскопические значения координат и скоростей отдельных частиц, которые совместимы с состоянием теплового равновесия. Эта огромная часть является, конечно, только одной из многих областей нашего фазового пространства — но она оказывается (существенно) большей всех других областей, занимая практически все фазовое пространство! Рассмотрим теперь другое возможное состояние этого газа, скажем, такое, в котором весь газ собран в одном из углов ящика. В этом случае мы будем опять иметь целое множество различных микроскопических состояний, каждое из которых описывает газ сосредоточенным в углу ящика. Все эти состояния макроскопически неразличимы, и изображающие их точки фазового пространства заполняют в нем свою область. Однако объем этой области оказывается намного меньшим объема области для состояний теплового равновесия — примерно в раз (если ящик — это метровый куб, содержащий воздух при нормальных условиях, а область в углу — сантиметровый кубик)! Чтобы оценить различия в фазовых объемах, рассмотрим упрощенную ситуацию, в которой некоторое количество шаров распределено по большому числу ячеек. Предположим, что каждая ячейка может либо быть пустой, либо содержать один шар. Шары будут моделировать молекулы газа, а ячейки — различные положения молекул в ящике. Выделим небольшое подмножество ячеек, которое будем называть особым; оно будет соответствовать положению молекул газа в углу ящика. Для определенности условимся, что ровно 1/10 часть всех ячеек особая — т. е. в случае, когда имеется n особых ячеек, не особых будет ровно 9n (рис. 7.4).
Рис. 7.4. Модель газа в ящике: некоторое количество шаров распределено по значительно большему числу ячеек. Одна десятая часть ячеек отмечены как особые. Эти ячейки выделены в левом верхнем углуМы хотим теперь случайным образом распределить m шаров среди всех ячеек и найти вероятность того, что все шары окажутся в особых ячейках. В случае, когда имеется только один шар и десять ячеек (т. е. имеется только одна особая ячейка), эта вероятность, очевидно, равна одной десятой. Тот же результат получится в случае одного шара и любого числа 10n ячеек (т. е. в случае n особых ячеек). Таким образом, для газа, состоящего только из одного атома, особая область, соответствующая «газу, собранному в углу ящика», будет иметь фазовый объем, составляющий лишь одну десятую всего объема «фазового пространства». Однако, если мы увеличим число шаров, вероятность того, что все они соберутся в особых ячейках, существенно понизится. Скажем, для двух шаров с двадцатью ячейками (две из которых особые) (m = 2, n = 2)[170], вероятность равна 1/190; в случае ста ячеек (среди них — десять особых) (m = 2, n = 10) вероятность равна 1/110; а при неограниченном увеличении числа ячеек с сохранением доли особых вероятность будет стремиться к 1/100. Таким образом, в случае газа из двух атомов фазовый объем особой области составляет только одну сотую часть всего «фазового пространства». Для трех шаров и тридцати ячеек (m = 3, n = 3), он будет составлять 1/4060 всего фазового объема, а в пределе бесконечного числа ячеек — 1/1000 — т. е. для газа из трех атомов объем особой части будет составлять одну тысячную объема всего «фазового пространства». Для четырех шаров в пределе бесконечного числа ячеек вероятность становится равной 1/10000. Для пяти шаров — 1/100 000 и т. д. Для m шаров в пределе бесконечного числа ячеек вероятность стремится к 1/10m; т. е. для «газа» из m атомов фазовый объем особой области составляет только 1/10m от всего «фазового объема». (Этот результат остается справедливым, если учесть также и импульсы.) Мы можем применить теперь те же оценки к нашей ситуации с реальным газом в ящике, только в этом случае для особой области нам нужно вместо одной десятой взять одну миллионную (1/1000000) от общего объема ящика (т. е. отношение объемов одного кубического сантиметра и одного кубического метра). В результате, вместо значения 1/10m для вероятности обнаружить все частицы газа в особой области, мы получим 1/1 000000m, т. е. 1/106m. Для воздуха, взятого при нормальных условиях, в нашем ящике находилось бы около 1025 молекул, поэтому мы принимаем m = 1025. Таким образом, особая область фазового пространства, представляющая состояния, в которых весь газ сосредоточен в углу ящика, составляет только 1/1060 000 000 000 000 000 000 000 000 часть всего фазового пространства! Энтропия состояния — это мера объема V области фазового пространства, которая содержит все точки, представляющие данное состояние. Ввиду гигантской разницы между объемами, которую мы оценили выше, более удобным оказывается определять энтропию как величину, пропорциональную не самим объемам, а их логарифмам: энтропия = k log V. Использование логарифма делает все возникающие в расчетах числа более обозримыми. Так, к примеру, логарифм[171] 10000000 составляет всего-навсего число, близкое к 16. Величина k — константа, называемая постоянной Больцмана. Ее значение приблизительно равно 10-23 джоулей на один градус Кельвина. Одним из важнейших следствий использования логарифма в определении энтропии является ее аддитивность в случае независимых систем. Другими словами, полная энтропия двух независимых физических систем, рассматриваемых как одна система, равна сумме их энтропий. (Это и есть основное свойство логарифмической функции: log АВ = log А + log В. Если эти подсистемы находятся в состояниях, изображающихся областями с объемами А и В в соответствующих им фазовых пространствах, то объем фазового пространства для составной системы будет равен произведению их объемов АВ, поскольку каждое микроскопическое состояние одной системы должно быть независимо учтено вместе с каждым микроскопическим состоянием другой; и, следовательно, энтропия составной системы, очевидно, будет равна именно сумме энтропий отдельных систем.) Те гигантские отличия между размерами различных частей фазового пространства, о которых говорилось выше, в терминах энтропии будут выглядеть более скромно. Энтропия нашего кубического метра газа, как следует из предыдущих рассмотрений, оказывается всего на 1400 Дж/К (= 14k х 1025) больше энтропии того же газа, сосредоточенного в кубическом сантиметре «особой» области (так как составляет примерно 14 х 1025). Для того, чтобы определить реальные значения энтропии для указанных областей фазового пространства, нам осталось бы только немного позаботиться о выборе системы единиц (метры, джоули, килограммы, градусы Кельвина и т. д.). Однако, на самом деле, здесь было бы совсем неуместным заботиться об этом: для тех чудовищно огромных значений энтропии, которые я буду рассматривать в дальнейшем, выбор системы единиц не играет особой роли. Все же для определенности (и для специалистов), я скажу, что буду пользоваться так называемой естественной системой единиц, которая следует из законов квантовой механики и в которой постоянная Больцмана оказывается равной единице: k = 1.
Рис. 7.5. Второе начало термодинамики в действии: с течением времени точка фазового пространства попадает в области все больших и больших объемов. Следовательно, энтропия постоянно возрастаетВсякий раз, когда точка оказывается в очередном большем объеме, у нее практически нет никаких шансов вернуться в какой-либо из предыдущих объемов меньших размеров. В конце концов, она оказывается внутри области фазового пространства наибольшего объема, соответствующей тепловому равновесию. Этот объем занимает почти все фазовое пространство. И едва ли кто-то будет сомневаться в том, что наша точка фазового пространства в процессе своих случайных блужданий не вернется ни в какую из областей меньшего размера за любое разумное время. Можно также утверждать, что газ, достигнув состояния теплового равновесия, останется в нем практически навсегда. Мы видим, таким образом, что энтропия системы как логарифмическая мера ее фазового объема, должна так же монотонно возрастать с течением времени, как и сам фазовый объем[172]. Может показаться, что, наконец-то, мы обрели ключ к пониманию второго начала термодинамики! В самом деле, мы можем предположить, что наша точка фазового пространства движется совершенно хаотически, и, стартуя из некоторого крохотного объема фазового пространства, соответствующего малому значению энтропии, будет в дальнейшем с большой вероятностью попадать внутрь все больших и больших объемов, соответствующих все возрастающим значениям энтропии. Есть, однако, нечто странное в том выводе, к которому, похоже, мы пришли путем такого рассуждения. Похоже, мы пришли к выводу с явной асимметрией во времени. Если энтропия возрастает в прямом направлении времени, то, следовательно она должна убывать в обратном направлении. Но откуда взялась эта временна́я асимметрия? Мы абсолютно уверены в том, что не использовали в наших рассуждениях никаких несимметричных во времени законов и соображений. Эта временна́я асимметрия, на самом деле, является прямым следствием того обстоятельства, что наша система начала эволюционировать из особого (низкоэнтропийного) состояния, и наше наблюдение за ее последующей эволюцией выявило факт возрастания ее энтропии. Такое возрастание, конечно же, находится в полном соответствии с поведением систем в нашей реальной вселенной. Но мы могли бы с равным успехом применить те же самые рассуждения и для обратного направления времени. Именно, мы могли бы опять создать некоторое низкоэнтропийное состояние в начальный момент времени, но теперь задаться вопросом: какова наиболее вероятная последовательность состояний, предшествующих этому начальному состоянию? Попробуем теперь порассуждать в таком обратном направлении. Как и ранее, выберем в качестве низкоэнтропийного состояния газ, сосредоточенный в одном из углов ящика. В этом случае наша точка фазового пространства будет в начальный момент времени находиться в той же ничтожно малой области фазового пространства, что и ранее. Но теперь мы попробуем проследить за ее предыдущей историей. Если мы представим, что эта точка, также как и ранее, движется совершенно хаотично, мы обнаружим, по мере наблюдения за последовательностью ее прошлых состояний, что сначала она достигает того же значительно большего объема фазового пространства, что и ранее, соответствующего некоторой промежуточной стадии расширения не в состоянии теплового равновесия. Затем, проходя через последовательность областей с монотонно растущими и сильно отличающимися друг от друга объемами, в самом удаленном прошлом она попадает в тот самый наибольший объем, соответствующий тепловому равновесию. Теперь мы, очевидно, приходим к следующему наиболее вероятному сценарию предшествующей истории газа, сосредоточенного в некоторый момент времени в одном из углов ящика: находясь в состоянии теплового равновесия, газ начинает все больше и больше концентрироваться в направлении одного из углов ящика и, наконец, весь собирается в небольшом объеме в этом углу. Во время подобного процесса энтропия должна была бы убывать: ее начальное значение в тепловомравновесии велико, затем оно непрерывно падает до тех пор, пока не достигнет очень низких значений, соответствующих газу, собранному в небольшом объеме в углу ящика. Все это, конечно, имеет совсем мало общего с тем, что происходит в действительности в нашей вселенной! Энтропия никогда не убывает подобным образом; она возрастает. Если бы в некоторый момент времени газ действительно был бы сконцентрирован в одном из углов ящика, то, скорее всего, ранее, газ надежно удерживался в этом углу перегородкой, которую затем внезапно убрали. А может быть, газ удерживался там самопроизвольно, будучи охлажденным до температуры его твердого или жидкого состояния, а затем был очень быстро разогрет и, в результате, перешел в газообразную фазу. В любом случае, энтропия этих предшествующих состояний была бы даже еще ниже, чем исходного. Второе начало, несомненно, оставалось бы справедливым и в этих случаях, и энтропия бы все время возрастала — т. е. при обратном течении времени она бы, как нетрудно понять, убывала. Теперь мы отчетливо видим, что наше предыдущее рассуждение приводит нас к совершенно неправильному заключению о том, что наиболее вероятной предысторией газа, сконцентрированного в некоторый момент времени в углу ящика, была его эволюция из начального состояния теплового равновесия с монотонным убыванием энтропии вплоть до того момента, когда весь газ собрался в углу; в то время как в нашем реальном мире этот способ оказывается чрезвычайно маловероятным. В действительности, газ должен был начинать свою эволюцию из состояния с гораздо меньшим значением энтропии и энтропия должна была монотонно возрастать, проходя через все свои промежуточные значения вплоть до момента времени, когда весь газ соберется в углу. Таким образом, наши рассуждения, опирающиеся на свойства случайных блужданий точки в фазовом пространстве, оказываются вполне удовлетворительными, когда мы применяем их для предсказания будущей эволюции системы и совершенно неудовлетворительными для восстановления ее прошлой эволюции. Именно, мы получаем, что наиболее вероятным будущим газа, который начинает эволюционировать из угла ящика, будет его конечное состояние теплового равновесия, а не внезапное появление перегородки или внезапное замерзание или сжижение газа. Столь странные сценарии будущего как раз и могли бы послужить примерами процессов, протекающих с понижением энтропии, которые совершенно исключаются нашей трактовкой процессов в фазовом пространстве. Но в направлении прошлого, именно такие «странные» сценарии и могли бы иметь место и, более того, они совсем не выглядят странными. Наши рассуждения, связанные с представлением процессов в фазовом пространстве, дали нам совершенно неправильный ответ при попытке применить их к обратному направлению времени! Очевидно, все это бросает тень сомнения на наши исходные рассуждения. Получается, что мы не обрели никакого ключа к пониманию второго начала. Единственный достоверный вывод, который мы можем сделать из наших рассуждений, заключается в следующем: если фиксировано какое-либо начальное низкоэнтропийное состояние (скажем, газ, собранный в углу ящика), то в отсутствии каких-либо факторов, ограничивающих систему, следует ожидать возрастания энтропии в обоих направлениях времени по отношению к энтропии данного состояния (рис. 7.6).
Рис. 7.6. Если мы интерпретируем ситуацию, изображенную на рис. 7.5 в обратном направлении времени, мы «восстановим» такое прошлое, в котором энтропия должна возрастать от ее настоящего значения. Это катастрофически противоречит наблюдениямЭто утверждение не сработало в нашем случае в направлении прошлого именно из-за того, что подобные ограничения имелись. Безусловно существовало нечто, ограничивающее систему в прошлом. Это было что-то такое, что просто вынудило энтропию быть низкой в прошлом. Таким образом, стремление энтропии к возрастанию в будущем совсем неудивительно. Высокоэнтропийные состояния, в некотором смысле — состояния «естественные», которые не требуют какого-либо объяснения причин своего существования. Настоящей загадкой являются низкоэнтропийные состояния в прошлом. А что ограничивало наш мир и сделало его энтропию в прошлом столь низкой? Именно повсеместное присутствие состояний с ничтожно малой энтропией и есть самый удивительный факт той действительной вселенной, в которой мы живем, хотя такие состояния настолько привычны для нас, что мы, как правило, перестаем им удивляться. Мы сами представляем собой системы с пренебрежительно малой энтропией. Все вышеизложенные соображения подводят нас к мысли о том, что мы можем легко объяснить стремление энтропии увеличиваться с течением времени для системы, начинающей эволюцию из некоторого заданного низкоэнтропийного состояния. Но что действительно достойно удивления, так это тот факт, что энтропия оказывается монотонно убывающей по мере того, как мы продолжаем ее измерять во все более и более отдаленном прошлом этой системы!
Рис. 7.7. Так мы используем Солнце — раскаленный шар среди темноты космического пространстваТаким образом, Солнце служит для нас мощным источником низкой энтропии. Мы (благодаря упомянутой замечательной способности растений) это используем, выделяя некоторую небольшую ее часть и преобразуя ее в удивительные по своей сложности структуры наших организмов. Давайте теперь в общих чертах рассмотрим, что происходит с энергией и энтропией относительно Солнца и Земли. Солнце излучает энергию в виде фотонов видимого диапазона длин волн. Часть из них поглощается Землей, а затем переизлучается в виде фотонов инфракрасного диапазона. Решающее значение здесь имеет тот факт, что видимые фотоны имеют большую частоту, чем инфракрасные и, следовательно, большую энергию, приходящуюся на одну частицу. (Вспомните формулу Планка Е = hv, приведенную в гл.6 «Начало квантовой теории». Она как раз и говорит о том, что энергия фотона пропорциональна его частоте.) Так как одиночный видимый фотон обладает большей энергией, чем одиночный инфракрасный, то видимых фотонов, падающих на Землю, должно быть меньше, чем инфракрасных, испускаемых Землей, причем ровно настолько, чтобы соблюдался баланс между падающей и излученной энергиями. А значит, энергия, переизлучаемая Землей в окружающее пространство, распределяется по гораздо большему числу степеней свободы, чем энергия, получаемая Землей от Солнца. Из-за этого большого числа задействованных степеней свободы соответствующий объем в фазовом пространстве электромагнитного поля также оказывается значительно большим у переизлученных фотонов по сравнению с фазовым объемом падающих и, следовательно, энтропия системы фотонов после переизлучения существенно возрастает. Зеленые растения, потребляя энергию в низкоэнтропийной форме (сравнительно небольшого числа видимых фотонов) и переизлучая ее в высокоэнтропийной форме (сравнительно большого числа инфракрасных фотонов), одновременно обеспечивают себя необходимой низкой энтропией, а нас — жизненно необходимым разделением углерода и кислорода. И все это возможно благодаря тому, что Солнце — это горячее пятно на небе! Дело в том, что небо находится в термодинамически неравновесном состоянии: один его небольшой участок, а именно, тот, который и занимает Солнце, имеет температуру, намного превышающую температуру оставшейся его части. Благодаря этому мы и оказываемся обеспечены мощным источником низкой энтропии. Земля получает энергию от этого горячего пятна в низкоэнтропийной форме (немного фотонов) и переизлучает ее в холодные области неба в высокоэнтропийной форме (много фотонов). А почему Солнце является этим горячим пятном? Каким образом оно приобрело столь высокую температуру и затем смогло поддерживать низкоэнтропийные состояния других систем? Ответ заключается в том, что изначально оно образовалось из однородного газового облака (главным образом — водорода) посредством гравитационного сжатия. В ходе этого процесса, еще на ранних стадиях своего образования, Солнце разогрелось. Оно продолжало бы и далее сжиматься и разогреваться, если бы, при некоторых определенных давлении и температуре, в игру не вступил другой источник энергии негравитационной природы, а именно, термоядерные реакции: слияние ядер водорода в ядра гелия с выделением энергии. Без термоядерных реакций Солнце было бы намного горячее и меньше, чем сейчас, оставаясь таким до самого момента своей звездной смерти. Термоядерные реакции не дали Солнцу стать слишком горячим, приостановив его дальнейшее сжатие и стабилизировав температуру Солнца на том уровне, который оказался вполне пригоден для нашей жизни, одновременно продлив при этом период его свечения. Важно отметить, однако, что хотя термоядерные реакции и играют очень важную роль в происхождении и установлении количественных характеристик солнечной энергии, именно гравитация является здесь решающим фактором. (На самом деле, возможность термоядерных реакций дает существенный вклад в низкую энтропию Солнца, но учесть энтропию, обусловленную слиянием ядер весьма непросто, и детальное обсуждение этого вопроса только усложнило бы наши рассуждения, не изменяя окончательного вывода.)[173] Без гравитации Солнце вообще не могло бы существовать! Оно продолжало бы светить и без термоядерных реакций (хотя в этом случае его излучение было бы губительным для нас), но без гравитации оно не светило бы вообще, поскольку именно гравитационное взаимодействие связывает вещество Солнца и обеспечивает необходимые температуру и давление. Без гравитации вместо Солнца мы имели бы холодный и рассеянный газ — такой же «мертвый», как и остальное космическое пространство вокруг нас. Нам осталось обсудить вопрос об источнике низкой энтропии различных видов «природного топлива» на Земле; но суть и в этом случае остается прежней. В соответствии с общепринятыми взглядами, вся нефть (и природный газ) образовались из доисторической растительности. И снова растения оказываются источником низкой энтропии. Поскольку доисторическая растительность имела благодаря Солнцу низкую энтропию, то мы опять возвращаемся к гравитации, которая формирует Солнце из рассеянного газа. Существует интересная «альтернативная» теория происхождения нефти на Земле, выдвинутая Томасом Голдом, который оспаривает традиционный подход, утверждая, что доисторическая растительность не могла послужить источником такой гигантской массы гидрокарбонатов на Земле. Голд полагает, что нефть и природный газ были захвачены внутренностью Земли во время ее формирования, и с тех пор они непрерывно просачиваются наружу, накапливаясь в подземных пустотах и по сей день[174]. Согласно теории Голда, синтез нефти в любом случае должен был происходить под действием солнечного света, хотя на этот раз в космосе, прежде чем сформировалась Земля. Но и здесь за все отвечает Солнце, которое сформировала гравитация. А что можно сказать по поводу низкоэнтропийной ядерной энергии изотопа урана-235, который используется в ядерных реакторах? Она имеет своим источником не само Солнце (хотя вполне и могла быть связана с Солнцем на некоторой стадии), а какие-то другие звезды, которые взорвались много миллиардов лет назад во время вспышек сверхновых. В действительности, этот материал образовался в результате большого числа таких вспышек. Он рассеялся в пространстве после взрыва, часть его случайно соединилась (под воздействием Солнца) и обеспечила Землю тяжелыми элементами, включая и весь запас урана-235 на ней. Каждое ядро, с его низкоэнтропийным запасом энергии, возникло в результате грандиозного ядерного процесса, происходившего во время вспышки сверхновой. Этот взрыв, в свою очередь, был следствием гравитационного коллапса[175] звезды, которая была слишком массивна, чтобы сдерживать этот коллапс одними только силами теплового давления. После такого коллапса и последующего взрыва обычно остается только небольшое ядро — возможно, в виде так называемой нейтронной звезды (подробнее о них чуть позже!). Эта звезда должна была получиться в результате гравитационного сжатия рассеянного газового облака, и большая часть ее исходного вещества — включая и наш уран-235 — должна была быть выброшена обратно в космическое пространство. При этом, однако, благодаря гравитационному сжатию, в целом произошел колоссальный выигрыш в энтропии, заключенной в ядре оставшейся нейтронной звезды. И снова именно гравитация окончательно все расставила по местам, конденсируя (на последних этапах — стремительно) рассеянный газ в нейтронную звезду. Таким образом напрашивается вывод, что вся та удивительно низкая энтропия, которую мы обнаруживаем вокруг себя — и которая составляет наиболее загадочную сторону второго начала термодинамики — должна быть приписана тому, что огромный выигрыш в энтропии может быть получен в процессе гравитационного сжатия рассеянного газа в звезды. А откуда взялся весь этот рассеянный газ? Здесь для нас важно, что в самом начале этот газ был рассеянным, благодаря чему человечество было обеспечено огромным запасом низкой энтропии, которого нам хватало до сих пор и хватит еще на продолжительный период в будущем. Именно возможность собирания этого газа в гравитационные сгустки и дала нам второе начало термодинамики. Более того, эти сгустки не просто послужили основанием второго начала, но дали нечто намного более точное и определенное, чем простое утверждение: «Энтропия мира вначале была очень низкой». Ведь энтропия могла быть дана нам низкой и многими другими способами, например, в ранней вселенной мог бы иметь место космологический «явный порядок» совсем другого рода, чем тот, с которым мы сталкиваемся в действительности. (Представьте себе, что ранняя вселенная была бы правильным додекаэдром — как это могло видеться Платону — или имела бы какую-нибудь другую самую невероятную геометрическую форму. Это был бы, конечно, самый настоящий «явный порядок», но совсем не тот, который мы ожидали бы обнаружить в действительной ранней вселенной!) Мы должны разобраться в том, откуда взялся весь этот рассеянный газ, для чего нам необходимо обратиться к существующим космологическим теориям.
Рис. 7.8. Расширяющаяся вселенная очень напоминает поверхность надуваемого шара. Все галактики удаляются друг от другаПусть пятнышки на шаре изображают различные галактики, а сама двумерная поверхность шара — все трехмерное пространство вселенной. Ясно, что относительно произвольно выбранной точки на шаре все остальные точки удаляются. В этом смысле все точки шара равноправны. Точно так же, наблюдая из любой выбранной нами галактики, мы обнаружим изотропное удаление всех остальных галактик. Раздувающийся шар дает хорошее представление об одной из трех общепринятых моделей вселенной, называемых моделями Фридмана — Робертсона — Уокера (ФРУ), а именно: пространственно замкнутой ФРУ-модели с положительной кривизной. В двух других ФРУ-моделях (с нулевой и отрицательной кривизной) вселенная расширяется подобным же образом, но вместо пространства конечного объема, которое изображает шар, мы имеем бесконечную вселенную с бесчисленным множеством галактик. Из этих двух моделей наиболее проста для понимания модель с евклидовой пространственной геометрией, т. е. с нулевой кривизной. Будем изображать всю пространственную вселенную обычной плоскостью, на которой помечены точки, изображающие галактики. По мере эволюции вселенной во времени эти галактики одинаковым образом удаляются друг от друга. Попробуем представить развитие этого процесса в пространстве-времени. Там мы будем иметь совокупность различных «мгновенных» евклидовых плоскостей, сложенных в стопку, которая изображает всю вселенную сразу во всей ее пространственно-временно́й целостности (рис. 7.9).
Рис. 7.9. Пространственно-временна́я картина расширяющейся вселенной с евклидовыми пространственными сечениями (показаны только два пространственных измерения)Галактики теперь будут иметь вид некоторых кривых, называемых мировыми линиями историй галактик, и эти кривые будут расходиться друг от друга в направлении будущего. И снова все мировые линии галактик оказываются равноправными. В оставшейся ФРУ-модели с отрицательной кривизной в качестве пространственной геометрии берется неевклидова геометрия Лобачевского, которая подробно описана в главе 5 и проиллюстрирована картиной Эшера (рис. 5.2, Глава 5. «Евклидова геометрия»). Для построения полной пространственно-временно́й картины нам необходимо все «мгновенные» пространства Лобачевского расположить вплотную одно над другим в порядке их следования (рис. 7.10)[177].
Рис. 7.10. Пространственно-временна́я картина расширяющейся вселенной с пространственными сечениями Лобачевского (показаны только два пространственных измерения)Мировые линии галактик будут опять изображаться расходящимися в направлении будущего кривыми, причем все галактики и здесь оказываются совершенно равноправными. Конечно, при таком описании мы для большей наглядности изображаем не все четыре измерения, а показываем лишь трехмерное пространственно-временно́е сечение, убирая одно измерение (точно также, как мы это делали в главе 5 «Специальная теория относительности Эйнштейна и Пуанкаре»). Но даже и этого оказывается недостаточно, чтобы наглядно изобразить пространство-время положительной кривизны — необходимо убрать еще одно измерение! Сделаем это и изобразим замкнутое трехмерное пространство вселенной положительной кривизны (одномерной) окружностью, а не (двумерной) сферой, которой была поверхность шара. По мере расширения вселенной размер этой окружности растет и мы можем изобразить все пространство-время, накладывая одну окружность на другую (каждую — для своего момента времени) и получая в результате искривленный конус (рис. 7.11 а).
Рис. 7.11. а) Пространственно-временна́я картина расширяющейся вселенной со сферическими пространственными сечениями (показано только одно пространственное измерение); b) На конечной стадии вселенная испытывает большой коллапсИз уравнений Эйнштейна общей теории относительности следует, что такая замкнутая вселенная не может расширяться вечно. После того, как ее размер достигнет некоторого максимального, она начнет сжиматься и, в конце концов, сколлапсирует в точку, испытав при этом как бы большой взрыв наоборот (рис. 7.11b). Этот большой взрыв наоборот иногда называют большим коллапсом. Во ФРУ-моделях с отрицательной и нулевой кривизной вселенная уже не коллапсирует повторно. Вместо большого коллапса, она продолжает неограниченно расширяться. Так, во всяком случае, обстоит дело в стандартной общей теории относительности, в которой так называемая космологическая постоянная полагается равной нулю. Подбирая ненулевое значение этой космологической постоянной, можно получить или неограниченную вселенную, испытывающую большой коллапс, или конечную вселенную положительной кривизны, которая будет расширяться неопределенно долго. Присутствие космологической постоянной немного усложнило бы дальнейшее обсуждение, но в контексте нашей темы не существенно. Для простоты я буду полагать космологическую постоянную просто равной нулю[178]. На момент написания этой книги эмпирические данные свидетельствуют о том, что космологическая постоянная должна быть очень малой, и согласуются с ее нулевым значением. (Более подробно о космологических моделях см. Риндлер [1977].) К сожалению, имеющиеся данные наблюдений не выделяют определенно ту или иную космологическую модель (равно как ничего не говорят и о том, каков будет эффект малой космологической постоянной в случае, если она отлична от нуля). С другой стороны, кажется, что эти данные свидетельствуют скорее об отрицательной пространственной кривизне вселенной (с геометрией Лобачевского на больших масштабах); и о том, что Вселенная будет продолжать расширяться неограниченно долго. Основанием для такого вывода служит, главным образом, то количество видимого вещества во вселенной, которое доступно непосредственным наблюдениям. Однако в пространстве может оказаться рассеянным и огромное количество невидимой материи, в случае чего вселенная будет обладать положительной кривизной и может в конце своей эволюции испытать большой коллапс, хотя это произойдет за промежуток времени, намного превосходящий 1010 лет — время существования Вселенной. Чтобы такой коллапс стал возможным, распределенного по пространству невидимого вещества — так называемой «темной материи» — должно быть раз в тридцать больше того количества видимой материи, которую мы наблюдаем в телескопы. Имеются надежные косвенные свидетельства в пользу того, что значительное количество темной материи все же присутствует, но вот достаточно ли ее, чтобы гравитационно замкнуть вселенную (или хотя бы сделать ее плоской) — привести ее к коллапсу — однозначного ответа на этот вопрос пока еще не получено.
Действительно, в самом начале протошар пребывал в тепловом равновесии, но вселенная в то время была совсем маленькой. Этот протошар находился в состоянии с максимумом энтропии, разрешенной для вселенной с крошечными размерами, но такая энтропия оказалась бы совершенно ничтожной по сравнению с энтропией, разрешенной для вселенной с ее сегодняшними размерами. По мере расширения вселенной, соответствующий максимум энтропии также возрастал с увеличением размеров вселенной, но реальное значение энтропии вселенной сильно отставало от этого максимума. Следовательно, второе начало появляется благодаря тому, что реальная энтропия всегда пытается догнать свой разрешенный максимум.Однако, небольшой анализ показывает, что такое объяснение не может быть правильным. Если бы оно было верным, то в случае (пространственно замкнутой) вселенной, которая испытывает в конце большой коллапс, это объяснение можно было бы применить снова в обратном направлении времени. Когда вселенная снова достигнет крошечных размеров, для максимума ее энтропии снова будет очень низкий потолок. То же самое рассуждение, благодаря которому мы получили низкую энтропию на ранних этапах расширяющейся вселенной, должно быть применено на конечных этапах существования сжимающейся вселенной. Именно некоторый предел на низкую энтропию в «начале времен» был тем, что дало нам второе начало, согласно которому энтропия вселенной возрастает со временем. Но если тот же самый предел должен быть применен и в «конце времен», то мы бы обнаружили вопиющее несоответствие со вторым началом. Конечно, не исключено, что наша действительная вселенная никогда не будет сжиматься подобным образом. Возможно, что мы живем во вселенной с нулевой средней пространственной кривизной (Евклидов случай), или с отрицательной кривизной (случай Лобачевского). Или может оказаться, что мы живем во вселенной (с положительной кривизной), которая обречена на схлопывание, но оно будет иметь место в столь отдаленном будущем, что никакие отклонения от второго начала в настоящий момент нам еще не видны, несмотря на то, что, вообще говоря, вся энтропия вселенной должна будет в некоторый момент времени начать уменьшаться до чрезвычайно малых величин, и второе начало — в том смысле, в котором мы понимаем его сегодня — будет сильно нарушено. На самом деле, имеются веские основания сомневаться в подобной смене энтропии в сжимающейся вселенной. Самые убедительные из них связаны с загадочными объектами, именуемыми черными дырами. На примере черной дыры мы имеем микрокосмос сжимающейся вселенной, поэтому, если бы смена энтропии в такой вселенной действительно имела бы место, то в окрестности черной дыры должно было бы наблюдаться нарушение второго начала. Есть, однако, все основания полагать, что второе начало имеет прочную власть и над черными дырами. В процессе нашего обсуждения энтропии нам не удастся избежать вопросов, связанных с теорией черных дыр, поэтому нам просто необходимо познакомиться с этими странными объектами поближе.
Рис. 7.12. Красный гигант с белым карликом в своей сердцевинеСами по себе белыекарлики — это самые настоящие звезды, вещество которых, правда, спрессовано до такой степени, что теннисный шарик, заполненный им, весил бы несколько сотен тонн! Их число на небосводе довольно велико: примерно десять процентов всех светящихся звезд Млечного Пути приходится на белые карлики. Самый знаменитый из них — спутник Сириуса, чья невообразимо высокая плотность представляла большую загадку для наблюдательной астрономии в начале XX века. Однако позже именно эта звезда превосходным образом подтвердила справедливость физической теории (выдвинутой P. X. Фаулером примерно в 1926 году), согласно которой некоторые звезды и в самом деле могут обладать колоссальной плотностью, при которой они удерживаются в равновесии «давлением электронного вырождения». Это означает, что от гравитационного коллапса такую звезду спасает только квантовомеханический принцип запрета Паули (гл.5 «Многочастичные системы» примеч.163), примененный к электронам. Любой красный гигант имеет ядро в виде белого карлика, и это ядро постоянно затягивает в себя вещество из основного тела звезды. В конце концов, красный гигант будет целиком поглощен своим ядром-паразитом и в результате останется самый настоящий белый карлик размером с Землю. Что касается нашего Солнца, то оно будет находиться в стадии красного гиганта «всего лишь» несколько миллиардов лет. После этого, в своем последнем «видимом» воплощении, Солнце станет похожим на тлеющие и медленно остывающие угли[180] белого карлика, и просуществует еще несколько миллиардов лет до тех пор, пока окончательно не превратится в совершенно невидимый черный карлик. Далеко не все звезды повторяют судьбу Солнца. У некоторых из них жизненный путь имеет гораздо более бурный характер и определяется так называемым пределом Чандрасекара: максимально возможной массой белого карлика. Согласно вычислениям, проведенным еще в 1929 году Субраманьяном Чандрасекаром, белые карлики не могут существовать, если их масса превышает шесть пятых массы Солнца! (В то время он был еще совсем молодым индийским студентом, и свои вычисления делал во время морского путешествия из Индии в Англию.) Затем, где-то в 1930 году, эти вычисления были проделаны (независимо) еще раз советским теоретиком Львом Давидовичем Ландау. Современное уточненное значение предела Чандрасекара составляет примерно 1,4 Mο где Мο — масса Солнца. Заметим, что предел Чандрасекара совсем ненамного превосходит солнечную массу, и в то же время известно множество звезд, обладающих значительно бо́льшими массами. А как сложится судьба звезды, обладающей массой, скажем, 2Мο? В соответствии с принятой теорией, такая звезда будет так же раздуваться и превратится в красный гигант, а ее ядро — белый карлик — будет постепенно набирать свою массу, — т. е. в точности так, как было описано выше. Однако, в некоторый критический момент, это ядро достигнет предела Чандрасекара, и принцип запрета Паули уже не сможет обеспечить давление, необходимое для компенсации чудовищных сил гравитации[181]. Примерно в этот момент ядро начнет катастрофически коллапсировать внутрь, что приведет, в свою очередь, к значительному повышению давления и температуры. Начнутся интенсивные ядерные реакции, и колоссальное количество энергии выделится из ядра в виде нейтрино. Они разогреют внешнюю оболочку коллапсирующей звезды, а затем последует грандиозный взрыв. Звезда превратится в сверхновую! А что произойдет далее со все еще коллапсирующим ядром? Теория утверждает, что оно достигнет таких немыслимых плотностей, которые намного превосходят даже плотность белого карлика. Тогда коллапс ядра остановится и оно станет нейтронной звездой (см. выше «Источник низкой энтропии во Вселенной»), в которой теперь уже давление нейтронного вырождения (т. е. принцип Паули, примененный к нейтронам) будет удерживать ее в равновесии. Ее плотность такова, что теннисный мячик, сделанный из вещества нейтронной звезды, весил бы как астероид Гермес (или как марсианская луна Демос). Такую плотность имеет само ядерное вещество! (По сути дела, можно сказать, что нейтронная звезда представляет собой гигантское атомное ядро, радиусом с десяток километров, что, впрочем, совсем немного по звездным меркам!) Но здесь вступает в силу новый предел, аналогичный пределу Чандрасекара (и называемый пределом Ландау-Оппенгеймера-Волкова), который приближенно (по уточненным современным данным) составляет 2,5 Мο, и по превышении которого равновесие нейтронной звезды невозможно. А что случится с коллапсирующим ядром, если масса исходной звезды будет настолько велика, что даже и этот предел будет превышен? Кстати говоря, известно много звезд, масса которых заключена в пределах от 10Мο до 100 Mο. Маловероятно, что все они в процессе взрыва сверхновой сбрасывают столь большую массу, что ядро-остаток неизменно оказывается с массой ниже верхнего предела для нейтронной звезды. Вместо этого мы, скорее всего, получим черную дыру. Что же такое черная дыра? Это — область пространства (или пространства-времени), в пределах которой гравитационное поле настолько сильно, что даже свет не способен вырваться из нее. Вспомним, что в силу принципа относительности скорость света является предельной: ни один материальный объект или сигнал не может превысить ее локальное значение (Глава 5. «Специальная теория относительности Эйнштейна и Пуанкаре»). Следовательно, если даже свет не может вырваться из черной дыры, то из нее не сможет выбраться наружу вообще ничего. Читатель, возможно, знаком с понятием второй космической скорости. Это та минимальная начальная скорость, которую должен иметь объект, чтобы он мог удалиться от некоторого массивного тела на сколь угодно большое расстояние. Пусть массивное тело — это Земля, тогда вторая космическая скорость для нее будет составлять примерно 40000 км/ч (километров в час). Камень, брошенный с земной поверхности (в любом направлении) со скоростью, превышающей это значение, навсегда покинет Землю (мы, конечно, пренебрегаем силами сопротивления земной атмосферы). Если же камень бросить со скоростью, меньшей этого значения, он упадет обратно на Землю. (Поэтому неверно утверждение, что «все брошенное вверх, обязательно упадет вниз»; это будет справедливым только в том случае, когда скорость бросания меньше второй космической!) Для Юпитера вторая космическая скорость равна 220 000 км/ч; а для Солнца она будет составлять уже 2 200 000 км/ч. Теперь представим себе, что вся солнечная масса оказалась сосредоточенной в сфере радиуса в одну четверть от его истинного значения. В этом случае вторая космическая скорость увеличится в два раза по сравнению с исходным значением. А если бы вся масса Солнца оказалась сосредоточенной в еще меньшем объеме, скажем, внутри сферы радиуса в одну сотую от его истинного значения, вторая космическая скорость увеличилась бы в десять раз. Мы можем представить себе, таким образом, достаточно массивное тело малых размеров, для которого вторая космическая скорость превышает даже скорость света! Когда это происходит в действительности, мы и имеем черную дыру[182]
Рис. 7.13. Пространственно-временна́я диаграмма, демонстрирующая коллапс в черную дыру. Шварцшильдовский радиус обозначен как «горизонт»На рис. 7.13 я изобразил пространственно-временну́ю диаграмму, показывающую коллапс тела, который приводит к образованию черной дыры (для простоты я предположил, что в процессе коллапса сохраняется сферическая симметрия тела и убрал одно пространственное измерение). На рисунке изображены также световые конусы, которые, как мы помним из обсуждения общей теории относительности в главе 5 (см. Глава 5. «Общая теория относительности Эйнштейна» рис. 5.29), абсолютным образом ограничивают допустимые движения тел и распространение сигналов. Заметим, что эти конусы начинают немного наклоняться внутрь и чем ближе к центру, тем этот наклон становится более и более значительным. Существует некоторое критическое расстояние от центра, называемое шварцшильдовским радиусом, на котором внешние границы конусов становятся вертикальными на приведенной диаграмме. Здесь свет (который по определению должен двигаться по световому конусу) как бы зависает над коллапсирующим телом, а составляющей скорости света, направленной наружу, едва-едва хватает на то, чтобы противодействовать гигантским силам притяжения. Та трехмерная поверхность, которая вычерчивается зависшим светом на шварцшильдовском радиусе (т. е. вся световая история) носит название (абсолютного) горизонта событий черной дыры. Все, что находится внутри горизонта событий, не может выйти наружу и даже не может иметь какой-либо связи с внешним миром. Это заключение является прямым следствием наклона конусов и того фундаментального факта, что возможное движения и распространение сигналов может осуществляться только внутри (или вдоль) этих конусов. Черная дыра, образовавшаяся из начальной звезды массой, равной нескольким массам солнца, будет иметь горизонт радиусом несколько километров. Есть некоторые основания предполагать, что в центрах галактик могут находиться черные дыры гораздо больших масс и размеров. Наша собственная Галактика, которую мы наблюдаем на небе как Млечный Путь, вполне может содержать черную дыру, имеющую массу около миллиона солнечных масс и, следовательно, радиус горизонта — несколько миллионов километров. Реальное материальное тело, которое коллапсирует с образованием черной дыры, в конце концов, целиком окажется внутри своего горизонта и, следовательно, потеряет всякую связь с внешним миром. Далее мы в общих чертах проследим вероятную судьбу этого тела, а в данный момент для нас будет представлять интерес только геометрия пространства-времени, порожденная этим коллапсом, которая приводит к весьма любопытным следствиям. Вообразим, что некий отважный (а, может быть, безрассудный?) астронавт В собрался совершить путешествие в нутро большой черной дыры, а его менее смелый (а, может быть, просто более осторожный?) коллега А остается при этом за пределами горизонта событий. Предположим, что А намеревается держать В в поле своего зрения до тех пор, пока это в принципе возможно. Что же увидит А? Глядя на рис. 7.13, нетрудно сообразить, что ту часть истории В (т. е. мировой линии В), которая лежит внутри горизонта, А не увидит никогда, в то время как часть, лежащую снаружи горизонта, А рано или поздно увидит целиком, хотя те точки истории В, которые непосредственно предшествуют моменту его прохождения через горизонт, будут наблюдаться А спустя все большее и большее время ожидания. Пусть В проходит горизонт в тот момент, когда его собственные часы показывают 12 часов. Само это событие А не зафиксирует никогда, но события, соответствующие показаниям часов А будет наблюдать совершенно определенно (причем через приблизительно равные интервалы времени по показаниям часов А). В принципе, В будет все время находиться в поле зрения А как бы навечно зависшим над горизонтом черной дыры, а часы В будут отсчитывать время все медленнее и медленнее по мере приближения к роковой отметке 12:00, но никогда не покажут этого значения. Но, в действительности, образ В, который видит А, очень быстро станет неясным и трудноразличимым. Это происходит потому, что образ В, который будет наблюдать А в течение всего оставшегося времени наблюдения, будет формироваться лишь светом, испущенным из того крошечного участка мировой линии В, который непосредственно примыкает извне к горизонту. В результате В просто исчезнет из поля зрения А, и то же самое окажется верным и для исходного коллапсирующего тела. Все, что увидит А, будет выглядеть, в конце концов, действительно как какая-то «черная дыра»! А что можно сказать о несчастном В? Каковы будут его ощущения? Необходимо сразу же подчеркнуть, что в момент пересечения горизонта с В ничего особенного не произойдет. Он смотрит на свои часы около 12 и видит, что минута за минутой следуют обычным порядком: 11: 57, 11: 58, 11: 59, 12: 00, 12: 01, 12: 02, 12: 03… Промежуток времени около 12: 00 не содержит ничего необычного. В может обернуться, посмотреть на А и убедиться, что А все время остается в поле его зрения. В может также посмотреть на часы А и также убедиться, что для него они идут обычным образом. Таким образом, В никак не может узнать о своем пересечении горизонта, если только не проделает для этого специальных расчетов[183]. Горизонт оказался предельно коварным! После пересечения горизонта, у В уже не остается никаких шансов выйти наружу. Он обнаружит, что окружающая его часть вселенной сжимается, и что довольно скоро ему предстоит испытать свой собственный «большой коллапс»! А может быть, и не только его собственное. Все вещество того первоначального тела, из которого образовалась черная дыра, будет, в некотором смысле, разделять судьбу В и испытывать такой же коллапс. Более того: в случае, если вселенная снаружи дыры пространственно замкнута, так что вся внешняя материя тоже оказывается вовлеченной в глобальный большой коллапс, то этот коллапс должен оказаться, в определенном смысле, «тем же самым», что и «собственный» коллапс В[184]. Но несмотря на столь безрадостный конец В, физика, с которой он будет иметь дело вплоть до гибельной точки, будет той самой, которую мы с вами хорошо знаем и понимаем. В частности, нет никаких оснований предполагать нарушение второго начала термодинамики, тем более предполагать, что полностью обратится монотонный рост энтропии. Второе начало будет действовать внутри черной дыры точно также, как и везде. Энтропия в окрестности В будет продолжать возрастать, вплоть до самого момента его окончательного коллапса. Чтобы разобраться, каким образом энтропия «большого коллапса» («собственного» или «всеохватывающего») может быть чрезвычайно высокой, в то время как энтропия большого взрыва может оказаться при этом намного меньше, нам следует немного глубже вникнуть в свойства геометрии пространства-времени черной дыры. Перед тем, как мы этим займемся, читатель должен взглянуть на рис. 7.14, на котором показано гипотетическое временно́е обращение черной дыры, называемое белой дырой.
Рис. 7.14. Гипотетическая пространственно-временна́я конфигурация: белая дыра, эволюция которой приводит к расширяющейся материи (эта ситуация является обращением во времени рис. 7.13)(Скорее всего, белых дыр в природе не существует, но их теоретическая возможность будет иметь для нас большое значение в дальнейшем.)
Рис. 7.15. Приливное воздействие, оказываемое сферическим притягивающим телом, возрастает по мере того, как другое тело приближается к нему, по закону обратного куба расстояния между центрами телНарастающее приливное воздействие подобного рода будет ощущаться и астронавтом В по мере его падения на черную дыру и последующего движения внутри нее. Черные дыры с массой, равной нескольким солнечным, оказывали бы столь большое приливное воздействие, что космонавт не выдержал бы даже незначительного приближения к горизонту, не говоря уже о его пересечении. Для больших дыр величина приливного воздействия на горизонте может оказаться существенно меньше. Для черных дыр с массой в миллион солнечных, одна из которых, как предполагают астрономы, находится в центре нашей Галактики — Млечного Пути, — приливное воздействие на горизонте, испытываемое астронавтом, было бы ничтожно малым, так что он, в худшем случае, ощутил бы лишь небольшой дискомфорт. Однако, это приливное воздействие менялось бы по мере дальнейшего падения астронавта внутри дыры, так что за какие-то секунды оно достигло бы, в конце концов, бесконечной величины! И не только тело бедного астронавта оказалось бы разорванным на кусочки этой очень быстро возрастающей приливной силой, но, как в ускоренном кино, оказались бы разорванными и молекулы, из которых это тело состоит, потом составляющие эти молекулы атомы, их ядра, и, в конце концов, вообще все какие только есть субатомные частицы! Таким образом, «коллапс» разрушает все до основания. При этом разрушается не только материя, но даже и само пространство-время прекращает свое существование. Такая окончательная катастрофа называется пространственно-временно́й сингулярностью. Читатель, конечно, может задаться справедливым вопросом, откуда мы знаем, что подобные катастрофы должны иметь место, и при каких обстоятельствах материю и пространство-время ожидает такая судьба. Вывод о неизбежности пространственно-временно́й сингулярности следует из классических уравнений общей теории относительности и оказывается справедливым при любых условиях, в которых находится уже сформировавшаяся черная дыра. Первоначальная модель Оппенгеймера и Снайдера (Оппенгеймер, Снайдер [1939]) как раз и демонстрировала поведение подобного типа. Долгое время, однако, астрофизики питали надежду, что такое сингулярное поведение является артефактом специальной симметрии, которая допускалась в этой модели с самого начала. Предполагалось, что в реалистичном (асимметричном) случае коллапсирующая материя могла бы скручиваться каким-то другим способом, а затем снова вырываться наружу. Но эти надежды исчезли после того, как было проведено математическое исследование более общего характера, которое послужило основой для формулировки так называемых теорем о сингулярности (см. Пенроуз [1965]; Хокинг, Пенроуз [1970]). Эти теоремы утверждали, что в рамках классической общей теории относительности с разумными источниками гравитации, пространственно-временны́е сингулярности неизбежны в случае гравитационного коллапса. Таким же образом, меняя направление времени, мы приходим к выводу о неизбежности соответствующей начальной пространственно-временно́й сингулярности, которую мы теперь представляем как Большой взрыв, в любой (надлежащим образом) расширяющейся вселенной. Только теперь, вместо окончательного разрушения пространства-времени и материи, эта сингулярность представляет собой рождение пространства-времени и материи. Может показаться, что имеется полная временна́я симметрия между этими двумя типами сингулярностей: начальным типом, при котором пространство-время и материя рождаются, и конечным типом, когда пространство-время и материя уничтожаются. Конечно, между этими двумя ситуациями действительно имеется важная аналогия, но исследуя их более детально, мы обнаружим, что они не являются точными копиями, обращенными во времени относительно друг друга. И для нас важно разобраться в тех различиях геометрического характера, которые имеются между ними, поскольку именно они оказываются ключевыми в понимании источника второго начала термодинамики! Обратимся к наблюдениям нашего астронавта В, который отважился на самопожертвование ради науки. Он наблюдает приливные силы, которые очень быстро возрастают до бесконечности. Поскольку он путешествует в пустом пространстве, то он ощущает деформирующие эффекты, которые оставляют величины объемов неизменными и которые создаются частью тензора пространственно-временно́й кривизны, обозначенной мною как ВЕЙЛЬ (см. главу 5, «Общая теория относительности Эйнштейна»). Другая часть тензора пространственно-временно́й кривизны, отвечающая за общее изменение объемов и называемая РИЧЧИ, обращается в нуль в пустом пространстве. Может оказаться, что В все же встретится с какой-нибудь материей в некоторый момент, но даже если это действительно произойдет (ведь, в конце концов, и сам астронавт состоит из материальных частиц), мы, вообще говоря, все равно обнаружим, что величина ВЕЙЛЬ будет намного превосходить величину РИЧЧИ. Таким образом, значение кривизны вблизи конечной сингулярности полностью определяется поведением тензора ВЕЙЛЬ. Этот тензор, вообще говоря, стремится к бесконечности: ВЕЙЛЬ → ∞ (хотя это стремление может иметь осциллирующий характер). Эта ситуация оказывается типичной для пространственно-временной сингулярности[185]. Такое поведение связано с высокоэнтропийной сингулярностью. Однако в случае Большого взрыва, ситуация оказывается совершенно другой. Стандартная модель Большого взрыва выводится из рассмотренных нами ранее вселенных Фридмана-Робертсона-Уокера, обладающих высокой степенью симметрии. Здесь деформирующее приливное воздействие, связанное с тензором ВЕЙЛЬ, вообще отсутствует. Вместо него теперь имеется направленное внутрь симметричное ускорение, действующее на любую сферическую поверхность, состоящую из пробных частиц (см. рис. 5.26). Но это — результат воздействия тензора РИЧЧИ, а не тензора ВЕЙЛЬ. В любой ФРУ-модели всегда имеет место тензорное уравнение: ВЕЙЛЬ = 0. По мере того, как мы приближаемся к начальной сингулярности все ближе и ближе, мы обнаруживаем, что именно РИЧЧИ, а не ВЕЙЛЬ, становится бесконечным и, таким образом, именно РИЧЧИ, а не ВЕЙЛЬ, определяет начальную сингулярность. Значит, мы имеем дело с низкоэнтропийной сингулярностью. Если мы исследуем сингулярность схлопывания в точной коллапсирующей ФРУ-модели, мы и здесь обнаружим, что в момент схлопывания ВЕЙЛЬ = 0, тогда как РИЧЧИ стремится к бесконечности. Однако, эта особая ситуация дает нам совсем не то, что мы ожидаем от более реалистичной модели, в которой учитывается также и гравитационная конденсация. С течением времени вещество, находящееся первоначально в виде рассеянного газа, будет конденсироваться в звездные галактики. В этом процессе большое число звезд испытают гравитационное сжатие и превратятся в белые карлики, нейтронные звезды и черные дыры, а также в гигантские черные дыры, которые вполне могут образоваться в центрах галактик. Такого рода конденсация — особенно в случае черных дыр — связана с огромным возрастанием энтропии (рис. 7.16).
Рис. 7.16. Для обычного газа повышение энтропии связано с увеличением степени однородности его распределения внутри ящика. Для гравитирующих систем имеет место обратная ситуация. Высокая энтропия соответствует гравитационному конденсату, а максимальная — образованию черной дырыМожет показаться странным, на первый взгляд, что конденсированные состояния дают большую энтропию, чем состояния с однородным распределением, особенно если вспомнить, что для газа в ящике его конденсированные состояния (например, случай, когда весь газ собирается в одном из углов ящика) имели низкую энтропию, в то время как однородное распределение, соответствующее тепловому равновесию — имело высокую энтропию. При учете гравитации ситуация меняется на обратную благодаря универсальности гравитационного притяжения. С течением времени, конденсация становится все более и более сильной и, в конце концов, множество сконденсировавшихся черных дыр соединяет свои сингулярности в финальной сингулярности большого коллапса. Такая конечная сингулярность не имеет ничего общего с тем идеализированным большим коллапсом, который имеет место в коллапсирующей ФРУ-модели, где действовало ограничение ВЕЙЛЬ = 0. По мере накопления числа сконденсировавшихся объектов, тензор ВЕЙЛЬ имеет тенденцию непрерывно увеличиваться[186] и, вообще говоря, ВЕЙЛЬ → ∞ в конечной сингулярности. Посмотрите на рис. 7.17, где показана полная история замкнутой вселенной в соответствии с этой общей картиной.
Рис, 7.17. Полная история замкнутой вселенной, которая начинается с однородного низкоэнтропийного большого взрыва с ограничением ВЕЙЛЬ = 0 и заканчивается высокоэнтропийным большим коллапсом — представляющим собой сгущение большого числа черных дыр — с условием ВЕЙЛЬ → ∞Мы видим теперь, как становится возможной ситуация, когда сжимающаяся вселенная может не обладать низкой энтропией. Та «малость» энтропии Большого взрыва, которая обеспечивает нам выполнение второго начала, не была, таким образом, следствием одной только «малости» вселенной в момент взрыва! Если бы мы обратили во времени картину большого коллапса, к которой только что пришли, мы бы получили «большой взрыв» с чрезвычайно высокой энтропией, где не было бы второго начала! По некоторым причинам, вселенная возникла в особом (низкоэнтропийном) состоянии, на которое было наложено условие типа ВЕЙЛЬ = 0 для ФРУ-моделей. И если бы подобного рода ограничение не имело места, то «намного более вероятной» могла бы оказаться ситуация, в которой как начальная, так и конечная сингулярности были бы высокоэнтропийного типа ВЕЙЛЬ → ∞ (рис. 7.18).
Рис. 7.18. Если убрать ограничение ВЕЙЛЬ = 0, то большой взрыв получится тоже высокоэнтропийным, с условием ВЕЙЛЬ → ∞. Такая вселенная была бы сплошь испещрена белыми дырами и в ней не выполнялось бы второе начало термодинамики — в полном противоречии с нашим опытомВ такой гипотетической вселенной, конечно же, не нашлось бы места для второго начала термодинамики!
Рис. 7.19. Для сотворения вселенной, близкой по своим свойствам к той, в которой мы живем, Творец ограничивает свой выбор исчезающе малым объемом в фазовом пространстве возможных вселенных, в рассматриваемом случае — всего около объема всего пространства. (Этот объем и нацеленная на него булавка показаны без соблюдения масштабов!)Каждое положение булавки соответствует творению особой вселенной. Точность, с которой Творец создает какую-либо вселенную, напрямую связана с энтропией этой вселенной. Создать вселенную с высокой энтропией было бы относительно «легко», поскольку в этом случае в распоряжении Творца имеется большой объем фазового пространства, в который надо указать булавкой. (Напомним, что энтропия пропорциональна логарифму объема соответствующего фазового пространства.) Но чтобы создать вселенную в состоянии с низкой энтропией — так, чтобы в ней выполнялось второе начало термодинамики, — Творец должен направить булавку в гораздо меньший объем фазового пространства. Насколько малым должен быть этот объем, чтобы в результате творения получилась вселенная, напоминающая по своим свойствам ту, в которой мы живем? Для ответа на этот вопрос, мы должны обратиться к замечательной формуле, выведенной Якобом Бекенштейном [1972] и Стивеном Хокингом [1975], которая говорит о том, чему должна быть равна энтропия черной дыры. Рассмотрим черную дыру и допустим, что площадь ее горизонта есть А. Формула Хокинга-Бекенштейна для энтропии черной дыры гласит: где k — константа Больцмана, с — скорость света, G — ньютоновская гравитационная постоянная и ħ — постоянная Планка, деленная на 2π. Самая существенная часть этой формулы заключена во множителе А/4. Часть, стоящая в скобках, содержит только необходимые для соблюдения размерности физические константы. Таким образом, энтропия черной дыры оказывается пропорциональной площади ее поверхности. Для сферически симметричной черной дыры эта площадь оказывается пропорциональной квадрату массы этой дыры: Объединяя это с формулой Бекенштейна — Хокинга, мы получаем, что энтропия черной дыры пропорциональна квадрату ее массы: Таким образом, энтропия, приходящаяся на единицу массы (Sч.д./m) черной дыры, пропорциональна ее массе и оказывается тем больше, чем больше черная дыра. Следовательно, для заданной массы или, эквивалентно, — согласно формуле Эйнштейна Е = mc2, — для заданной энергии, наибольшая энтропия достигается тогда, когда вся материя сколлапсирует в черную дыру! Более того, энтропия системы двух черных дыр существенно возрастает, когда эти дыры сливаются в одну! Гигантские черные дыры, типа тех, которые, как полагают, находятся в центрах галактик, заключают в себе колоссальное количество энтропии — намного превосходящее те ее значения, которые встречаются в других физических ситуациях. Утверждение о том, что максимум энтропии достигается при коллапсе всей массы в черную дыру, требует небольшого пояснения. Анализ термодинамики черных дыр, проведенный Хокингом, показывает, что с любой черной дырой можно связать некоторую ненулевую температуру. Одним из следствий этого является тот факт, что в состоянии с максимальной энтропией в черной дыре не может быть заключена вся масса-энергия; максимум энтропии достигается, когда черная дыра приходит в тепловое равновесие с «тепловым резервуаром излучения». Температура этого излучения оказывается действительно ничтожной для черных дыр с любым разумным размером. Так, к примеру, для черной дыры с массой порядка массы Солнца эта температура оказалась бы равной примерно 10 -7 К, что значительно ниже температур, достигнутых в настоящее время в лабораториях, и намного меньше температуры 2,7 К межгалактического пространства. Для черных дыр больших размеров температура Хокинга оказывается еще меньшей! Эта температура могла бы оказаться существенной для нашего обсуждения только в том случае, если либо (а) во вселенной существуют намного меньшие черные дыры, которые называют черными мини-дырами; либо (б) вселенная не успеет полностью сколлапсировать за время, меньшее хокинговского времени испарения — времени, за которое черная дыра полностью испаряется. Относительно (а) надо заметить, что черные мини-дыры могут возникнуть лишь в случае особенно хаотичного Большого взрыва. В нашей вселенной их не может быть очень много, в противном случае они бы уже как-то проявили бы себя; более того, согласно излагаемой мной здесь точки зрения, их вообще не должно быть. Что же касается (б), то для черной дыры с солнечной массой хокинговское время испарения имело бы величину, превосходящую нынешний возраст вселенной где-то в 1054; а для черных дыр бо́льших размеров оно оказалось бы еще более продолжительным. Таким образом, вряд ли эффект испарения может существенно изменить наши предыдущие рассуждения. Чтобы иметь некоторое представление о гигантских величинах энтропии черных дыр, рассмотрим чернотельное фоновое излучение с температурой 2,7 К, которое, как долго казалось, давало наибольший вклад в энтропию вселенной. Астрофизики были просто ошарашены огромным количеством энтропии, заключенным в этом излучении, которое намного превосходило все значения энтропии, с которыми приходилось сталкиваться в других ситуациях (например, на Солнце). Энтропия фонового излучения составляет примерно 108 на один барион (здесь я снова перехожу к «естественной системе единиц», в которых постоянная Больцмана равна единице). (По сути, это означает, что на каждый барион приходится 108 фотонов фонового излучения.) Таким образом, если всего имеется 1080 барионов, то для полной энтропии фонового излучения во вселенной мы имели бы величину 1088. Несомненно, что если бы не было черных дыр, то эта величина представляла бы собой практически всю энтропию вселенной, поскольку энтропия фонового излучения намного превосходит энтропию всех других обычных процессов. Так, например, энтропия, приходящаяся на один барион на Солнце, оказывается порядка единицы. С другой стороны, по меркам черных дыр, энтропия фонового излучения — это просто «писк комара». Для черной дыры в одну солнечную массу формула Бекенштейна— Хокинга дает нам значение энтропии около 1020 на один барион (в естественных единицах). И даже если бы вселенная состояла всего-навсего из одной черной дыры с массой Солнца, полная энтропия оказалась бы уже намного превосходящей приведенное ранее значение, а именно, была бы равной 10100. Конечно, вселенная не устроена таким образом, но эта цифра определенно свидетельствует о том, насколько несущественной становится энтропия фонового излучения, когда мы начинаем учитывать влияние вездесущей гравитации. А теперь попробуем сделать более реалистичную оценку. Вместо того, чтобы заселять наши галактики одними только черными дырами, примем, что эти галактики состоят, в основном, из обычных звезд — примерно 1011 штук в каждой и еще содержат в своей сердцевине около миллиона (106) черных дыр с массой солнца (что было бы вполне правдоподобно для нашей собственной Галактики — Млечного Пути). Вычисления показывают, что энтропия, приходящаяся на один барион, оказалась бы в этом случае существенно больше даже того огромного значения, которое было только что получено — она стала бы равной 1021, что для полной энтропии дает (в естественных единицах) величину, равную примерно 10101. Мы можем предположить, что, по истечении достаточно большого промежутка времени, подавляющая часть галактических масс окажется захваченной черными дырами в центрах галактик. Когда это произойдет, энтропия в расчете на один барион станет равной 1031, что дает чудовищное значение для полной энтропии: 10111. Мы, однако, рассматриваем замкнутую вселенную, которая, в конце концов, должна сколлапсировать; и было бы вполне разумно оценить энтропию конечного коллапса, используя формулу Бекенштейна — Хокинга и полагая при этом, что вся вселенная в момент коллапса представляет собой одну черную дыру. Такая оценка дает величину энтропии на один барион около 1043 и совершенно немыслимую величину полной энтропии для конечного коллапса: 10123. Это число мы будем рассматривать как некоторую оценку полного объема фазового пространства V, доступного для Творца, поскольку эта энтропия должна представлять собой логарифм объема (несомненно) наибольшей его части. Поскольку 10123 есть логарифм объема, сам объем должен представлять собой экспоненту от 10123, т. е. в естественных единицах! (Некоторые особо внимательные читатели могли заметить, что я должен был написать — но для чисел такого порядка разница между основаниями е и 10 совершенно несущественна!) А каков был исходный объем фазового пространства, на который должен был нацелиться Творец, чтобы сотворить вселенную, совместимую со вторым началом термодинамики? Оказывается, что совершенно не важно, какое выбрать значение определяемое галактическими черными дырами или фоновым излучением соответственно, а, может быть, даже еще меньшее (и, на самом деле, более вероятное), которое могло иметь место в реальных условиях при Большом взрыве. В любом случае, значение отношения V к W будет приблизительно: (Проверьте сами: дает с хорошим приближением .) Эта величина свидетельствует о том, насколько точным должен был быть замысел Творца: точность составляла примерно одну — ую! Это поразительная точность. Полученную цифру нельзя даже полностью выписать в обычной десятичной системе исчисления: она представляла бы собой «1» с последующими 10123 нулями! Даже если бы мы были в состоянии записать «0» на каждом протоне и каждом нейтроне во вселенной, а также использовали бы для этой цели все остальные частицы, наше число, тем не менее, осталось бы недописанным. Точность, необходимая для задания начальных условий вселенной, как видно, совершенно несоизмерима с той весьма высокой точностью, которая уже стала привычной, когда речь заходит о динамических уравнениях (Ньютона, Максвелла, Эйнштейна), управляющих поведением физических объектов в различных ситуациях. Но почему же Большой взрыв был организован с такой высокой степенью точности, в то время как большой коллапс (или сингулярности черных дыр) должен быть совершенно хаотичным? Может показаться, что этот вопрос стоило бы переформулировать в терминах поведения ВЕЙЛЬ-части пространственно-временно́й кривизны в пространственно-временно́й сингулярности. Мы установили, что имеется ограничение ВЕЙЛЬ = 0 (или нечто похожее) в сингулярностях начального типа, отсутствующее в конечных сингулярностях — и, кажется, именно оно отражает выбор Творцом соответствующей крошечной области фазового пространства. Предположение о том, что такое ограничение применимо к любой начальной (но не конечной!) сингулярности, я назвал бы Гипотезой Вейлевской Кривизны. Таким образом, напрашивается вывод, что нам осталось понять лишь одну вещь для окончательного разрешения вопроса о происхождении второго начала термодинамики, а именно: почему мы должны использовать такую несимметричную во времени гипотезу?[187] Но как нам преодолеть это (последнее?) препятствие на пути к полному пониманию причины существования второго начала? Кажется, мы попали в безвыходное положение. Нам необходимо понять, почему пространственно-временны́е сингулярности имеют определенную структуру; но пространственно-временны́е сингулярности представляют собой как раз те области, в которых наше понимание физики достигает своих пределов. Этот тупик, связанный с существованием пространственно-временны́х сингулярностей, иногда сравнивают с другим тупиком: он имел место в начале XX века и был связан с проблемой устойчивости атомов (см.: Главу 6. «Проблемы с классической теорией»). В каждом из этих случаев хорошо обоснованная классическая теория приводит к ответу «бесконечность» и обнаруживает, тем самым, свою несостоятельность для решения соответствующей проблемы. Сингулярный характер электромагнитного коллапса атомов был устранен квантовой теорией. Аналогично именно квантовая теория должна привести теперь к конечной теории, взамен «бесконечных» классических пространственно-временны́х сингулярностей, возникающих при гравитационном коллапсе звезд. Но это не может быть обычная квантовая теория. Это должна быть квантовая теория самой структуры пространства и времени. Такую теорию (в случае, если она вообще появится) следовало бы назвать «квантовой гравитацией». То, что ее пока нет, не является признаком недостатка усилий, опыта или изобретательности физиков: многие первоклассные ученые с мировым именем пытались построить такую теорию, но безуспешно. Это тупик, к которому, в конце концов, пришли и мы в наших попытках понять направленность и течение времени. Читатель может справедливо спросить: а что же, в таком случае, дало нам наше путешествие? В наших поисках понимания того, почему время кажется текущим только в одном направлении, нам пришлось побывать в начале и конце времен, там, где растворяется даже самопонятие пространства. Что же мы в результате выяснили? Мы узнали, что нашим теориям пока еще недоступны ответы на эти вопросы — но что полезного это нам дает для понимания сущности разума? Я все же полагаю, что несмотря на отсутствие адекватной теории, мы можем извлечь важные уроки из нашего путешествия. А теперь нам необходимо вернуться домой. И хотя наше путешествие назад будет еще более наполнено догадками и предположениями, но других приемлемых путей назад просто нет!
искомая квантовая теория гравитации асимметрична во времени.Хочу предупредить здесь читателя, что приведенный вывод, несмотря на его очевидность, с неизбежностью вытекающей из изложенных выше рассуждений, не является, тем не менее, общепринятым! Большинство исследователей, работающих в рассматриваемой области науки, крайне неохотно встают на эту точку зрения. Причина, по-видимому, кроется в отсутствии ясного способа, каким привычные и (насколько можно судить) хорошо нами понятые процедуры квантования могли бы породить асимметричную во времени[190] квантовую теорию при том, что классическая теория, к которой упомянутые процедуры применяются (стандартная общая теория относительности или ее модификации), сама по себе симметрична во времени. Соответственно, эти специалисты по квантованию гравитации вынуждены (если они вообще задаются подобными вопросами — что случается не так уж и часто) искать другие «объяснения» малого значения энтропии при Большом взрыве. Многие физики могут возразить, что гипотезы, подобные предположению о нулевом начальном значении вейлевской кривизны, — представляя собой выбор «граничного условия», а не динамические законы, — находятся за пределами наших возможностей объяснения. Они утверждают, по сути, что в данном случае мы имеем дело с «актом Творца» и нечего даже и пытаться понять, почему нам дано именно это граничное условие, а не какое-нибудь другое. Однако, как мы уже убедились выше, ограничение, накладываемое рассматриваемой гипотезой на «булавку Творца», по своей исключительности и точности не уступает той потрясающей и тончайшим образом организованной хореографии динамических законов, к пониманию которых мы пришли через уравнения Ньютона, Максвелла, Эйнштейна, Шредингера, Дирака и др. Хотя второе начало термодинамики и может показаться нечетким и статистическим по своей природе, оно тем не менее вытекает из чрезвычайно точного геометрического ограничения. Поскольку научное осмысление доказало свою ценность как способ понимания динамических уравнений, мне представляется неразумным впадать в отчаяние и терять всякую надежду на научное постижение ограничений, действовавших в случае «граничного условия», каким являлся Большой взрыв. С моей точки зрения, как одно, так и другое являются частью науки, хотя и той частью, которая нами — пока еще — недостаточно понята. История науки продемонстрировала, насколько ценной для физики оказалась идея отделения динамических уравнений (законов Ньютона, уравнений Максвелла и т. д.) от так называемых граничных условий — то есть условий, необходимых для выделения из огромного множества решений того, что имеет физический смысл. Исторически простые формулировки были найдены именно для динамических уравнений. Движения частиц подчиняются простым законам, а вот о встречающихся во вселенной реальных конфигурациях частиц это, похоже, можно сказать нечасто. Иногда эти конфигурации на первый взгляд выглядят простыми — как, например, в случае планетных орбит, эллиптическая форма которых была установлена Кеплером, — но простота их в дальнейшем оказалась следствием динамических законов. Более глубокое понимание всегда достигалось через динамические законы, а простые конфигурации, подобные вышеописанной, как правило оказывались просто приближениями к более сложным конфигурациям вроде возмущенных (уже не совсем эллиптических) реально наблюдаемых движений планет, которые находят свое объяснение в динамических уравнениях Ньютона. Граничные условия служат для «запуска» рассматриваемой системы, после чего за дело принимаются динамические законы. Сам факт возможности отделения проблемы динамического поведения от вопроса о конфигурации реального содержимого вселенной представляет собой одно из важнейших достижений физической науки. Я сказал, что исторически это разделение на динамические уравнения и граничные условия сыграло чрезвычайно важную роль. Сама же возможность такого разделения представляет собой свойство конкретного типа уравнений (дифференциальных уравнений), который, как кажется, всегда возникает в физике. Но я не верю, что это разделение сохранится навечно. По-моему, когда нам удастся окончательно постичь законы или принципы, в действительности управляющие поведением нашей вселенной, — а не просто те изумительные приближения, к пониманию которых мы уже пришли и которые суть составные части наших ПРЕВОСХОДНЫХ современных теорий, то увидим, как различие между динамическими уравнениями и граничными условиями исчезнет, уступив место потрясающе согласованной всеобъемлющей схеме. Разумеется, утверждая это, я выражаю исключительно свое собственное мнение, с которым многие могут не согласиться. Но именно эту точку зрения я имею в виду, когда стараюсь нащупать следствия из пока неизвестной квантовой теории гравитации. (Под этим углом будут рассмотрены также некоторые наиболее спекулятивные рассуждения последней главы.) Как же можно изучать следствия неизвестной еще теории? Это, однако, не обязательно столь безнадежно, как кажется. Главное здесь — быть последовательными! Сначала я попрошу вас допустить, что наша гипотетическая теория, далее называемая ПКТГ («правильная квантовая теория гравитации»), должна объяснить гипотезу о вейлевской кривизне (ГВК). Это значит, что в непосредственном ближайшем будущем начальная сингулярность должна удовлетворять условию ВЕЙЛЬ = 0. Это ограничение не должно противоречить законам ПКТГ и поэтому обязано соблюдаться для любой начальной сингулярности, а не только той, что мы называем Большим взрывом. При этом я никоим образом не утверждаю существование в нашей реальной вселенной каких бы то ни было других начальных сингулярностей, отличных от Большого взрыва, но всего лишь говорю, что такая сингулярность, если бы она существовала, должна удовлетворять ограничению, накладываемому ГВК. Начальная сингулярность — это сингулярность, из которой, в принципе, могут возникать частицы. Такие сингулярности ведут себя противоположно черным дырам — конечным сингулярностям, в которые частицы могут падать. Одним из возможных примеров начальной сингулярности, отличной от Большого взрыва, может быть сингулярность белой дыры, которая, как мы помним из главы 7, представляет собой обращенную во времени черную дыру (см. рис. 7.14). Но, как мы уже видели, сингулярности внутри черных дыр удовлетворяют условию ВЕЙЛЬ → ∞, поэтому и для белых дыр должно выполняться ВЕЙЛЬ → ∞. Однако теперь сингулярность стала начальной и для нее, согласно ГВК, должно выполняться условие ВЕЙЛЬ = 0. Таким образом, ГВК делает существование белых дыр в нашей вселенной невозможным! (К счастью, этот результат не только желателен из термодинамических соображений — поскольку белые дыры были бы вопиющим нарушением второго начала термодинамики — но к тому же согласуется с наблюдательными данными! Время от времени разными астрофизиками предпринимались попытки объяснить некоторые явления, предполагая существование белых дыр, но такие гипотезы всегда создавали гораздо больше проблем, чем решали.) Заметьте, что сам Большой взрыв я не называю «белой дырой». Белая дыра должна содержать локализированную начальную сингулярность, для которой выполнение условия ВЕЙЛЬ = 0 невозможно, в то время как всеобъемлющий Большой взрыв может удовлетворять условию ВЕЙЛЬ = 0, и существование такого взрыва допускается ГВК при условии выполнения соответствующего ограничения. Примером еще одного вида начальных сингулярностей является точка взрыва черной дыры, окончательно исчезающей, после, скажем, 1064 лет хокинговского испарения (см. Глава 7. «Насколько особым был Большой взрыв?», а также Глава 8. «Ящик Хокинга: связь с гипотезой о вейлевской кривизне?»)! Точная природа этого (весьма правдоподобно аргументированного) явления является предметом многочисленных теоретических гипотез. Я думаю, что никакого противоречия с ГВК здесь нет. Такого рода (локализированный) взрыв может быть практически мгновенным и симметричным, и я не вижу здесь никакого конфликта с гипотезой ВЕЙЛЬ = 0. Во всяком случае, если предположить, что черных мини-дыр не существует (Глава 7. «Насколько особым был Большой взрыв?»), то первый такой взрыв вряд ли произойдет раньше, чем вселенная просуществует в 1054 раз больше современного возраста Т. Чтобы получить представление о величине 1054 х Т, мысленно уменьшим Т до самого короткого измеримого промежутка времени, равного времени распада самой короткоживущей из нестабильных частиц. В полученной таким образом шкале времени современный возраст вселенной окажется меньше 1054 х Т в миллион миллионов раз! Кто-нибудь может посмотреть на все это с другой точки зрения. Мне могут возразить[191], что ПКТГ не обязана быть асимметричной во времени, а должна лишь допускать на самом деле два типа сингулярностей, для одних из которых должно выполняться равенство ВЕЙЛЬ = 0, а для вторых возможно ВЕЙЛЬ → ∞. В нашей вселенной оказалась сингулярность первого типа, и наше восприятие направления течения времени (в силу вытекающего отсюда второго начала термодинамики) помещает эту сингулярность туда, где находится наше так называемое «прошлое», а не «будущее». По-моему, однако, соображение это в таком виде не выдерживает критики. Оно не объясняет отсутствие других начальных сингулярностей типа ВЕЙЛЬ → ∞ (а также отсутствие других начальных сингулярностей типа ВЕЙЛЬ = 0). Почему, если согласиться с этой точкой зрения, вселенная не усеяна белыми дырами? Поскольку она, как мы предполагаем, кишит черными дырами, отсутствие белых дыр требует объяснения[192]. Другое соображение, иногда привлекаемое в связи с рассматриваемой проблемой, — это так называемый антропный принцип (см. Барроу, Типлер [1986]). Согласно этому соображению, конкретная вселенная, обитателями которой мы сейчас являемся, выбрана из всех возможных вселенных потому, что в ней должны существовать мы (или, по крайней мере какие-нибудь чувствующие существа), чтобы ее было кому наблюдать! (Я вернусь к обсуждению антропного принципа в главе 10.) На этом основании утверждается, что разумные существа могут населять только вселенные с Большим взрывом очень определенного типа — и поэтому следствием этого принципа должно быть что-то вроде ГВК. Однако, это соображение не позволяет и близко подойти к числу, полученному в главе 7 («Насколько особым был Большой взрыв?»), которое характеризует степень «специфичности» Большого взрыва. Путем очень грубого расчета можно установить, что порождение солнечной системы со всем ее населением в результате случайных столкновений частиц обойдется гораздо «дешевле», а именно: соответствующая степень «невероятности» (измеряемая в терминах фазовых объемов) соответствует «всего лишь» одной доле из много менее чем. Это все, что может дать антропный принцип, и нам еще чудовищно далеко до требуемого числа. Более того, соображения, основанные на антропном принципе, не в состоянии объяснить, как и обсуждавшаяся перед этим концепция, отсутствия белых дыр.
Рис. 8.1. Временная эволюция вектора состояния: гладкая унитарная эволюция U (в соответствии с уравнением Шредингера), перемежаемая с разрывной редукцией R вектора состоянияКак видим, этот характер довольно своеобразный: считается, что бо́льшую часть времени эволюция происходит в соответствии с унитарной эволюционной процедурой U (уравнение Шредингера), но в некоторые моменты времени, когда предполагается, что происходит «наблюдение» (или «измерение»), применяется R-процедура и вектор состояния скачком переходит в другой вектор состояния, |X), где |X) представляет собой одну из двух или нескольких ортогональных альтернативных возможностей |X), |ψ), |θ)…, определяемых природой конкретного производимого наблюдения О. Тогда вероятность р скачкообразного перехода от |ψ) к |X) определяется уменьшением квадрата длины |ψ)2 вектора |ψ) при проекции |ψ) (в гильбертовом пространстве) на направление вектора |X) (Математически это равно величине уменьшения |X)2 при проекции вектора |X) на направление |ψ).) В таком виде эта процедура оказывается асимметричной во времени, поскольку сразу же после выполнения наблюдения О вектор состояния должен принадлежать к заданному множеству |X), |ψ), |θ)…, возможных значений, определяемых О, в то время как непосредственно перед наблюдением О вектор состояния должен был иметь значение |ψ), которое не обязано быть равным ни одному из элементов упомянутого множества. Однако, это всего лишь кажущаяся асимметричность и она может быть устранена, если посмотреть на эволюцию вектора состояния с другой точки зрения. Рассмотрим квантово-механическое решение, обращенное во времени. Это экстравагантное описание проиллюстрировано на рис. 8.2.
Рис. 8.2. Более экстравагантное изображение эволюции вектора состояния, описанное вспять по времени. Расчетная вероятность, связывающая наблюдение в точке О с наблюдением в точке О', такая же, как и в случае, изображенном на рис. 8.1, но к чему относится это вычисленное значение?Мы предполагаем, что вектор состояния равен |X) непосредственно перед О, а не сразу после этого наблюдения, и применим процедуру унитарной эволюции вспять по времени вплоть до момента предыдущего наблюдения О'. Предположим, что в результате обратной эволюции мы получим состояние, описываемое вектором |X') (сразу же после наблюдения О'). В нормальном описании эволюции вперед во времени, изображенном на рис. 8.1, сразу же вслед за О' мы имели другое состояние |ψ') (результат наблюдения О', при котором эволюция вперед во времени вектора |ψ') переводит его в |ψ) в момент наблюдения О). Теперь в нашем обращенном во времени описании у вектора |ψ') тоже есть своя роль: он представляет состояние системы непосредственно перед О'. Вектор состояния |ψ') соответствует состоянию, фактически наблюдавшемуся в точке О', так что с «обращенной» точки зрения мы рассматриваем |ψ') как результат наблюдения О' в обращенном вспять времени. Расчетное значение квантовомеханической вероятности р', связывающее результаты наблюдений в точках О и О', теперь определяется уменьшением величины |X'|2 при проекции |X') в направлении |ψ') (что равно уменьшению |ψ'|2 при проекции |ψ') в направлении |ψ')). То, что мы получим то же самое значение, что и раньше, является фундаментальным свойством оператора U[193]. Таким образом, может создаться видимость установления симметричности во времени квантовой теории даже в случае, когда помимо обычной процедуры унитарной эволюции U учитывается также и разрывный процесс, описываемый процедурой редукции R вектора состояния. Это, однако, неверно. Квантовая вероятность р описывает — независимо от того, как она рассчитывается — вероятность получить результат (а именно, |X)) в точке О при условии определенного результата (а именно, |ψ')) в точке О'. Эта вероятность не обязательно равна вероятности получить данный результат в точке О' при условии данного результата в точке О, а ведь именно последнюю вероятность[194] и должна определить обращенная во времени квантовая механика. Просто удивительно, до чего много физиков молчаливо полагают эти две вероятности равными друг другу. (Я сам этим грешил — см. Пенроуз [1979б], с. 584.) Однако наиболее вероятно, что эти две вероятности совершенно различны и только первая из них правильно определяется в рамках квантовой механики! Давайте поясним эту ситуацию на простом конкретном примере. Предположим, что у нас есть лампа L и фотоэлемент (то есть, детектор фотонов) Р. Между L и P разместим полупосеребренное зеркало М, наклонив его под углом равным, скажем, 45° к линии, соединяющей точки L и Р (рис. 8.3).
Рис. 8.3. Необратимость во времени R-процедуры в простом квантовом эксперименте. Вероятность регистрации фотона фотоэлементом при условии излучения фотона источником равна в точности одной второй, но вероятность излучения фотона источником при условии, что фотоэлемент зарегистрировал фотон, заведомо не равна одной второйПредположим, что лампа время от времени случайным образом испускает фотоны, и что конструкция ее такова (в ней используются параболические зеркала), что фотоны всегда оказываются очень точно нацеленными на Р. При каждом попадании фотона на фотоэлемент последний регистрирует это событие, причем мы предполагаем, что устройство срабатывает со 100 %-ной надежностью. Предположим также, что каждый факт излучения фотона регистрируется в точке L и тоже со 100 %-ной надежностью. (Ни одно из этих идеализированных требований не противоречит принципам квантовой механики, хотя практическое достижение такой эффективности может представлять определенные трудности.) Свойства полупосеребренного зеркала М таковы, что оно отражает в точности половину попадающих на него фотонов и пропускает остальную половину. Правильнее рассматривать это с точки зрения квантовой механики. Волновая функция фотона падает на зеркало и расщепляется на две волновых функции. Амплитуда отраженной части волны равна 1/√2, а амплитуда прошедшей части волны тоже равна 1/√2. Обе части волновой функции должны считаться «сосуществующими» (при нормальном описании вперед по времени) до того момента, когда предполагается имевшим место «наблюдение». В этой точке ситуация с одновременно сосуществующими альтернативами разрешается (в пользу одной или другой) фактически реализованной альтернативы с вероятностями, равными квадратам (модулей) соответствующих амплитуд, а именно (1/√2)2 = 1/2 в обоих случаях. После выполнения наблюдения вероятности отражения или прохождения фотона действительно оказываются равными одной второй. Посмотрим теперь, как все это соотносится с нашим экспериментом. Предположим, что зарегистрирован факт излучения фотона лампой L. Волновая функция фотона расщепляется на зеркале и приходит в точку Р с амплитудой, равной 1/√2, поэтому фотоэлемент либо регистрирует фотон, либо не регистрирует его — и то и другое с вероятностью, равной одной второй. Другая часть волновой функции фотона попадает в точку А на лабораторной стене (см. рис. 8.3) и тоже с амплитудой 1/√2. Если фотоэлемент Р не регистрирует событие, то фотон следует считать попавшим в лабораторную стену в точке А. Если бы в точке А находился другой фотоэлемент, то он регистрировал бы фотон всякий раз, когда фотоэлемент Р не регистрирует фотон, и не регистрировал бы фотон всякий раз, когда фотоэлемент регистрирует фотон. В этом смысле нет никакой необходимости устанавливать фотоэлемент в точке А. Мы можем определить, что сделал бы фотоэлемент в точке А, будь он там установлен, просто глядя на фотоэлементы в точках L и Р. Теперь должно стать ясно, как выполняются расчеты в квантовой механике. Зададимся вопросом: «Если известно, что лампа L сработала, то какова вероятность того, что сработал фотоэлемент Р?» Для ответа на этот вопрос учтем, что имеется амплитуда, равная 1/√2 для фотона, прошедшего путь LMP, и амплитуда, равная 1/√2, для фотона, прошедшего путь LMA. Возведя эти амплитуды в квадрат, получаем соответствующие вероятности, равные 1/2 и 1/2, попадания фотона в точки Р и А соответственно. Следовательно, на наш вопрос квантовая механика дает ответ, равный «одной второй». И действительно, именно такой результат получился бы в случае проведения реального эксперимента. Мы могли бы с таким же успехом использовать экстравагантную процедуру «с обращенным вспять временем» и получили бы тот же самый результат. Предположим, что мы зафиксировали факт срабатывания фотоэлемента в точке Р. Рассмотрим направленную вспять во времени волновую функцию фотона в предположении, что фотон в конце концов приходит в точку Р. Отслеживая эволюцию процесса назад во времени, мы видим, что фотон движется назад от Р, пока не достигнет зеркала М. В этой точке происходит бифуркация волновой функции и мы имеем амплитуду 1/√2 того, что фотон достигнет лампы L, и амплитуда 1/√2 того, что фотон претерпит отражение в точке М и придет в другую точку на лабораторной стене, а именно в точку В на рис. 8.3. Возводя соответствующие амплитуды в квадрат, мы снова получаем для обеих вероятностей значения, равные одной второй. Следует, однако, отдавать себе отчет в том, на какие именно вопросы отвечают эти вероятности. А вопросы следующие: «Если известно, что лампа L сработала, то какова вероятность срабатывания фотоэлемента Р?» — тот же самый вопрос, что мы рассматривали до этого; и более экстравагантный вопрос: «Какова вероятность срабатывания фотоэлемента Р при условии, что известен факт испускания фотона из стены в точке В?» Мы можем рассматривать оба ответа как экспериментально «правильные» в определенном смысле, хотя второй ответ (испускание фотона из стены) скорее представляет собой логическое умозаключение, а не результат реально выполненного ряда экспериментов! Однако ни один из этих вопросов не является обращением во времени того, что был задан выше. Обращенный вспять во времени вопрос звучал бы так: «Если известно, что фотоэлемент Р сработал, то какова вероятность того, что сработала лампа L?» Отметим, что правильный экспериментальный ответ на этот вопрос — это никакая не «одна вторая», а «единица». В случае срабатывания фотоэлемента нет практически никаких сомнений в том, что фотон пришел от лампы, а не от лабораторной стены! На наш обращенный во времени вопрос проведенный в рамках квантовой механики расчет дал нам абсолютно неверный ответ! Отсюда следует, что правила R-части квантовой механики просто-напросто неприменимы к такого рода обращенным во времени задачам. Если мы хотим рассчитать вероятность прошлого состояния исходя из известного состояния в будущем, то применение стандартной R-процедуры, которая заключается в простом возведении в квадрат модуля квантово-механической амплитуды, приводит к неверным результатам. Эта процедура пригодна только для расчета вероятностей будущих событий исходя из прошлых событий — и в этом случае она работает великолепно! Поэтому я считаю совершенно очевидным, что R-процедура не может быть симметрична во времени (и, между прочим, вследствие этого не выводима из симметричной во времени процедуры U). Многие могут посчитать, что причина этого противоречия с временно́й симметрией состоит в том, что второму началу термодинамики каким-то образом все же удалось пролезть в цепь рассуждений и привнести дополнительную асимметрию во времени, не описываемую процедурой возведения амплитуды в квадрат. Действительно, кажется, что любой физический измерительный прибор, способный реализовать R-процедуру, должен содержать элемент «термодинамической необратимости» — так, что энтропия возрастает всякий раз, когда имеет место измерение. Я думаю, что процесс измерения должен быть фундаментальным образом связан со вторым началом термодинамики. Более того, по-видимому попытки обратить вспять во времени целиком весь процесс квантово-механического эксперимента, вроде описанного выше (идеализированного) опыта, с регистрацией всех проведенных измерений, бессмысленны. Я не задавался вопросом о том, как далеко мы можем пойти по пути действительного обращения эксперимента во времени. Меня интересовала только применимость этой замечательной квантово-механической процедуры, которая дает правильные вероятности через вычисление квадратов модулей амплитуд. Поразительно, что эта простая процедура применима в направлении от прошлого к будущему и при этом не требует никакой дополнительной информации о системе. Действительно, невозможность повлиять на эти вероятности, которые в квантовой теории являются абсолютно случайными, представляет собой одну из неотъемлемых частей рассматриваемой теории! Однако попытка применить те же самые процедуры в направлении от будущего к прошлому (т. е. не для предсказания будущего, а для установления прошлого) приводит к результату неверному до удивления. Можно приводить сколько угодно оправданий, смягчающих обстоятельств и других доводов для объяснения того, почему процедура возведения амплитуды в квадрат не дает правильных результатов в случае применения ее в направлении от будущего к прошлому, но факт остается фактом. А при рассмотрении ситуации от прошлого к будущему никакие оправдания попросту не нужны! Процедура R, в том виде, как она реально применяется, просто-напросто не является симметричной во времени.
Рис. 8.4. Фазовое пространство P ящика Хокинга. Область A соответствует состояниям без черных дыр внутри ящика, а область B — состояниям, при которых внутри ящика есть хотя бы одна черная дыраКак мы помним, фазовое пространство — это пространство с большим количеством измерений, каждая точка которого полностью отображает одно из возможных состояний рассматриваемой системы — в данном случае содержимого ящика. Таким образом, каждая точка Р содержит информацию о положениях и импульсах всех находящихся в ящике частиц, а также всю необходимую информацию о геометрии пространства-времени внутри ящика. Расположенная в правой части рис. 8.4 подобласть B (фазового пространства Р) представляет совокупность всех состояний с черной дырой внутри ящика (включая все случаи наличия более чем одной черной дыры), а расположенная слева область A представляет совокупность всех состояний без черных дыр. Представим себе дальнейшее разбиение областей A и B на меньшие ячейки для построения «грубого разбиения», необходимого для точного определения энтропии (см. рис. 7.3 гл.7«Что такое энтропия?»). Точный вид этого разбиения нас здесь не интересует. На этом этапе нам важно лишь, что самая большая из рассматриваемых ячеек — та, что представляет состояния теплового равновесия при наличии черной дыры, — занимает большую часть области B, а (несколько меньшая) большая часть области A представляет то, что, как кажется, является тепловым равновесием, но без единой черной дыры. Вспомним теперь, что на каждом фазовом пространстве существует поле стрелок (векторное поле), описывающих эволюцию физической системы во времени (см. главу 5, «Фазовое пространство», а также рис. 5.11). Таким образом, чтобы узнать, что произойдет с нашей системой в следующий момент, нужно просто сдвинуться вдоль стрелок (рис. 8.5).
Рис. 8.5. «Гамильтонов поток» содержимого хокинговского ящика (см. рис. 5.11). Линии тока, пересекающие границу между областями в направлении от A к B, соответствуют коллапсу в черную дыру, а линии, пересекающие границу от B к A — исчезновению черной дыры в результате хокинговского испаренияНекоторые стрелки перейдут из области A в область B. Такое происходит при возникновении черной дыры в результате гравитационного коллапса вещества. А пересекают ли какие-нибудь стрелки границу между областями в обратном направлении из B в A? Такие стрелки действительно есть, но только при условии учета хокинговского испарения, о котором упоминалось ранее. В строгой классической общей теории относительности черные дыры способны только поглощать и не в состоянии ничего испускать. Но Хокингу [1975] удалось показать путем учета эффектов квантовой механики, что черные дыры все же способны — на квантовом уровне — кое-что испускать в процессе хокинговского излучения. (Это происходит в рамках квантового процесса «рождения виртуальных пар», при котором частицы и античастицы постоянно создаются из вакуума — как правило, лишь на мгновение, чтобы тут же аннигилировать, исчезнув без следа. Если есть черная дыра, она может «проглотить» одну из частиц такой пары до того, как произойдет аннигиляция, и вторая частица может покинуть черную дыру. Хокинговское излучение как раз и состоит из этих убежавших частиц.) При обычных обстоятельствах хокинговское излучение чрезвычайно слабое. Но в состоянии теплового равновесия величина энергии, теряемой черной дырой в результате хокинговского излучения, в точности компенсируется энергией, получаемой черной дырой в результате поглощения других «тепловых частиц» из окружающей «тепловой ванны», в которой дыра находится. В результате «флуктуаций» иногда может возникать небольшой избыток излучения или недостаток поглощения, что приводит к потере энергии черной дырой. Теряя энергию, черная дыра теряет также и массу (согласно формуле Эйнштейна Е=mc2) и, согласно законам, управляющим хокинговским излучением, становится чуть-чуть горячее. В очень редких случаях, если флуктуация оказывается достаточно большой, черная дыра может даже пойти в разнос, постоянно разогреваясь, теряя все больше энергии в этом процессе, непрерывно уменьшаясь в размерах, пока наконец (как мы предполагаем) совершенно не исчезнет в результате бурного взрыва! Когда это случится (и если считать, что других дыр в ящике нет), мы оказываемся в ситуации перехода из области B в область A фазового пространства Р, и значит действительно есть стрелки, идущие из области B в область A! Я хотел бы сделать замечание о смысле, который я вкладываю здесь в понятие «флуктуация». Вспомним ячейки грубого разбиения, рассмотренные в предыдущей главе. Точки фазового пространства, принадлежащие одной ячейке, считаются (макроскопически) «неотличимыми» друг от друга. Энтропия возрастает, потому что, следуя вдоль стрелок, с течением времени мы, как правило, переходим ко все более крупным ячейкам. В конечном итоге точка фазового пространства оказывается затерянной внутри самой большой ячейки — а именно той, что соответствует тепловому равновесию (максимальной энтропии). Однако, это будет справедливо только до определенной степени. Если подождать достаточно долго, то точка фазового пространства окажется в какой-то момент в ячейке меньших размеров, и энтропия, соответственно, уменьшится. Как правило, это состояние продлится (сравнительно) недолго и энтропия вскоре снова увеличится при возвращении точки фазового пространства в самую крупную ячейку. Это — флуктуация, сопровождаемая мимолетным понижением энтропии. Обычно значительного падения энтропии не происходит, но в очень редких случаях возникает огромная флуктуация и энтропия может уменьшиться существенно и остаться малой на протяжении значительного времени. Как раз такого рода событие и должно произойти, чтобы произошел переход из области B в область A через процесс хокинговского испарения. Очень большая флуктуация нужна потому, что маленькую ячейку необходимо протащить через то самое место, где стрелки пересекают границу между областями B и A Точно также, если наша точка фазового пространства находится внутри большой ячейки в области A (представляющей совокупность состояний теплового равновесия без черных дыр), пройдет еще очень много времени, прежде чем произойдет гравитационный коллапс и точка перейдет внутрь области B. И снова нужна большая флуктуация. (Тепловое излучения неохотно идет на гравитационный коллапс!) Каких стрелок больше — тех, что идут из A в B; тех, что идут из B в A; или же их число стрелок обоих типов одинаково? Для нас это очень важно. Вопрос можно сформулировать иначе: что природе «проще сделать» — породить черную дыру, заставив сколлапсировать частицы в состоянии теплового равновесия или же избавиться от черной дыры через хокинговское испарение? А может оба процесса одинаково «трудные»? Строго говоря, нас интересует не число стрелок, а скорость потока объема фазового пространства. Представьте себе, что фазовое пространство заполнено некой (многомерной) несжимаемой жидкостью. Стрелки отображают поток этой жидкости. Вспомним теперь описанную в главе 5 («Неумолимое возрастание энтропии») теорему Лиувилля, гласящую, что фазовый поток сохраняет объем элемента фазового пространства — а это как раз и означает, что наша жидкость, заполняющая фазовое пространство, действительно является несжимаемой! Теорема Лиувилля как будто говорит нам, что поток из A в B должен равняться потоку из B в A, поскольку фазовая жидкость, будучи несжимаемой, не может накапливаться на одной какой-нибудь стороне. Таким образом, кажется, что черную дыру так же трудно создать из теплового излучения, как и разрушить ее! К такому же выводу пришел и Хокинг, правда на основании несколько иных соображений. Главным аргументом Хокинга была симметричность во времени всех основных физических законов, имеющих отношение к рассматриваемой задаче (общая теория относительности, термодинамика, стандартные процедуры квантовой теории), из которой следует, что, если повернуть время вспять, то мы получим тот же самый результат, что и для прямого течения времени. Все сводится к простой смене направления всех стрелок в Р на противоположное. Из этого рассуждения действительно совершенно строго следует точное равенство числа стрелок из A в B числу стрелок из B в A при условии, что при обращении направления времени область B отображается сама на себя (а область A тоже, соответственно, отображается сама на себя). Это условие сводится к замечательной гипотезе Хокинга о том, что черные дыры и их временны́е инверсии — белые дыры — с точки зрения физики неотличимы друг от друга! Аргументация Хокинга состояла в том, что в симметричной во времени физике состояние теплового равновесия тоже должно быть симметричным во времени. Я не хочу здесь пускаться в подробное обсуждение этой поразительной возможности. Идея Хокинга состояла в том, что квантово-механическое хокинговское излучение может рассматриваться как своего рода временная инверсия классического «поглощения» вещества черной дырой. Несмотря на всю изобретательность ее автора, эта гипотеза наталкивается на серьезные теоретические трудности и я лично не верю в ее работоспособность. В любом случае, эта гипотеза плохо согласуется с теми идеями, которые я здесь выдвигаю. Я утверждал, что несмотря на то, что черные дыры должны существовать, существование белых дыр запрещено гипотезой о вейлевской кривизне! ГВК привносит в обсуждение элемент временно́й асимметрии, не учтенный Хокингом. Следует отметить, что поскольку черные дыры и их пространственно-временны́е сингулярности действительно занимают большое место в обсуждении того, что происходит внутри ящика Хокинга, то, следовательно, рассматриваемая проблема вне всякого сомнения тоже должна быть связана с неизвестными пока физическими законами, управляющими поведением такого рода сингулярностей. Хокинг считает, что эта неизвестная физика должна иметь вид симметричной во времени квантовой теории гравитации, а я считаю — что это должна быть асимметричная во времени ПКТГ! Я утверждаю, что одним из главных следствий ПКТГ должна быть ГВК (и, следовательно, второе начало термодинамики в известном нам виде), и поэтому необходимо попытаться установить, какие из ГВК вытекают следствия для рассматриваемой проблемы. Посмотрим, как включение ГВК отразится на обсуждении потока «несжимаемой жидкости» в фазовом пространстве Р. Действие чернодырной сингулярности в пространстве-времени состоит в том, что она поглощает и разрушает все попадающее на нее вещество. Для нас же гораздо важнее, что эта сингулярность уничтожает информацию! Следствием этого для фазового пространства P является слияние некоторых линий тока (рис. 8.6).
Рис. 8.6. В области B должно происходить слияние линий тока из-за потери информации на сингулярностях черных дыр. Компенсируется ли слияние порождением новых линий тока в результате R-процедуры (главным образом в области A)?Два состояния до этого различные могут превратиться в одно, как только различающая их информация окажется уничтоженной. При слиянии линий тока в фазовом пространстве Р мы фактически имеем дело с нарушением теоремы Лиувилля. Наша жидкость больше не является несжимаемой, а непрерывно уничтожается в области B! Похоже, что теперь мы оказались в действительно трудном положении. Если «жидкость» постоянно уничтожается в области B, то число линий тока из А в B должно превышать число линий тока из B в A, откуда следует, что породить новую черную дыру легче, чем уничтожить уже имеющуюся! Все это действительно имело бы смысл, если бы не то обстоятельство, что теперь количество «жидкости», покидающее область A, превышает количество «жидкости», которое возвращается в эту область. Черных дыр в области A нет, а существование белых дыр исключается ГВК — и поэтому теорема Лиувилля должна вне всякого сомнения абсолютно точно выполняться в области A! Однако теперь, похоже, нам нужно каким-то образом «порождать жидкость» в области A для восполнения ее потери в области B. Какой механизм может обеспечить увеличение числа линий тока? По-видимому, нам потребуется, чтобы в некоторых случаях одно и то же состояние могло приводить к более чем одному результату (т. е. допустить возможность бифуркации линий тока). Такого рода неопределенность эволюции физической системы в будущем «попахивает» квантовой теорией — ее R-частью. Возможно ли, чтобы R была в некотором смысле «оборотной стороной монеты» к ГВК? В то время, как ГВК обеспечивает слияние линий тока в области B, квантово-механическая R-процедура приводит к бифуркациям линий тока. Я действительно утверждаю, что именно объективный квантово-механический процесс R редукции вектора состояния приводит к бифуркациям линий тока и таким образом в точности компенсирует их слияние, вызываемое ГВК (см. рис. 8.6)! Для того, чтобы такое расщепление произошло, R-процедура должна быть, как мы уже видели, асимметричной во времени: вспомним описанный выше эксперимент с лампой, фотоэлементом и полупосеребренным зеркалом. В случае излучения лампой фотона возможны два (одинаково вероятных) результата этого процесса: либо фотон попадает на фотоэлемент и последний регистрирует его, либо фотон попадает на стену в точке А и фотоэлемент не срабатывает. В фазовом пространстве этого эксперимента мы имеем линию тока, представляющую излучение фотона, и эта линия тока расщепляется на две: одна часть представляет ситуацию, когда фотоэлемент срабатывает, а другая — когда он не срабатывает. Здесь мы, по-видимому, имеем дело с самой настоящей бифуркацией: одно допустимое состояние на входе и два возможных состояния на выходе. Второе входное состояние, которое следовало бы рассмотреть, — это испускание фотона из точки В на лабораторной стене, и в этом случае мы имели бы два состояния на входе и два на выходе. Однако только что упомянутое альтернативное состояние на входе исключается по причине его противоречия со вторым началом термодинамики — т. е. исходя из изложенной здесь концепции, и, в конечном итоге, по причине противоречия с ГВК при отслеживании эволюции системы назад в прошлое. Я должен еще раз отметить, что излагаемая мною здесь точка зрения на самом деле не является «традиционной» — хотя мне и не совсем понятно, как «традиционные» физики предлагают решать все поставленные здесь проблемы. (Я подозреваю, что немногие из них вообще серьезно над ними задумывались!) Разумеется, я слышал разные точки зрения. Например, время от времени некоторые физики выдвигали предположение о том, что хокинговское излучение никогда не приводит к полному исчезновению черной дыры, и что от нее всегда остается своего рода «ядрышко». (И, следовательно, согласно этой точке зрения стрелок из B в A нет!) На самом деле это почти никак не скажется на мои рассуждениях (и фактически даже усилит их). Можно, однако, избежать моих выводов, если постулировать, что общий объем фазового пространства Р на самом деле бесконечен, но это противоречило бы некоторым весьма фундаментальным представлениям об энтропии черных дыр и природе фазового пространства замкнутых (квантовых) систем, а другие технические приемы, позволяющие избежать моих выводов, о которых мне доводилось слышать, представляются еще менее удовлетворительными. Гораздо более серьезное возражение состоит в том, что построение ящика Хокинга требует слишком сильной идеализации, и что, предполагая возможность его создания, мы вынуждены преступать некоторые барьеры принципиального характера. Хотя я сам не до конца в этом уверен, но все же склоняюсь к тому, чтобы считать некоторую необходимую идеализацию вполне допустимой! Наконец, есть один серьезный аспект, о котором я умолчал. Я начал обсуждение, предположив, что мы имеем дело с классическим фазовым пространством — а теорема Лиувилля относится к классической физике. Но затем пришлось рассмотреть квантово-механический феномен хокинговского излучения. (Кроме того, квантовая теория нужна для обеспечения конечной размерности и конечного объема Р.) Как мы видели в главе 6, квантовым аналогом фазового пространства является гильбертово пространство, и, поэтому, следовало бы, наверно, проводить все наши рассуждения в терминах гильбертова, а не фазового пространства. Для гильбертова пространства существует аналог теоремы Лиувилля, который следует из так называемого «унитарного» характера временно́й эволюции U. Не исключено, что все мои рассуждения можно сформулировать полностью в терминах гильбертового, а не классического фазового пространства, но мне трудно представить себе, каким образом в этом случае можно рассматривать классические явления, связанные с пространственно-временно́й геометрией черных дыр. Я считаю, что для правильной теории непригодно ни классическое фазовое пространство, ни гильбертово пространство, а потребуется какой-то новый, до сих пор еще не открытый тип математических пространств, занимающий промежуточное положение между двумя упомянутыми выше. Соответственно, мои рассуждения следует рассматривать только в эвристическом смысле, и они представляют собой скорее всего лишь общие предположения, а не окончательные выводы. Тем не менее, я действительно считаю свои рассуждения сильным доводом в пользу глубинной связи между ГВК и R, откуда вытекает, что R-процедура действительно должна представлять собой эффект квантовой теории гравитации. Повторю свои выводы еще раз: я выдвигаю гипотезу, согласно которой квантовомеханическая редукция вектора состояния действительно является оборотной стороной ГВК. В соответствии с этой гипотезой два важнейших следствия нашей искомой правильной квантовой теории гравитации (ПКТГ) — это ГВК и процедура R. ГВК приводит к слиянию линий тока в фазовом пространстве, в то время как процедура R приводит к расщеплению линий тока, в точности компенсирующему их слияние, вызванное ГВК. Оба процесса теснейшим образом связаны со вторым началом термодинамики. Отметим, что слияние линий тока происходит только в области B, в то время как их расщепление может иметь место как внутри области A, также и внутри области B. Вспомним, что A представляет совокупность состояний, в которых черные дыры отсутствуют, и, следовательно, редукция вектора-состояния действительно возможна при отсутствии черных дыр. Ясно, что для выполнения R совсем необязательно иметь в лаборатории черную дыру (как в случае только что рассмотренного нами эксперимента с фотоном). Нас сейчас интересует лишь общий баланс между различными возможными событиями в той или иной ситуации. В рамках излагаемой концепции отсутствие детерминизма в квантовой теории должно всего лишь компенсироваться возможностью образования черных дыр на некотором этапе (и следующей отсюда возможностью уничтожения информации)!
Рис. 8.7. Заряженная частица влетает в камеру Вильсона и вызывает конденсацию капелек на своем путиНу а как же все это описывается в квантовой механике? В момент распада радиоактивного атома он испускает частицу. Но у этой частицы существует множество различных направлений движения: каждое направление движения описывается своей амплитудой, причем все они сосуществуют одновременно в виде линейной квантовой суперпозиции. Совокупность всех этих наложенных друг на друга альтернатив образует исходящую из распавшегося атома сферическую волну — волновую функцию испущенной атомом частицы. При попадании любого из возможных треков частицы в камеру, он тут же оказывается ассоциированным с цепочкой ионизованных атомов, каждый из которых служит центром конденсации пара. Все эти различные возможные цепочки ионизованных атомов должны сосуществовать в виде линейной квантовой суперпозиции, так что мы имеем теперь линейную суперпозицию большого числа различных цепочек конденсирующихся капелек. На некотором этапе эта комплексная квантовая линейная суперпозиция превращается в действительную совокупность фактических альтернатив с вероятностными весами, равными, согласно R-процедуре, квадратам модулей амплитуд вероятностей. В реальном физическом мире реализуется только одна из этих альтернатив, и именно она наблюдается экспериментатором. В соответствии с излагаемой здесь точкой зрения эта стадия наступает, когда разность между гравитационными полями различных альтернативных вариантов достигает одногравитонного уровня. Когда это происходит? Согласно очень грубым расчетам[196], если бы имелась только одна однородная шарообразная капля, то одногравитонный уровень достигался бы, когда ее масса вырастет до одной сотой от величины mPl, что составляет одну десятимиллионную грамма. В этом расчете много неопределенностей (включая трудности принципиального характера), да и величина полученной массы несколько великовата, однако результат не совсем уж бессмысленный. Остается надеяться на появление в будущем более точных расчетов и возможность рассмотрения всей цепочки, а не просто одной из составляющих ее капель. К тому же учет неоднородности капель — того факта, что они состоят из большого числа мельчайших атомов, может существенно изменить результат, да к тому же сам «одногравитонный критерий» нуждается в существенном математическом уточнении. В описанной выше ситуации рассматривалось возможное реальное наблюдение квантового процесса (распада радиоактивного атома), при котором квантовые эффекты оказываются усиленными настолько, что различные квантово-механические альтернативы приводят к различным и непосредственно наблюдаемым макроскопическим альтернативам. Я считаю, что R-процедура действительно может иметь место объективным образом даже в отсутствие столь ярко выраженного усиления. Предположим, что наша частица попала не в камеру Вильсона, а просто в большой ящик, заполненный газом (или жидкостью) с плотностью, обеспечивающей практически гарантированное столкновение частицы или иное ее воздействие на большое число атомов газа. Рассмотрим всего два варианта возможного поведения частицы, как составные части начальной линейной суперпозиции: частица может просто не попасть в ящик совсем или же она попадет в него по определенной траектории и окажется отраженной каким-либо атомом газа. Во втором случае соответствующий атом газа отскочит, двигаясь с очень большой скоростью так, как он никогда не повел бы себя, не столкнись он с частицей, затем столкнется с еще одним атомом и, в свою очередь, отрикошетит от него. После этого движение двух атомов будет отличаться от их движения в отсутствие столкновения с частицей, и мы будем иметь уже целый каскад движений атомов в газе, невозможный в отсутствие первоначального попадания частицы в ящик (рис. 8.8).
Рис. 8.8. Гравитационные поля частиц (условное изображение). При попадании частицы в ящик с газом через некоторое время практически все атомы газа оказываются охваченными порожденным частицей возмущением. Линейная квантовая суперпозиция частицы, попавшей в ящик, и частицы, не попавшей в ящик, подразумевает линейную суперпозицию двух различных пространственно-временных геометрий, описывающих гравитационные поля двух различных распределений частиц газа. В какой момент различие между этими геометриями достигает одногравитонного уровня?Вскоре после этого порожденное частицей возмущение охватит практически все атомы газа. Подумаем теперь, как эту ситуацию можно описать на языке квантовой механики. Вначале мы имеем лишь исходную частицу, и ее различные положения составляют комплексную линейную суперпозицию — волновую функцию частицы. Однако через какое-то время квантово-механическое описание должно уже охватывать все атомы газа. Рассмотрим комплексную суперпозицию двух возможных траекторий частицы, при движении по одной из которых частица попадает в ящик, а по другой — нет. Стандартная квантовая механика требует распространения этой суперпозиции на все атомы газа: мы должны рассмотреть суперпозицию двух состояний, таких, что положение атомов газа в одном состоянии оказываются смещенными относительно их положений в другом состоянии. Теперь рассмотрим разность гравитационных полей всех отдельных атомов. Хотя распределение газа (и гравитационное поле) в целом практически одинаково для обоих состояний, чью суперпозицию мы должны рассмотреть, если мы вычтем одно поле из другого, то получим (сильно флуктуирующее) разностное поле, которое вполне может оказаться «значительным» в подразумеваемом здесь смысле — а именно это разностное поле вполне может превысить одногравитонный уровень. По достижении этого уровня немедленно же происходит редукция вектора состояния: в реальном состоянии частица либо попала в ящик, либо нет. Комплексная линейная суперпозиция сводится к статистически взвешенным альтернативам с осуществлением только одной из них. В предыдущем примере я рассматривал камеру Вильсона в качестве способа квантово-механического наблюдения. Я считаю, что и другие виды таких наблюдений (фотопластинки, искровые камеры и т. д.) можно анализировать в рамках одногравитонного критерия, используя подход, примененный в описанном выше случае ящика с газом. Многое еще предстоит сделать, чтобы разобраться в подробностях применения этой процедуры. Изложенные здесь соображения представляют собой всего лишь зачаток новой теории, которая, как мне кажется, является столь необходимой[197]. Для того, чтобы быть полностью удовлетворительной, любая схема должна, по-моему, включать в себя радикально обновленные представления о природе пространственно-временно́й геометрии, быть может, с применением нелокального описания[198]. Один из самых неоспоримых доводов в пользу этого следует из экспериментов ЭПР-типа (см. гл.6 «„Парадокс“ Эйнштейна, Подольского и Розена» и гл.6 «Эксперименты с фотонами: проблема для специальной теории относительности?»), в которых «наблюдение» (в данном случае — срабатывание фотоэлемента) в одном конце комнаты может вызвать мгновенную редукцию вектора-состояния в другом конце комнаты. Построение полностью объективной теории редукции вектора-состояния, не противоречащей духу теории относительности, представляет собой очень трудную и глубокую задачу, поскольку понятие «одновременности», будучи зависимым от движения некоторого наблюдателя, является чуждым теории относительности. Я убежден, что наше современное представление о физической реальности — особенно в том, что касается природы времени — нуждается в коренном пересмотре, пожалуй, даже в более радикальном, чем тот, который был вызван к жизни современной теорией относительности и квантовой механикой. Вернемся к исходной проблеме. Какое все это имеет отношение к физическим законам, которые управляют действиями нашего мозга? Как это связано с нашими мыслями и чувствами? Для того, чтобы попытаться хоть как-то ответить на эти вопросы, придется сначала немного разобраться в устройстве нашего мозга. Потом я вернусь к проблеме, которую считаю фундаментальной: какого рода новые физические действия происходят, когда мы сознательно мыслим или воспринимаем что-либо?
Рис. 9.1. Мозг человека: вид сверху, сбоку, снизу и в разрезеБольша́я покрытая извилинами (и более всего похожая на овсянку) часть мозга, расположенная сверху, называется собственно головным (или большим) мозгом. Он четко делится посередине на правое и левое полушария и, более условно, в передне-заднем направлении — на лобную долю и три остальные: височную, теменную и затылочную. Еще дальше и несколько книзу расположен небольшой и округлый мозжечок, чем-то похожий на пару клубков шерсти. Глубоко внутри мозга, как бы укрытый им, находится целый ряд любопытных и сложных на вид структур: варолиев мост и продолговатый мозг, которые вместе с ретикулярной формацией — областью, к которой мы обратимся позднее — составляют ствол мозга, а также таламус, гипоталамус, гиппокамп, мозолистое тело и еще много других, странных как по виду, так и по названиям, частей. Большой мозг — предмет особой гордости человека и не только потому, что он является самой большой частью человеческого мозга, но и потому, что пропорция между этой частью и мозгом в целом у человека больше, чем у животных. (Мозжечок человека тоже превосходит размерами таковой у большинства других животных.) Головной мозг и мозжечок имеют сравнительно тонкий наружный слой серого вещества, под которым расположено значительно большее по массе белое вещество. Эти области серого вещества называют, соответственно, корой головного мозга и корой мозжечка. Считается, что в сером веществе происходят различные вычислительные действия, а белое вещество, состоящее из длинных нервных волокон, отвечает за передачу сигналов из одной части мозга в другую. Каждой из различных областей коры головного мозга присущи свои специфические функции. Зрительная кора расположена в затылочной доле, прямо в задней части мозга, и занимается восприятием и распознаванием зрительных образов. Забавно, что природа именно там решила разместить интерпретатор визуальной информации, получаемой зрительными органами, которые (по крайней мере, у человека) находятся прямо спереди! Но природа вытворяет и куда более странные вещи. Так, за левую половину человеческого тела практически полностью отвечает правое полушарие, тогда как за правую — почти исключительно левое, поэтому чуть ли не все нервы, идущие в головной мозг или выходящие из него, по необходимости должны перекрещиваться! При этом в случае зрительной коры правая ее часть связана не с левым глазом, а с левой частью поля зрения обоих глаз. Аналогично, левая часть зрительной коры связана с правой частью поля зрения обоих глаз. Это означает, что нервы от правой части сетчатки каждого из глаз должны идти к правой половине зрительной коры (вспомните, что изображение на сетчатке перевернуто по отношению к источнику), а нервы от левой части сетчатки — к левой половине коры (рис. 9.2).
Рис. 9.2. Левая сторона поля зрения обоих глаз отображается на правой половине зрительной коры, а правая, соответственно, на левой (вид снизу; обратите внимание, что предметы на сетчатке отображаются в перевернутом виде)Таким образом в левой и правой частях зрительной коры формируется четкое отображение правой и левой областей поля зрения, соответственно. Сигналы от ушей приходят на противоположные части мозга столь же замысловатым образом. Правая слуховая кора (часть правой височной доли) обрабатывает в основном звуки, поступающие слева, а левая слуховая кора — звуки, поступающие справа. Обоняние кажется здесь исключением из общего правила. Правая часть обонятельной коры, которая расположена в передней части большого мозга (в передней доле — что уже само по себе является исключением для сенсорной области), отвечает в основном за правую ноздрю, а левая часть — за левую ноздрю. Осязание связано с областью затылочной доли мозга, которая носит название соматосенсорной коры. Эта область находится как раз за условной границей, разделяющей лобную и теменную доли. Между различными частями поверхности тела и отдельными участками соматосенсорной коры существует довольно своеобразное соответствие. Иногда оно изображается графически в виде так называемого «соматосенсорного гомункулуса» — искаженной человеческой фигуры, изображаемой лежащей вдоль соматосенсорной коры, как это показано на рис. 9.3.
Рис. 9.3. «Соматосенсорный гомункулус» наглядно иллюстрирует участки коры головного мозга, расположенные сразу за линией, разделяющей лобную и теменную доли и непосредственно связанные с частями тела, откуда поступает осязательная информацияПравая часть соматосенсорной коры принимает осязательные сигналы, идущие от левой стороны тела, а левая — с правой. В лобной доле непосредственно перед границей с теменной долей находится участок коры, известный как двигательная кора. Он приводит в движение различные части нашего тела. И опять мы встречаемся с точно определенным соответствием между мышцами нашего тела и зонами этого участка мозга. Как и в случае с осязанием, эти связи можно графически изобразить в виде «двигательного гомункулуса» (рис. 9.4).
Рис. 9.4. «Двигательный гомункулус» наглядно изображает участки коры головного мозга, примыкающие к линии раздела между лобной и теменной долями, которые непосредственно приводят в движение различные части телаИ снова правая часть двигательной коры отвечает за движение левой стороны тела, а левая — правой. Все упомянутые выше зоны коры головного мозга (зрительная, слуховая, обонятельная, осязательная и двигательная) называются первичными, поскольку именно они непосредственно осуществляют прием поступающих в мозг и передачу исходящих из него сигналов. Рядом с ними расположены вторичные зоны, предназначенные для более тонкой и сложной обработки сенсорной информации (рис. 9.5).
Рис. 9.5. Функции большого мозга (грубая схема). Сенсорная информация извне поступает в первичную область восприятия, последовательно обрабатывается до мельчайших деталей во вторичной и третичной сенсорных областях, затем передается в третичную двигательную область, и, в конце концов, в первичных двигательных областях преобразуется в точные инструкции к действиюСенсорная информация, полученная зрительной, слуховой или соматосенсорной зоной коры головного мозга, обрабатывается соответствующими вторичными областями, после чего вторичная двигательная область вырабатывает план движения, который переводится первичной двигательной областью на язык прямых команд, непосредственно адресованных мышцам. (Мы не будем касаться обонятельного участка коры, поскольку он функционирует иным и малоизученным пока образом.) Остальные участки коры головного мозга относятся к разряду третичных (или ассоциативных). В этих областях в основном и выполняется наиболее сложная и характеризуемая высокой степенью абстрагирования часть умственной деятельности. Именно здесь при определенном участии периферической нервной системы собирается воедино и подвергается всестороннему анализу информация, поступающая от различных сенсорных участков; здесь происходит запоминание, складываются картины внешнего мира, намечаются и оцениваются планы действий, распознается и генерируется речь. Речь представляет для нас особый интерес, поскольку ее обычно относят к разряду способностей, присущих исключительно человеческому интеллекту. Интересно, что (по крайней мере у подавляющего большинства правшей и большей части левшей) речевые центры находятся в основном в левой половине мозга. К важным участкам относятся зона Брока, расположенная в задней нижней части лобной доли, и зона Вернике, которая располагается внутри и вокруг верхней задней части височной доли (рис. 9.6).
Рис. 9.6. Зоны Вернике и Брока, расположенные (как правило) полностью в левом полушарии, отвечают за понимание и формирование речи соответственноЗона Брока отвечает за построение предложений, а зона Вернике — за понимание языка. Повреждение зоны Брока приводит к нарушению речи, но не ее пониманию, тогда как при повреждении зоны Вернике речь остается беглой, но, в основном, бессмысленной. Пучок нервных волокон, который связывает между собой две эти области, называется дуговидным пучком. При его повреждении ни речь, ни ее понимание не нарушаются, но мысль не может быть выражена словами. Мы теперь можем составить очень приблизительную картину того, что делает головной мозг. Входные данные для мозга представляют собой зрительные, слуховые, осязательные и прочие сигналы, которые сначала регистрируются в первичных областях (главным образом) задних долей (теменной, височной и затылочной). Выходные сигналы мозга, приводящие к различным движениям тела, вырабатываются в основном лобными долями мозга. А где-то между ними происходит обработка информации и принятие решений. В общем, можно сказать, что активность мозга, начавшись в первичных областях задних долей, перемещается затем во вторичные области, где входные данныеанализируются, и, далее, в третичные области задних долей, где информация становится полностью осмысленной (как, например, в случае с пониманием речи в зоне Вернике). Дуговидный пучок — упомянутый выше пучок нервных волокон, но теперь уже с обеих сторон мозга, — переносит эту информацию в лобную долю, где ее третичными областями вырабатывается общий план действий (например, как это происходит при генерации речи в зоне Брока). Эти общие планы действий преобразуются в более конкретные представления о движениях тела во вторичных двигательных областях, откуда активность мозга перемещается в первичную двигательную кору, которая, в конце концов, посылает соответствующие сигналы различным группам мышц тела (и часто нескольким одновременно). Создается впечатление, что перед нами предстает картина превосходного вычислительного устройства. Сторонники сильного ИИ (см. главу 1 и далее) рассматривают мозг как великолепный образец алгоритмического компьютера — по сути, машины Тьюринга — в котором есть входные данные (как на ленте слева от машины Тьюринга) и выходные данные (как на ленте справа от машины Тьюринга) и который способен выполнять всевозможные нетривиальные вычисления на промежуточных этапах. Конечно, активность мозга может не прекращаться и в отсутствие внешних раздражителей. Это происходит в тех случаях, когда человек думает, занимается вычислениями или предается воспоминаниям. Приверженцы сильного ИИ отнесли бы это на счет продолжающейся алгоритмической деятельности и предположили бы, что явление «осознания» возникает как раз в те моменты, когда подобная деятельность достигает определенного уровня сложности. Но, хотя такая логика и напрашивается сама собой, мы не будем торопиться с выводами. Общая картина работы мозга, приведенная выше, довольно груба. Прежде всего, даже зрительное восприятие не происходит по такой простой схеме, как это было мной представлено ранее. В коре, по-видимому, существует несколько различных (хотя и менее значимых) областей, на которые отображаются поля зрения, очевидно, с какими-то другими целями. (Похоже, именно они отвечают за различия в том, как мы осознаем увиденное.) Скорее всего, по коре разбросаны также и другие дополнительные сенсорные и двигательные области (например, движение глаз может быть вызвано сигналами из определенных точек задних долей). В своем описании мозга я затронул только его кору и ни разу не коснулся вопроса о назначении прочих частей. Какую роль выполняет, например, мозжечок? Ясно, что он отвечает за координацию и контроль движений тела, его равновесие, своевременность и точность действий. Представьте себе артистичность танцора, отточенность движений профессионального игрока в теннис, мгновенную реакцию гонщика, уверенные движения рук музыканта или художника; подумайте о грациозных прыжках газели или крадущейся кошке. Без мозжечка подобная точность движений была бы невозможна, они стали бы неуверенными и неуклюжими. По-видимому, в процессе приобретения новых навыков, будь то ходьба или вождение машины, сначала человеку приходится детально обдумывать каждое свое действие, и за это отвечает кора головного мозга, но когда достигнут определенный уровень мастерства и действия начинают выполняться «автоматически», управление ими передается мозжечку. Более того, хорошо известно, что как только профессионал задумывается о своих действиях, он на время теряет легкость их координации. Думание, по-видимому, сопровождается переходом контроля к коре головного мозга и, хотя при этом, как следствие, появляется гибкость действий, «мозжечковая» плавность и точность движений на время утрачивается. Такое описание, без сомнения, является чересчур упрощенным, но тем не менее позволяет нам в общих чертах понять функцию мозжечка[200]. При описании функций головного мозга до сих пор вообще не упоминалось о других частях мозга. Например, гиппокамп играет важнейшую роль в формировании долговременной (постоянной) памяти, хотя сама память располагается где-то в коре головного мозга, возможно, во многих местах одновременно. Мозг способен также сохранять образы различными способами с помощью кратковременной памяти в течение нескольких минут или даже часов (просто, что называется, «держа их в голове»). Но для того, чтобы человек мог вспомнить эти образы после того, как его внимание с них переключилось, необходимо сохранить их в долговременной памяти, и здесь уже не обойтись без гиппокампа. (Повреждение этого участка мозга приводит к ужасному состоянию, когда человек не способен запомнить ничего нового и все сразу забывается, как только его внимание переключается на другой объект.) Мозолистое тело — это область, ответственная за связь между двумя полушариями мозга. (Далее мы увидим, к каким поразительным явлениям приводит рассечение мозолистого тела.) Гипоталамус представляет собой эмоциональный центр, в котором гнездятся удовольствие, ненависть, страх, отчаяние, голод, и который служит посредником между эмоциями и их ментальными и физическими проявлениями. Между гипоталамусом и различными частями мозга идет постоянный обмен сигналами. Таламус функционирует как важный обрабатывающий центр и переключающий узел, который передает значительную часть импульсов, поступающих извне, в кору головного мозга. Ретикулярная формация отвечает за общее состояние готовности мозга и его отдельных частей к осознанному восприятию. Все эти и многие другие жизненно важные части мозга соединены многочисленными нервами. Вышеприведенное описание дает только общее представление о некоторых наиболее значимых частях мозга. Мне кажется целесообразным в завершение этого раздела привести некоторые сведения о строении мозга в целом. Его различные части группируются в три отдела, которые, если двигаться от позвоночника, называются по порядку задним (rhombencephalon), средним (mesencephalon) и передним (prosencephalon) мозгом. На ранних стадиях развития эмбриона эти отделы, в том же порядке, видны как три вздутия на конце позвоночного столба. Самое дальнее — развивающееся в передний мозг — имеет два выроста в виде пузырей, по одному с каждой стороны, которые становятся большими полушариями головного мозга. Полностью развитый передний мозг включает в себя многие важные части всего мозга — не только большой головной, но и мозолистое тело, таламус, гипоталамус, гиппокамп и многие другие. Мозжечок является частью заднего мозга. Ретикулярная формация расположена частью в среднем мозге, а частью в заднем. Передний мозг является «новейшим» отделом с точки зрения эволюционного развития, а задний — наиболее «древним». Я надеюсь, что это краткое описание, во многом неточное, даст читателю некоторое представление о том, на что похож мозг человека и как он функционирует. До сих пор я лишь вскользь упомянул то, что служит центральной темой нашей дискуссии — сознание. Теперь перейдем к этому вопросу вплотную.
Рис. 9.7. Видите ли вы белый треугольник, лежащий поверх другого треугольника и прикрепленный к нему кольцом? Стороны этого белого треугольника нигде не нарисованы до конца, однако, в мозге есть клетки, ответственные за восприятие этих невидимых линийКлетки, способные фиксировать эти «подразумеваемые» линии, действительно были обнаружены в зрительной коре (той, что называется вторичной зрительной корой)! В начале 1970-х годов в литературе[206] появились заявления об открытии в зрительной коре мозга мартышек клеток, которые активируются только тогда, когда на сетчатку проецируется изображение лица. На основании этой информации была сформулирована «гипотеза бабушкиной клетки», согласно которой в мозге человека должны существовать определенные клетки, реагирующие только в тех случаях, когда в комнату входит его/ее бабушка! Недавние исследования показали, что есть клетки, реагирующие на определенные слова. Может быть, это шаг на пути к доказательству справед ливости гипотезы бабушкиной клетки? Ясно, что нам предстоит еще очень много узнать о деталях процессов обработки информации в мозге. До сих пор очень мало известно о функционировании высших отделов мозга. Мы пока оставим эти вопросы и обратимся к самим клеткам мозга, которые позволяют ему осуществлять эту удивительную деятельность.
Рис. 9.8. Нейрон (часто гораздо более удлиненный, чем на рисунке). Различные типы нейронов могут существенно отличаться по внешнему видуЕго утолщенная центральная часть, немного похожая на звезду и часто имеющая форму редиски, называется телом (сомой) нейрона и содержит в себе клеточное ядро. С одной стороны от тела нейрона отходит сильно вытянутое нервное волокно, называемое аксоном. Аксон иногда достигает действительно огромной длины (у человека — часто до нескольких сантиметров), если учесть, что речь идет всего лишь об одной микроскопической клетке. Аксон служит «проводом», по которому передается исходящий из клетки нервный сигнал. От аксона в стороны могут отходить более мелкие ветви и, кроме того, аксон может несколько раз разветвляться. На концах каждого из этих нервных волокон находятся нервные окончания (терминали). По другую сторону сомы, а часто и отходя от нее во всех направлениях, располагаются короткие сильно ветвящиеся отростки — дендриты, по которым в клетку поступают входные данные. (Иногда и на концах дендритов встречаются терминали, образующие так называемые дендро-дендритные синапсы между дендритами. В дальнейшем я не буду их учитывать, поскольку связанное с ними усложнение общей картины несущественно.) Клетка как целое отделена от окружения клеточной мембраной, которая охватывает сому, аксон, нервные окончания, дендриты и все остальное. Для того, чтобы сигналы передавались от одного нейрона к другому, надо каким-то образом обеспечить им возможность «перехода через барьер» между нейронами. Это достигается с помощью межклеточного соединения, называемого синапсом, в котором терминаль одного нейрона соединена с какой-либо точкой на соме или на одном из дендритов другого нейрона (рис. 9.9).
Рис. 9.9. Синапсы обеспечивают контакт одного нейрона с другимНа самом деле, между терминалью одного нейрона и сомой или дендритом другого остается очень узкий зазор, который называется синаптической щелью (рис. 9.10).
Рис. 9.10. Схема строения химического синапса. Через синаптическую щель сигнал передается с помощью нейромедиатораПри передаче от одного нейрона к другому сигнал должен преодолеть этот зазор. В какой форме сигналы передаются по нервным волокнам и через синаптические щели? Что заставляет следующий нейрон передавать сигнал дальше? Для непосвященного, вроде меня, механизмы, которые используются здесь природой, кажутся удивительными и совершенно зачаровывающими! Можно было бы думать, что эти сигналы распространяются точно так же, как электрический ток по проводам, но в действительности все гораздо сложнее. Нервное волокно представляет собой цилиндрическую трубку, заполненную раствором обычной соли (хлорида натрия), смешанной с хлоридом калия (с преобладанием последнего), так что внутри трубки находится смесь из ионов натрия, калия и хлора (рис. 9.11).
Рис. 9.11. Схематическое изображение нервного волокна. В состоянии покоя внутри волокна ионов хлора больше, чем ионов калия и натрия, что обеспечивает отрицательный суммарный заряд; снаружи ситуация противоположная, и, соответственно, имеется положительный заряд. Калиево-натриевый баланс внутри трубки отличается от баланса снаружи: внутри больше ионов калия, а снаружи — натрияСнаружи волокна находятся те же ионы, но в других соотношениях: ионов натрия больше, чем ионов калия. В состоянии покоя содержимое трубки имеет суммарный отрицательный заряд (т. е. ионов хлора там больше, чем ионов калия и натрия вместе; напомним, что ионы калия и натрия заряжены положительно, тогда как ионы хлора — отрицательно). Клеточная мембрана, образующая поверхность цилиндра, имеет «утечки», поэтому ионы перемещаются через мембрану таким образом, чтобы нейтрализовать избыточный заряд. Компенсацию утечек и поддержание избыточного отрицательного заряда внутри трубки осуществляет «ионный насос», который очень медленно откачивает ионы натрия через мембрану наружу. Отчасти это же помогает поддерживать избыток ионов калия по сравнению с ионами натрия во внутреннем растворе. Существует также ионный насос, который (более медленно) переносит ионы калия из наружной среды внутрь трубки (что, правда, не способствует поддержанию разности зарядов). Сигнал, распространяющийся по нервному волокну, представляет собой область с обратным распределением зарядов (т. е. положительный заряд внутри и отрицательный снаружи), которая перемещается вдоль волокна (рис. 9.12).
Рис. 9.12. Нервный импульс — зто область с обратным (по отношению к состоянию покоя) распределением заряда, перемещающаяся вдоль волокна. При ее приближении открываются натриевые каналы, пропускающие поток ионов натрия внутрь; сразу после ее прохождения открываются калиевые каналы, обеспечивающие отток ионов калия наружу. Работа ионных насосов восстанавливает исходное состояниеВообразите, что вы находитесь на нервном волокне как раз перед такой областью с обратным распределением зарядов. По мере того, как эта область приближается, электрическое поле открывает в мембране маленькие «дверцы», называемые натриевыми каналами. Это позволяет ионам натрия перемещаться с наружной стороны мембраны обратно внутрь трубки (в результате совместного действия электрических сил и давления, обусловленного разностью концентраций, т. е. «осмоса»). Это приводит к тому, что заряд снаружи становится отрицательным, а внутри — положительным. Когда это происходит, мы знаем, что область обратного распределения заряда, которая и является сигналом, достигла нас. При этом позади нее открываются крошечные «дверцы» другого типа (калиевые каналы), которые выпускают ионы калия наружу, тем самым восстанавливая избыточный отрицательный заряд внутри. Теперь сигнал прошел! Наконец, когда сигнал уже достаточно удалился, медленно, но верно работающие ионные насосы постепенно выкачивают ионы натрия из трубки наружу, закачивая внутрь ионы калия. Таким образом волокно возвращается в состояние покоя и готово к передаче очередного сигнала. Обратите внимание, что сигнал представляет собой просто область обратного распределения заряда, движущуюся вдоль волокна. Вещество как таковое (т. е. ионы) перемещается при этом совсем немного — только внутрь и наружу через клеточную мембрану! Этот странный, экзотической механизм действует на поверку очень эффективно. Он универсален и используется как у позвоночных, так и у беспозвоночных. Но у позвоночных он был усовершенствован за счет изоляции нервных волокон при помощи беловатого жироподобного вещества, называемого миелином. (Именно миелиновым покрытием объясняется цвет «белого вещества» мозга.) Такая изоляция позволяет нервным импульсам распространяться без потерь (от одной «ретрансляционной станции» к другой) и с очень приличной скоростью — до 120 метров в секунду. Когда сигнал достигает терминали, из нее выделяется химическое соединение, называемое нейромедиатором. Это соединение пересекает синаптическую щель и достигает другого нейрона — поверхности дендрита или сомы. При этом у одних нейронов терминаль выделяет нейромедиатор, облегчающий возбуждение следующего нейрона, т. е. посылку нового сигнала вдоль своего аксона. Эти синапсы называются возбуждающими. У других нейронов терминали выделяют нейромедиатор, затрудняющий другому нейрону генерацию собственного импульса, и поэтому называются тормозящими. На каждом нейроне действие активных в данный момент возбуждающих синапсов суммируется, из результата вычитается суммарное действие тормозящих синапсов, и если полученная разность превышает определенное критическое значение, то нейрон действительно возбуждается. (Возбуждающие синапсы создают положительную разность потенциалов между внутренней и наружной сторонами мембраны следующего нейрона, а тормозящие — отрицательную. Эти разности потенциалов складываются. Нейрон возбудится только в том случае, если результирующая разность потенциалов на мембране в начале его аксона достигнет определенной критической величины, при которой ионы калия не успевают выходить наружу достаточно быстро, чтобы восстановить равновесие.)
Рис. 9.13. Логический элемент «и». В «нейронной модели» (справа) нейрон возбуждается только в том случае, когда на его вход поступают одновременно два импульса(Тогда, если по обоим окончаниям приходят двойные импульсы, то и первый, и второй импульс превысят заданный двухимпульсный порог срабатывания; а если хотя бы на один входной синапс приходит одиночный импульс, то превысит порог лишь одна пара возбуждающих импульсов. Я предполагаю, что все импульсы хорошо согласованы по времени, и что в случае двойного импульса, для определенности, синхронизация осуществляется по первой паре импульсов.) Конструкция элемента «не» (т. е. «~») значительно сложнее. Один из способов его построения приведен на рис. 9.14.
Рис. 9.14. Логический элемент «не». В «нейронной модели», как и ранее, для срабатывания нейрона требуется одновременное воздействие двух (по крайней мере) одиночных импульсовВходной сигнал поступает по аксону, разделяющемуся на две ветви. Одна из ветвей имеет увеличенную длину, такую, чтобы сигнал при движении по ней запаздывал ровно на время, равное промежутку между импульсами в паре. Затем обе ветви снова разделяются, и одно из ответвлений каждой ветви отходит к тормозящему нейрону, причем аксон от ветви с задержкой предварительно разделяется снова, образуя прямую ветвь и ветвь с задержкой. На выходе тормозящего нейрона не будет ничего при одиночном импульсе на его входе, и двойной импульс (с задержкой), если на его входе также был двойной импульс. Аксон тормозящего нейрона разделяется на три ветви, каждая из которых образует тормозящий синапс на оконечном нейроне. Оставшиеся два ответвления исходного аксона снова разделяются, так что к конечному нейрону подходят уже четыре терминали, образующие возбуждающие синапсы. При желании читатель может проверить, что выходной сигнал этого конечного нейрона соответствует сигналу элемента «не» (т. е. пара импульсов, если на входе был одиночный, и наоборот). (Такая конструкция кажется абсурдно усложненной, но это наилучшее из того, что пришло мне в голову!) В качестве развлечения читатель может составить подобные «нейронные» схемы и для остальных описанных выше логических элементов. Естественно, эти конкретные примеры не могут служить серьезными моделями того, что происходит в мозге на самом деле. С их помощью я только старался показать, что описанная выше модель возбуждения нейрона по сути логически эквивалентна конструкции электронного компьютера. Легко видеть, что с помощью компьютера можно воспроизвести любую модель соединения нейронов между собой. В то же время, подробно рассмотренные выше конструкции указывают на то, что и, наоборот, системы нейронов могут быть моделями компьютера и, следовательно, могут действовать как (универсальная) машина Тьюринга. Хотя при обсуждении машин Тьюринга во второй главе мы не использовали понятие логических элементов[209] и, в действительности, для построения модели машины Тьюринга в общем случае помимо логических элементов нам понадобилось бы еще многое другое, в этом нет ничего принципиально нового, если только мы допускаем возможность аппроксимации используемой в машине Тьюринга бесконечной ленты огромным, но конечным множеством нейронов. А это уже, как кажется, подводит нас к выводу о том, что мозг по своей сути эквивалентен компьютеру! Но прежде, чем делать такие поспешные выводы, нам следует рассмотреть некоторые различия между деятельностью мозга и работой современных компьютеров, которые могут оказаться достаточно важными. Во-первых, я слишком упростил описание возбуждения нейрона, отнеся его к явлениям типа «все или ничего». Это справедливо для одиночного импульса, распространяющегося по аксону. На самом деле, когда нейрон возбуждается, он генерирует целую последовательность импульсов, быстро следующих друг за другом. Даже в состоянии покоя нейрон генерирует импульсы, но с гораздо меньшей частотой. Именно многократное увеличение частоты импульсов характеризует переход нейрона в возбужденное состояние. Кроме того, есть еще и вероятностный аспект срабатывания нейрона. Один и тот же стимул может приводит к различным результатам. Более того, в мозге нет точной синхронизации с помощью постоянной тактовой частоты, которая необходима для работы современных компьютеров. Кроме того, следует отметить, что максимальная частота срабатывания нейрона, составляющая около 1000 импульсов в секунду, гораздо меньше, чем у современных электронных устройств, у которых она более чем в 1 млн раз выше. К тому же, по сравнению с очень высокой точностью соединений в электронном компьютере, действительные соединения между нейронами кажутся в большой степени случайными и избыточными — правда, сегодня мы знаем, что в мозге (при рождении) эти соединения установлены с гораздо большей точностью, чем считалось полвека назад. Может показаться, что большая часть из сказанного выше характеризует мозг с невыгодной стороны по сравнению с компьютером. Но есть и другие факторы, говорящие в пользу мозга. У логических элементов может быть лишь очень ограниченное количество входов и выходов (скажем, три-четыре, не больше), тогда как нейроны могут иметь гигантское число синапсов. (Предельным случаем можно считать нейроны мозжечка, известные как клетки Пуркинье, у которых количество возбуждающих синапсов достигает 80 000.) Помимо этого, общее число нейронов в мозге также превышает максимальное количество транзисторов, входящих в состав самой большой в мире вычислительной машины — примерно 1011 в мозге и «всего лишь» 109 у компьютера. Однако последнее число в будущем, скорее всего, возрастет[210]. Более того, большое число клеток мозга в значительной степени обусловлено огромным количеством мелких клеток-зерен в мозжечке, которых насчитывается около тридцати миллиардов (3 х 1010). Если считать, что осознанным восприятием, в отличие от современных компьютеров, мы обладаем просто благодаря большому числу нейронов, то нам придется найти какое-то дополнительное объяснение тому, что деятельность мозжечка полностью бессознательна и в то же время сознание может быть связано с головным мозгом, в котором нейронов всего в два раза больше (около 7 х 1010) при значительно меньшей плотности.
Рис. 9.15. Синаптические контакты, образуемый шипиками дендритов. Эффективность такого соединения легко изменяется при росте или уменьшении шипикаЗдесь «контакт» означает не соприкосновение, а узкий зазор (синаптическую щель) заданной ширины — около одной сорокатысячной доли миллиметра. При определенных условиях шипики дендритов могут исчезать, тем самым нарушая контакт, или вырастать (могут образовываться и новые) и формировать новую связь. Таким образом, если мы представим себе, что совокупность соединенных друг с другом нейронов в мозгу действительно образует компьютер, то это компьютер, способный непрерывно изменяться! Согласно одной из ведущих теорий долговременная память обусловлена именно такими изменениями синаптических контактов. Именно они обеспечивают возможность сохранения необходимой информации. Если это так, то пластичность предстает перед нами уже не просто как несущественное усложнение деятельности мозга, но как ее важнейшее свойство. Каков механизм этих непрекращающихся изменений? Как быстро они могут происходить? Однозначный ответ на второй вопросов вряд ли существует, хотя представители по крайней мере одной из научных школ утверждают, что такие изменения могут происходить за несколько секунд. Этого можно было ожидать, если такие изменения ответственны за долговременное запоминание, поскольку оно происходит за характерное время около одной секунды (Кандел [1976]). Это имело бы для нас весьма существенное значение в дальнейшем. Я вернусь к этому важному вопросу в следующей главе. А что же можно сказать о механизмах пластичности мозга? Согласно оригинальной теории, предложенной в 1954 году Дональдом Хеббом, существуют определенные синапсы (впоследствии получившие название «синапсов Хебба»), обладающие тем свойством, что связь между нейронами А и В, обусловленная синапсом Хебба, усиливается каждый раз, когда за возбуждением А следует возбуждение В, и ослабляется, если В не возбуждается. Изменение эффективности связи между нейронами не зависит от степени участия самого синапса Хебба в возбуждении нейрона В. Это делает возможной некоторую форму «обучения». На основе этой теории был предложен целый ряд математических моделей обучения и решения задач. Они получили название нейронных сетей. По-видимому, нейронные сети действительно способны к какому-то элементарному обучению, но им пока еще далеко до реальных моделей мозга. В любом случае, механизмы, управляющие изменениями синаптических контактов, скорее всего более сложны, чем рассмотренные выше. Очевидно, что необходимы дальнейшие исследования. С пластичностью связан и другой аспект выделения нейромедиаторов терминалями. Иногда нейромедиаторы выделяются вовсе не в синаптические щели, а в окружающую межклеточную жидкость, возможно, для воздействия на другие, расположенные на большом удалении нейроны. По-видимому, многие нейрохимические вещества выделяются подобным образом. Существуют различные теории памяти, в которых используются разнообразные сочетания таких веществ, участвующих в процессе запоминания. Конечно, состояние мозга зависит от наличия в нем химических соединений (например, гормонов), выделяемых различными его частями. Проблемы нейрохимии в целом весьма сложны, и пока непонятно, как можно подойти к созданию правдоподобной и полной компьютерной модели мозга.
Рис. 10.1. Видеокамера, направленная на зеркало, строит модель себя внутри самой себя. Становится ли она от этого самосознающей?Я хочу пойти в другом направлении. Как мы уже знаем, не вся деятельность нашего мозга сопровождается работой сознания (в особенности, это относится к действиям, которые управляются мозжечком). А какая часть из того, что мы можем делать осознанно, не может быть сделана бессознательно? Проблема становится еще менее ясной из-за того, что все, для чего нам изначально требуется сознание, похоже, может быть со временем заучено и впоследствии выполняться уже автоматически (возможно, именно мозжечком). Кажется, что сознание требуется, чтобы справляться с ситуациями, где нам приходится высказывать новые суждения, и где правила не были заданы заранее. Трудно достичь большой точности при проведении различий между теми видами умственной деятельности, которые, по-видимому, требуют подключения сознания, и теми, которые нет. Сторонники «сильного» ИИ (да и многие другие) будут настаивать на том, что «формирование новых суждений» — это не более, чем повторное применение ряда точно сформулированных алгоритмических правил — только теперь на некоем полумистическом «высоком уровне», так, что их действия нами при этом не осознаются. Однако, как мне кажется, даже в нашем обиходном лексиконе есть такие термины — используемые нами в повседневной жизни для разделения умственной деятельности на осознанную и бессознательную — которые уже сами по себе могут по меньшей мере навести на мысль о различиях между действиями неалгоритмической и алгоритмической природы: Сознание требуется: «здравый смысл», «суждение об истинности» «понимание», «художественная оценка»; Сознание не требуется: «автоматизм», «бездумное следование правилам», «программа», «алгоритмичность». Возможно, эти различия не всегда достаточно четко очерчены хотя бы потому, что в наши сознательные суждения входит немало неосознанных факторов: опыт, интуиция, предрассудки, даже наше привычное использование логики. Но я утверждаю, что сами по себе суждения — это проявления работы сознания. Поэтому я полагаю, что, тогда как бессознательные действия мозга происходят в соответствии с алгоритмическими процессами, действие сознания имеет совершенно иную природу, и потому не может быть описано никаким алгоритмом. Есть некая ирония в том, что многое из того, что я излагаю здесь, является полной противоположностью по отношению к некоторым другим точкам зрения, которые мне приходится довольно часто слышать. Например, утверждают, что именно сознательный ум «рационален» и доступен пониманию; тогда как бессознательные действия нередко загадочны и труднообъяснимы. Те, кто работает с искусственным интеллектом, часто считают, что как только мы сможем понять ход осознанной мысли, то можно сразу же будет придумать соответствующий алгоритм для его компьютерной реализации; а вот таинственные бессознательные процессы нашему пониманию (пока!) не доступны. В моем представлении эти процессы вполне могут быть алгоритмическими, но при этом настолько сложными, что их детальный анализ практически невозможен. Четко осознаваемый ход мысли, который может быть разумно объяснен как нечто полностью логичное, в свою очередь может быть (зачастую) переведен на язык алгоритмов — но на совершенно ином уровне. Мы сейчас говорим не о внутренних процессах (возбуждении нейронов и т. п.), а о манипулировании законченными мыслями. Иногда оно носит алгоритмический характер (как в случае традиционной логики: древнегреческих силлогизмов, формализованных Аристотелем; или символьной логики, разработанной математиком Джорджем Булем; см. Гарднер [1958]); а иногда — неалгоритмический (как в случае с теоремой Геделя или некоторыми примерами, приведенными в главе 4). А как реализовать на компьютере формирование суждений, которое я рассматриваю как критерий наличия сознания, — об этом разработчики ИИ не имеют даже ни малейшего представления! Иногда мне возражают, что, поскольку критерии для этих суждений не являются в конце концов осознанными, то как я могу приписывать такие суждения сознанию? Однако, тем самым мои оппоненты упускают самую суть тех идей, которые я пытаюсь выразить. Ведь я не требую, чтобы мы осознавали, как мы формируем наши сознательные впечатления и суждения. Это привело бы к смешению тех уровней, о которых я только что упоминал. Истинные основания наших осознанных впечатлений наверняка будут недоступны сознанию. Они должны были бы рассматриваться на более глубоком (материальном) уровне по сравнению с первопричинами наших явных мыслей, которые мы непосредственно осознаем. (Ниже я осмелюсь предложить на рассмотрение одну интересную гипотезу на этот счет!) Собственно сознательные впечатления и являются (неалгоритмическими) суждениями. Эта тема, затрагивающая вопрос о возможной неалгоритмической составляющей механизма нашего осознанного мышления, проходила красной нитью и через все предыдущие главы. В частности, заключительная часть дискуссии в главе 4, особенно касающаяся теоремы Геделя, подводила к мысли о том, что (по крайней мере, в математике) сознательное «вглядывание» иной раз позволяет нам устанавливать справедливость утверждения способом, недоступным для алгоритма. (Подробнее я остановлюсь на этом доводе чуть позже.) Конечно же, сами по себе алгоритмы не способны находить истину! Построить алгоритм, генерирующий только ложные суждения, столь же просто, как и алгоритм, результатом работы которого были бы одни только истины. Для определения пригодности или непригодности того или иного алгоритма нам совершенно необходимо своего рода вдохновение, интуитивное прозрение, приходящее извне (далее я еще вернусь к этому вопросу). И я утверждаю, что именно эта способность провидения (или «интуитивного постижения») глубокого различия между истиной и ложью (равно как и между красотой и уродством!) является признаком наличия сознания. Я, однако, должен сразу же оговориться, что ни в коем случае не имею здесь в виду какое-то мистическое «ясновидение». Сознание абсолютно бесполезно при попытке угадать счастливое число в (честно проводимой) лотерее! Я имею в виду суждения, которые постоянно формируются человеком в сознательном состоянии, когда собираются воедино и сопоставляются все относящиеся к предмету размышлений факты, данные чувственного опыта, воспоминания — а в иную минуту вдохновения даже рождаются мудрые мысли. В принципе, мы располагаем достаточным количеством информации для того, чтобы вынести соответствующее суждение — но процесс его осмысленного формирования путем выделения необходимой информации из трясины фактов может просто не иметь точного выражения на языке алгоритмов (или же подобное выражение существует, но может оказаться при этом бесполезным практически). Возможно, мы находимся в ситуации, что когда суждение уже сделано, некоторый алгоритмический процесс (или просто более простое суждение) проверяет его справедливость, но не его изначальное формирование. В такой ситуации, как мне кажется, сознание «нашло бы себя» в роли создателя подходящих суждений. Почему я утверждаю, что неалгоритмическое построение суждений является критерием наличия сознания? Отчасти я опираюсь здесь на свой опыт ученого-математика. Я просто не доверяю своим механическим действиям, если они не были сперва придирчиво исследованы сознанием. Часто сам по себе алгоритм, использующийся при определенных вычислениях, не вызывает сомнения — но тот ли алгоритм используется для решения данной конкретной задачи? Рассмотрим простой пример: если вас заставят вызубрить алгоритмы перемножения двух чисел и деления одного числа на другое (или даже разрешат использовать запрограммированный карманный калькулятор) — гарантирует ли это, что вы сможете определить в каждом конкретном случае, какое из этих действий приведет к решению поставленной перед вами задачи? Для этого нужно думать и строить осознанное суждение. (Вскоре мы увидим, почему такие суждения должны быть, по крайней мере иногда, неалгоритмическими!) Разумеется, коль скоро вы решите большое количество однотипных задач, выбор между умножением и делением станет настолько привычным, что будет выполняться совершенно автоматически — не исключено, что при участии одного лишь мозжечка. На этой стадии осознанное восприятие происходящего не является больше необходимым, поэтому можно спокойно позволить своему сознанию занять ум иными проблемами или просто «отпустить его в свободное плавание» — разве что время от времени проверяя ход выполнения алгоритма. То же самое постоянно происходит на всех уровнях математического мышления. Люди часто стремятся найти адекватные алгоритмы, когда занимаются математикой, но само это стремление отнюдь не кажется алгоритмической процедурой. Как только подходящий алгоритм найден, задача, в некотором смысле, уже решена. Более того, определение с точки зрения математики степени точности или пригодности алгоритма требует значительных усилий со стороны сознания. Нечто подобное имело место при обсуждении формальных систем для математики, которые были описаны в главе 4. Если начать с формулировки нескольких аксиом, то затем из них можно вывести различные математические утверждения. Не исключено, что последняя операция может оказаться алгоритмической, но все же изначально математик должен осознанно решить вопрос об адекватности этих аксиом. Почему это решение с необходимостью будет неалгоритмическим, должно стать ясным из рассуждений, идущих непосредственно после следующего параграфа. Но прежде, чем мы перейдем к этому вопросу, давайте посмотрим, какая теория возникновения мозга и принципов его деятельности является на сегодняшний день наиболее популярной.
«…Я покинул Кон, где я жил в то время, чтобы принять участие в геологической экспедиции, организованной Горной школой. Впечатления от поездки заставили меня забыть о моей математической работе. Достигнув местечка Кутонс мы сели в омнибус, чтобы добраться на нем до следующего пункта назначения. В тот момент, когда я ставил ногу на подножку, мне пришла в голову идея, которая, казалось, никоим образом не вытекала из моих прошлых раздумий, что преобразования, используемые мной для определения функций Фукса, были идентичны определенным преобразованиям в неэвклидовой геометрии. Я не проверил эту идею. У меня просто не было времени, так как когда я занял свое место в омнибусе, я продолжил прерванную беседу — но я был совершенно уверен в правильности моей догадки. Вернувшись в Кон, я выбрал свободное время и, проверив для собственного спокойствия свое предположение, убедился в его справедливости».Что поражает в этом примере (как и во многих других, приведенных Адамаром) — это внезапность появления столь сложной и глубокой идеи в сознании Пуанкаре, которое в тот момент было занято совершенно другим; и тот факт, что возникновение этой идеи сопровождалось четким ощущением ее истинности, которую полностью подтвердили последующие расчеты. Тут нужно сразу оговориться, что подобные идеи сама по себе далеко не так просты, чтобы их можно было легко выразить словами. Думаю, что для ясного изложения своих мыслей Пуанкаре потребовалось бы провести примерно часовой семинар для экспертов в этой области. Ясно, что эта идея могла полностью оформиться в сознании Пуанкаре только после долгих часов размышлений, направленных на изучение всех возможных аспектов указанной проблемы. Да, в некотором смысле, идея, осенившая Пуанкаре, когда он садился в омнибус, была «единичной» идеей, которую можно было полностью осознать в один момент. Еще более замечательной представляется убежденность Пуанкаре в ее справедливости — убежденность, которая сделала последующую детальную проверку этой идеи почти что излишней. Пожалуй, мне стоит попытаться соотнести этот случай с моим собственным опытом, который оказывается в каком-то смысле похожим. На самом деле, я не могу вспомнить ни одной ситуации, когда хорошая идея пришла бы мне в голову «с неба», как это произошло в случае с Пуанкаре (или во многих других известных примерах подлинного вдохновения). Что касается меня, то мне нужно, чтобы выполнялись определенные условия: мне необходимо думать о том вопросе, над которым я в данный момент работаю, пусть даже в «фоновом режиме» и не целенаправленно, но обязательно осознанно; вполне возможно, что при этом я буду заниматься чем-то посторонним и успокаивающе-монотонным, например, бриться; вероятно, я заново возьмусь размышлять о проблеме, которая на некоторое время была отложена в сторону. И, конечно же, нужно посвятить не один час упорным сознательным раздумьям, после которых может потребоваться определенное время для того, чтобы вновь переключиться на решаемую проблему. И, тем не менее, ощущение, когда искомое решение возникает при таких условиях подобно «вспышке» — и при этом ты совершенно уверен в его правильности — мне достаточно хорошо знакомо. Вероятно, стоит привести конкретный пример, который может оказаться небезынтересным и с другой точки зрения. Осенью 1964 года меня занимал вопрос о сингулярностях черных дыр. Оппенгеймер и Снайдер в 1939 году показали, что строго сферический коллапс массивной звезды может приводить к образованию центральной сингулярности пространства-времени, выходящей за пределы классической общей теории относительности (см. главу 7, «Черные дыры» и «Структура пространственно-временны́х сингулярностей»). Многие считали, что этого неприятного вывода можно было бы избежать, если бы удалось убрать (необоснованное) предположение о строгой сферической симметрии. В противном случае получается, что вся коллапсирующая материя стремится к единой центральной точке, где (как вполне закономерно было бы предположить, учитывая симметричность ситуации) возникает сингулярность бесконечной плотности (вещества). Вполне разумным кажется предположение о том, что без такой симметрии материя попадала бы в центральную область далеко не так согласованно, вследствие чего сингулярности бесконечной плотности могло бы и не получиться. Возможно даже, что вся материя в этом случае снова «раскрутилась» бы, демонстрируя поведение, совершенно отличное от идеализированной черной дыры Оппенгеймера и Снайдера[218]. Стимулом для моих собственных размышлений на эту тему послужил вновь возникший интерес к проблеме черных дыр, связанный со сравнительно недавно открытыми квазарами (в начале 1960-х годов). Физическая природа этих на удивление ярких (с учетом отделяющих их от Земли расстояний) астрономических объектов вызвала у некоторых специалистов предположение о том, что в центре каждого из них может находиться нечто наподобие черной дыры Оппенгеймера — Снайдера. С другой стороны, многие считали, что гипотеза Оппенгеймера — Снайдера о сферической симметрии может привести здесь к совершенно неверным представлениям. Однако мне пришло в голову (в контексте другой работы, которую я выполнял), что можно было бы сформулировать и доказать точную математическую теорему, указывающую на неизбежность возникновения сингулярностей в пространстве-времени (в рамках стандартной общей теории относительности) и тем самым подтверждающую наличие черных дыр — при условии достижения коллапсом определенной «точки необратимости». Я не знал, как математически можно было бы определить такую точку (не используя при этом условия сферической симметрии), не говоря уже о формулировке или доказательстве соответствующей теоремы. В то время приехал коллега из США Айвор Робинсон, с которым у меня, пока мы шли по улицам Лондона в направлении моего офиса, завязалась оживленная дискуссия на совершенно другую тему. Разговор на момент прекратился, когда мы переходили через дорогу, и был продолжен только на другой ее стороне. И в эти несколько мгновений — я знаю это совершенно точно! — у меня возникла некая идея, которая также быстро оказалась стерта из памяти возобновившейся беседой! В тот же день, после того, как мой коллега ушел, я вернулся в свой офис. Я помню, что у меня было странное чувство душевного подъема, которое я сам себе никак не мог объяснить. Я начал перебирать все отложившиеся в памяти впечатления этого дня в попытке отыскать причину такого непонятного воодушевления. После исключения множества неподходящих возможностей, я в конце концов вспомнил ту мысль, которая возникла у меня при переходе улицы — и в которой заключалось решение задачи, постоянно крутившейся у меня в голове все последнее время! Несомненно, это был искомый критерий — который я впоследствии назвал «ловушечная поверхность» — и мне уже не понадобилось много времени, чтобы набросать план доказательства искомой теоремы (Пенроуз [1965]). И хотя прошло еще немало времени, прежде чем было сформулировано математически строгое доказательство — ключевое место в нем сохранила та первоначальная идея, которая пришла мне в голову при пересечении улицы. (Я иногда пытаюсь представить себе, что было бы, если бы в течении этого дня произошло другое, менее существенное событие, сравнимое, однако, по эмоциональному воздействию. Может быть, в этом случае, я бы вообще никогда не вспомнил про свою мимолетную идею!) Эта история подводит меня к еще одному вопросу, связанному с вдохновением и озарением, и касающемся той более чем существенной роли, которую играют при формировании суждений эстетические критерии. Можно смело утверждать, что в искусстве эстетические критерии имеют первостепенное значение. Эстетика в искусстве — это сложнейший предмет, изучению которого философ посвящает иной раз всю свою жизнь. Можно было бы утверждать, что в математике, да и в науке вообще, такие критерии скорее второстепенны, а главным критерием всегда является истинность. Однако вряд ли возможно отделить одно от другого, когда речь заходит о вдохновении и озарении. У меня создается впечатление, что твердая уверенность в правильности идей, приходящих в голову в момент прозрения очень тесно (пусть не полностью коррелируя, но и заведомо не случайно) связана с эстетическими качествами. Красивая идея имеет гораздо больше шансов быть правильной, чем идея нескладная. По крайней мере, об этом свидетельствует мой собственный опыт, а также аналогичные замечания, сделанные другими (см. Чандрасекар [1987]). Вот что, например, пишет Адамар:
«…ясно, что никакое значительное открытие или изобретение не может быть сделано без сознательного стремления к нему. Но в случае с Пуанкаре мы видим и другое — чувство прекрасного, котороесыграло свою роль необходимого средства изысканий. И мы приходим к двойному заключению: что изобретение — это выбор; что критерием этого выбора служит чувство научной красоты».Более того, Дирак [1982], например, непоколебим в убеждении, что именно его тонкое чувство прекрасного позволило ему предугадать вид уравнения электрона («уравнение Дирака», упоминаемое в гл. 6. «Уравнение Шредингера; уравнение Дирака»), в то время как поиски остальных не увенчались успехом. Я нисколько не сомневаюсь в том, что для меня значение эстетических критериев для мышления трудно переоценить — как в случае ощущения «уверенности» при спонтанном возникновении идей в минуты «вдохновения»; так и в отношении более «прозаических» решений, которые постоянно приходится находить, продвигаясь к желанной цели. Я писал об этом еще в связи с открытием непериодичных «плиточных» наборов замощений, показанных на рис. 10.3 (гл.10 «„Плиточные“ структуры и квазикристаллы») и рис. 4.11 (гл.4 «Некоторые примеры нерекурсивной математики»). Бесспорно, именно эстетичность первого набора — не только внешний вид, но также и его интригующие математические свойства — позволили мне интуитивно (возможно, в виде «вспышки», но только лишь с 60 %-ной вероятностью!) понять, что этот узор мог быть создан по определенным правилам состыковки (то есть как мозаика-головоломка). Скоро я собираюсь подробнее рассказать об этих плиточных структурах (см. Пенроуз [1974]). На мой взгляд очевидно, что эстетические критерии важны не только при формировании спонтанных суждений, являющихся результатом озарения, но и гораздо чаще — в каждом суждении, которое появляется в ходе математической (или, говоря в целом, научной) работы. Строгое доказательство — это обычно последний шаг! Перед этим приходится строить множество предположений, и на этом этапе решения, подсказанные эстетическим восприятием, играют исключительно важную роль — конечно, с учетом логически непротиворечивых выводов и известных фактов. Именно эти суждения я принимаю в качестве критерия сознательного мышления. Я полагаю, что даже при внезапной вспышке озарения, которая, вероятно, является конечным «продуктом» работы бессознательного, арбитром является сознание, и идея будет быстро отвергнута и забыта, если, по мнению сознания, она «не звучит». (Забавно, что я все-таки забыл о своей «ловушечной поверхности» — но не на том уровне, который я имею в виду. Идея достаточно прочно засела в сознании, чтобы надолго сохранить напоминание о себе.) «Эстетический» запрет, о котором идет речь, мог бы, как я полагаю, вообще закрыть доступ неприглядным идеям к тем уровням сознания, где они могли бы осознанно восприниматься сколь-нибудь длительное время. Какова моя точка зрения на участие бессознательного в рождении «вдохновенной мысли»? Признаюсь, что эти вопросы далеко не так ясны для меня, как хотелось бы. Эта та область, в которой бессознательное, по-видимому, и в самом деле играет крайне важную роль, и я должен согласиться с тем, что бессознательные процессы там весьма существенны. Также приходится признать, что вряд ли бессознательное подбрасывает нам идеи случайным образом. Должен существовать мощнейший механизм отбора, который позволял «тревожить» сознание только тем идеям, у которых «есть шанс». Я готов предположить, что критерии отбора — по большей части носящие своеобразный «эстетический» характер — в значительной степени утверждаются уже с учетом «пожеланий сознания» (подобно ощущению нескладности, возникающему при виде математических идей, которые несовместимы с уже установленными общими принципами). В связи с этим необходимо затронуть вопрос о том, что представляет собой подлинная оригинальность. Мне кажется, что тут действуют два фактора, а именно: процессы «предложения» и «отбора». Из них «предложение» кажется мне по большей части процессом бессознательным, тогда как «отбор» — наоборот. Без эффективного процесса «предложения» новые идеи не возникали бы совсем. Но сама по себе эта процедура мало полезна. Нужен эффективный механизм оценки этих идей, который позволил бы выжить только тем из них, которые представляются достаточно разумными. Во сне, например, необычные идеи возникают легко и в большом количестве — но лишь в очень редких случаях они проходят критический контроль бодрствующего сознания. (Что касается меня, то у меня во сне никогда не возникали плодотворные научные идеи, в то время как другим — например, химику Кекуле при открытии им структуры бензола — кажется, повезло больше.) По моему мнению, именно сознательный процесс «отбора» (или построения суждений) является центральным в содержании понятия оригинальности, а вовсе не бессознательный процесс «предложения»; но я прекрасно понимаю, что многие могут придерживаться противоположной точки зрения. Прежде чем оставить эту тему в таком неудовлетворительном состоянии, как она есть, я должен упомянуть другую поразительную черту, присущую рожденным в состоянии вдохновения идеям, а именно — их масштабность. История Пуанкаре, рассказанная выше, являет собой поразительный пример проявления этого свойства, поскольку идея, мимолетно возникшая в его голове, должна была охватывать весьма обширную область математической мысли. Возможно, более наглядным для читателя-нематематика (хотя и столь же непостижимым) является способ, которым (иные) художники могут представить себе весь замысел своего творения целиком. Подобный удивительный случай очень живо описан Моцартом (см. Адамар [1945], с. 16):
«Когда я чувствую себя хорошо и нахожусь в добром расположении духа; или когда я предпринимаю поездку или отправляюсь на прогулку после сытной трапезы; или ночью во время бессонницы — мне в голову приходит сколько угодно самых разных идей. Откуда и как они приходят? Я не знаю и ничего не могу с этим поделать. Те, которые мне приятны, я удерживаю в голове и часто напеваю без слов; так, по крайней мере, мне говорили. Когда у меня возникает тема, сразу же приходит следующая мелодия, соединяясь с первой согласно требованиям композиции в целом: контрапункт, партия каждого инструмента — и, наконец, все музыкальные фрагменты складываются в завершенное произведение. Тогда моя душа горит вдохновением. Произведение растет; я постоянно дополняю его, прорабатываю все более мелкие детали, пока в один прекрасный момент композиция не оказывается полностью сформирована у меня в голове, хотя она может быть и довольно длинной. Тогда мой ум охватывает ее единым взглядом, как красивую картину или прекрасную девушку. Это не последовательный процесс, при котором различные части произведения прорабатываются до мелочей и стыкуются друг с другом (так, как это будет сделано в дальнейшем) — нет, я слышу его целиком, как это позволяет мое воображение».Мне кажется, что это хорошо согласуется с моей схемой «предложения-отбора». «Предложение» представляется здесь бессознательным («я ничего не могу с этим поделать»), хотя и, несомненно, в высокой степени избирательным, в то время как «отбор» выполняет функцию сознательного судьи вкуса («те, которые мне приятны, я удерживаю…»). Масштабность идеи, рожденной в минуты вдохновения, особенно отчетливо проглядывает в высказывании Моцарта («это не последовательный процесс… нет, я слышу его (произведение) целиком») и Пуанкаре («Я не проверил эту идею. У меня просто не было времени…»). Более того, я готов настаивать, что нашему сознательному мышлению в целом подобная масштабность присуща изначально. К этому вопросу я еще вернусь.
«Слова или язык, как в устной, так и в письменной форме, по-видимому, не играют никакой роли в механизме моего мышления. Психические сущности, которые, по-видимому, и являются составляющими элементами мысли — это определенные знаки и более или менее отчетливые образы, которые могут „произвольно“ воспроизводиться и комбинироваться по собственному желанию… В моем случае, упомянутые элементы носят визуальный и моторный характер. Общепринятые слова или другие знаки мне приходится подбирать только на второй стадии, когда упомянутые ассоциативные связи приобретают отчетливые очертания и могут быть воспроизведены по моей воле».Еще здесь стоит процитировать видного генетика Фрэнсиса Гальтона:
«Для меня серьезную трудность представляет письмо, а еще большую — словесное изъяснение, так как размышления в словесной форме даются мне далеко не так легко, как в любой другой. Часто случается, что проделав большую работу и получив результаты, которые мне абсолютно ясны и вполне меня удовлетворяют, при попытке выразить их словами я сталкиваюсь с необходимостью переводить себя в совершенно иную интеллектуальную плоскость. Мне приходится перекладывать свои мысли на язык, который не слишком-то хорошо им соответствует. Поэтому я вынужден тратить уйму времени в поисках подходящих слов и фраз, и часто осознаю, что, выступая без подготовки, бываю не понят не из-за неясности содержания высказывания, а только лишь из-за неуклюжести своих вербальных конструкций. Это один из небольших, но досадных моих недостатков».Нечто сходное пишет и сам Адамар:
«Я утверждаю, что слова полностью отсутствуют в моей голове, когда я действительно предаюсь раздумьям, и я нахожу случай Гальтона полностью идентичным моему личному опыту, поскольку и у меня самого даже после прочтения или выслушивания вопроса все слова исчезают в тот самый момент, когда я начинаю их обдумывать; и я полностью согласен с Шопенгауэром, когда он пишет: „Мысли умирают в момент, когда воплощаются в слова“».Я цитирую эти примеры, потому что они очень хорошо согласуются с моим собственным способом мышления. Почти все мое математическое мышление визуализируется или протекает на уровне невербальных понятий, хотя мысли очень часто сопровождаются пустыми и почти бесполезными словесными комментариями, такими как «вот это идет с этим, а это — с этим». (Иногда я могу употреблять слова для выражения простых логических выводов.) Трудности, которые испытывали упомянутые ученые при переводе своих мыслей на язык слов, я часто испытывал и сам. Причиной тому в большинстве случаев служило просто-напросто отсутствие адекватных терминов, способных выразить требуемые понятия. Действительно, я часто веду расчеты, используя специально разработанные диаграммы, которые представляют собой сокращенную запись определенных типов алгебраических выражений (см. Пенроуз и Риндлер [1984]). Необходимость перевода таких диаграмм в слова — это очень трудоемкий процесс, и я это делаю только в случае крайней необходимости, когда нужно подробно объяснить что-то другим. И еще одно наблюдение: я случайно заметил, что если сосредотачиваю все свое внимание на математике и некоторое время занимаюсь только ей, а потом кто-то внезапно обращается ко мне, то в течение нескольких следующих секунд я почти не способен говорить. Не могу сказать, что я никогда не думаю в словесной форме — просто я нахожу слова почти бесполезными для математического мышления. Другие виды рассуждений, возможно, такие, как философские, являются, вероятно, гораздо более подходящими для вербального выражения. Может быть, поэтому так много философов считают язык неотъемлемым средством интеллектуальной деятельности и сознательного мышления! Нет сомнения, что каждый человек думает по-своему — это подтверждает и мой собственный опыт, и мнения других математиков. Наиболее полярными стилями математического мышления являются, как кажется, аналитический/геометрический. Интересно, что Адамар считал себя аналитиком, хотя использовал скорее визуальные, чем вербальные образы в своем математическом мышлении. Что касается меня, то я в значительной степени тяготею к геометрическим методам. Если же говорить обо всех математиках, то разброс здесь окажется весьма широк. Но коль скоро мы согласились с тем, что значительная часть сознательного мышления, на самом деле, может иметь невербальный характер — ас моей точки зрения к другому выводу приведенные выше соображения привести не могут — тогда, наверное, читателю будет нетрудно поверить также и в то, что подобное мышление может иметь неалгоритмическую составляющую! Напомню, что в главе 9 («Где обитает сознание?») я упоминал о часто встречающейся точке зрения, согласно которой только одно полушарие мозга — то, где находится центр речи (левое у большинства людей) — способно также и на сознательное мышление. После ознакомления с вышеизложенным читателю должно быть ясно, почему я считаю эту точку зрения совершенно неприемлемой. Я не знаю, используют ли, как правило, математики одно полушарие чаще, чем другое; но нет сомнения в том, что для истинного математического мышления необходим высокий уровень сознания. В то время как аналитическое мышление, по всей видимости, сосредоточено в левой половине мозга, геометрическое мышление, напротив, часто приписывают правой половине; так что вполне разумной является предположение о том, что значительная часть сознательных математических рассуждений проводится все-таки в правом полушарии!
«Задача не давала ему покоя, и он возвращался к ней вновь и вновь. Затем внезапно — по-другому и не скажешь — его прежде унылая физиономия „озарилась‟. Взгляд шимпанзе перемещался с банана на пустое пространство под ним, оттуда на ящик, потом снова на место под бананом, и оттуда на банан. В следующий момент он издал крик радости и кувыркнулся в сторону ящика, явно пребывая в превосходнейшем настроении. Совершенно уверенный в успехе, он толкнул ящик под банан. Могу поспорить, что никто из видевших его в тот момент не усомнился бы в способности человекообразных обезьян к таким прозрениям, испытав которые, впору воскликнуть, Эврика!“».Обратите внимание, что точно так же, как в случае с Пуанкаре, когда тот садился в омнибус, шимпанзе был «совершенно уверен в успехе» еще до того, как он проверил свою идею. И если я прав, утверждая, что подобные суждения требуют участия сознания, то перед нами оказывается неопровержимое свидетельство того, что животные действительно могут обладать сознанием. Глядя на дельфинов (и китов), мы невольно задаемся одним интригующим вопросом. Как нетрудно заметить, головной мозг дельфинов имеет такие же (или даже большие) размеры, как и наш собственный; а кроме того, дельфины могут посылать друг другу чрезвычайно сложные звуковые сигналы. Вполне возможно, что такой большой мозг нужен для каких-то иных целей, которые не сводятся к «интеллектуальной» деятельности в человеческом или околочеловеческом понимании. Более того: не имея рук, приспособленных для хватания, они не могут создать «цивилизацию», которую мы были бы способны оценить. И хотя они по той же самой причине не могут писать книг, они вполне способны время от времени превращаться в философов и размышлять о смысле своей жизни! Что, если они иногда передают свое ощущение «самосознания» при помощи этих сложных звуковых сигналов, распространяющихся под водой? Я не встречал ни одного исследования, где бы изучалось, используют ли дельфины какую-то одну определенную сторону мозга для «вербализации» и общения друг с другом. В связи с проведенными на людях операциями по разделению мозга, которые загадочным образом влияли на целостность «я» человека, следует отметить еще одну особенность дельфинов: их полушария никогда не погружаются в сон[219] одновременно — вместо этого каждая сторона мозга спит по очереди. Согласитесь, хорошо было бы выяснить у них, как они «ощущают» целостность своего сознания!
Рис. 10.2. Периодические плиточные замощения с разными типами симметрии (где в каждом случае центр симметрии совпадает с центром плитки): 1) с осью второго порядка; 2) с осью третьего порядка; 3) с осью четвертого порядка; 4) с осью шестого порядкаС другой стороны, покрытия на рис. 4.12, как и изображенные на рис. 10.3
Рис. 10.3. Квазипериодическая плиточная структура (следует заметить, что она образована посредством объединения образцов с рис. 4.11) с кристаллографически «невозможной» квазисимметрией с осью пятого порядка(которые, в сущности, представляют собой замощения, образованные соединением решеток, изображенных на рис. 4.11 (гл.4 «Некоторые примеры нерекурсивной математики»), почти имеют трансляционную симметрию и почти обладают симметрией вращения с осью пятого порядка, где «почти» означает, что можно найти такие движения решеток (соответственно, трансляционные и вращательные), при которых решетка переходит сама в себя с любой наперед заданной точностью (кроме 100 %-ной). Не стоит углубляться, что точно означает это утверждение. Единственное, что нам здесь важно — это если в нашем распоряжении есть вещество, в котором все атомы расположены в узлах кристаллической решетки с подобной структурой, то оно будет выглядеть, как кристалл, обладая при этом запрещенной симметрией с осью пятого порядка! В декабре 1984 году израильский физик Дэни Шехтман, работавший вместе с коллегами в Национальном бюро стандартов в США, в Вашингтоне, объявил об открытии фазы алюминиево-марганцевого сплава, который был похож на кристаллоподобное вещество — теперь называемое квазикристаллом — с осью пятого порядка. На самом деле, у этого квазикристаллического вещества наблюдалась симметрия не только на плоскости, но и в трех измерениях — так что в итоге получалась запрещенная икосаэдральная симметрия (Шехтман и др. [1984]). (Икосаэдральный трехмерный аналог моей плоской «плиточной» структуры с осью пятого порядка был открыт Робертом Амманном в 1975 году; см. Гарднер [1989].) Сплавы Шехтмана образовывали только крошечные микроскопические квазикристаллы, достигавшие примерно 10 -3 мм в поперечном сечении, но позднее были найдены другие квазикристаллические вещества, в частности — алюминиево-литиево-медный сплав, у которого икосаэдрально симметричные образования могут вырастать до размеров порядка миллиметра, т. е. становятся вполне различимы невооруженным глазом (рис. 10.4).
Рис. 10.4. Квазикристалл (сплав AL—Li—Сu) с, казалось бы, невозможной кристаллической симметрией. (Из Гэйл [1987].)Замечательным свойством этих квазикристаллических «плиточных» структур является то, что процесс их составления имеет существенно нелокальный характер. Иными словами: при построении подобного покрытия необходимо время от времени проверять состояние кристаллической решетки на расстоянии многих и многих «атомов» от места сборки, чтобы избежать серьезных ошибок при соединении составных частей. (Это чем-то напоминает то почти «сознательное нащупывание», которое я связывал с естественным отбором.) Наличие такого свойства является одной из причин серьезных разногласий, возникающих сегодня в связи с вопросом о квазикристаллических структурах и их выращивании, так что было бы неразумно пытаться делать окончательные выводы до тех пор, пока не будут разрешены некоторые основополагающие проблемы. Тем не менее, никто не запрещает нам выдвигать предположения; поэтому я рискну высказать здесь свою собственную точку зрения. Во-первых, я полагаю, что некоторые из этих квазикристаллических веществ действительно имеют сложное внутреннее строение, и что расположение атомов в их структуре довольно точно повторяет строение тех плиточных структур, которыми я занимался. Во-вторых, отсюда я делаю (всего лишь гипотетическое) заключение о том, что их образование не может совершаться за счет последовательного добавления атомов, как это происходит в рамках классической картины роста кристаллов — но с необходимостью должна опираться на нелокальные и непременно квантово-механические принципы построения[224]. Механизм такого роста я представляю себе следующим образом: вместо присоединения отдельных атомов к постоянно движущейся линии роста (в случае классического роста кристаллов), происходит квантовая линейная суперпозиция большого числа различных альтернативных сочетаний присоединяющихся атомов (путем квантовой операции U). В самом деле, согласно квантовой механике, все именно так и должно (почти всегда) происходить! В каждый момент времени существует не одна возможная структура, но множество альтернативных расположений атомов в сложной линейной суперпозиции. Некоторые из этих структур вырастают в гораздо более крупные образования, так что в определенный момент различия между гравитационными полями альтернативных структур превзойдут «одногравитонный предел» (или его более подходящий в данном случае аналог; см. главу 8, «Когда происходит редукция вектора-состояния?»). На этой стадии одна из них — или, скорее, это снова будет суперпозиция, но уже в несколько урезанном виде — выделиться в качестве истинной структуры (квантовая операция R). В этот процесс роста, сопровождающийся последовательным отказом от наименее «значимых» на каждом этапе альтернатив, будут вовлекаться все бо́льшее и бо́льшее количество исходного вещества, пока наконец не сформируется достаточно крупный квазикристалл. Обычно, когда природа ищет кристаллическую конфигурацию, из всех возможных она выбирает ту, которая характеризуется наименьшим уровнем энергии (считая фоновую температуру нулевой). Нечто аналогичное, по-моему, должно происходить и в процессе роста кристаллов, с той только разницей, что такое состояние с наименьшей энергией гораздо труднее обнаружить, а «наилучшее» расположение атомов не может быть получено просто последовательным добавлением каждый раз одного атома в надежде на то, что индивидуальному атому для этого будет достаточно решить свою собственную задачу минимизации. Вместо этого нам предстоит решать эту же задачу для всей совокупности атомов, а значит, потребуется их совместное усилие. Такое взаимодействие, в моем представлении, должно иметь квантово-механическую природу; и достигаться оно должно при помощи множества различных комбинаций атомных структур, которые одновременно «проверяются» в линейной суперпозиции (примерно так же, как это, вероятно, происходит в квантовом компьютере, упомянутом в конце главы 9). Условием для выбора подходящего (хотя, возможно, не лучшего) решения задачи минимизации должно быть выполнение «одногравитонного критерия» (или приемлемой в данном конкретном случае альтернативы), что, предположительно, имеет место только при соответствующих физических условиях.
Рис. 10.5. Эксперимент Корнхубера. Решение согнуть палец принимается за начало отсчета, однако предшествующий сигнал (усредненный по многим опытам) свидетельствует о том, что сгибание пальца «предвиделось»Во втором эксперименте Бенджамин Либет из Калифорнийского университета, в сотрудничестве с Бертрамом Фейнстейном из Нейрологического института в Сан-Франциско (Либет и др. [1979]) проводили опыты с добровольцами, которым по независимым причинам предстояла хирургическая операция на мозге и которые соглашались на имплантацию электродов в определенные точки соматосенсорной коры своего головного мозга. Эксперимент Либета показал, что между стимуляцией кожи этих пациентов и ее осознанием проходило примерно полсекунды, несмотря на то, что сам мозг должен был получить соответствующий сигнал примерено через одну сотую долю секунды; а заранее запрограммированный «рефлексивный» ответ на этот раздражитель (см. выше) мог быть выработан мозгом примерно через одну десятую секунды (рис. 10.6).
Рис. 10.6. Эксперимент Либета: о) воздействие на кожу, «как кажется», осознается практически без задержки; б) стимуляция коры, длящаяся меньше полсекунды, не осознается; в) стимуляция коры продолжительностью более, чем полсекунды, осознается примерно через полсекунды; г) такая стимуляция коры может приводить к «обратной маскировке» более раннего воздействия на кожу, показывая, что осознание этого воздействия, на самом деле, еще не имело места к моменту стимуляции коры; д) если стимуляция кожи произведена вскоре после такого воздействия на кору, то тогда реакция на стимуляцию кожи «сдвигается назад», хотя с реакцией на стимуляцию соматосенсорной коры этого не происходитБолее того: несмотря на такое «запоздалое» осознание стимулирующего воздействия, субъективное впечатление, возникавшее у пациентов, позволяло им утверждать, что не было вообще никакой задержки! (Некоторые эксперименты Либета предусматривали стимулирование зрительного бугра, (см. гл.9 «Как же устроен мозг?»). Результат был тот же, что и при воздействии на соматосенсорную кору головного мозга.) Напомним, что соматосенсорная кора — это область головного мозга, куда поступают сигналы от органов чувств. Так, электрическая стимуляция зоны соматосенсорной коры, соответствующей некоторому определенному участку поверхности кожи, воспринимается испытуемым в точности так, как если бы что-то действительно коснулось его кожи в этом месте. Однако оказалось, что если эта электрическая стимуляция длится менее, чем примерно полсекунды, то испытуемый не получает никакого ощущения вообще. В противоположность этому, прямая стимуляция точки на самой поверхности кожи может ощущаться даже в том случае, когда она мгновенна. Теперь предположим, что сначала тронули кожу, а затем подвергли электрической стимуляции соответствующую точку в соматосенсорной коре. Что чувствует пациент? Если электростимуляция производится примерно через четверть секунды после касания кожи, тогда касание кожи не ощущается вообще! Этот эффект получил название обратной маскировки. Каким-то образом стимулирование коры мозга препятствует осознанию обычного ощущения от касания кожи. Сознательное восприятие может быть предотвращено («замаскировано») более поздним событием, если это событие происходит не позднее, чем через полсекунды. Это говорит о том, что сознательное восприятие такого воздействия проявляется примерно через полсекунды после самого воздействия! Однако, по все видимости, испытуемые не осознавали столь долгой задержки своего восприятия. Найти разумное объяснение этому удивительному открытию можно было бы, предположив, например, что «время» всех наших «восприятий» действительно отличается примерно на полсекунды от «реального времени» — как будто наши внутренние часы просто «неверны» и отстают на полсекунды или около того. Время восприятия некоторого события в этом случае должно всегда отстоять на полсекунды от того момента, когда указанное событие произошло. Это дало бы возможность представить последовательную, хотя и неудовлетворительно замедленную картину нашего чувственного восприятия. Возможно, что-то подобное происходило во второй части эксперимента Либета, где он вначале стимулировал кору мозга, продолжая эту стимуляцию гораздо дольше, чем полсекунды — и касался кожи во время этой стимуляции, но ранее, чем через полсекунды после ее начала. И стимуляция коры, и касание кожи воспринимались раздельно, так что пациенту было ясно, какой именно стимул он воспринимал. Однако, когда его спрашивали, какой стимул он ощутил первым, он обычно отвечал, что это было касание кожи, тогда как, на самом деле, стимуляция коры всегда предшествовало ему! Таким образом, испытуемый и вправду сдвигал свое восприятие прикосновения к коже назад во времени примерно на полсекунды (см. рис. 10.6). Однако это представляется не просто глобальной «ошибкой» внутреннего ощущения времени, но более тонкой структурной перестройкой временно́й шкалы восприятия событий. Поскольку в случае стимуляции коры (учитывая, что она в действительности воспринимается не позднее, чем через полсекунды после ее начала), такая задержка не наблюдается. Опираясь на данные первого из вышеописанных экспериментов, мы, по всей видимости, можем сделать вывод о том, что сознательному действию необходимо примерно около секунды или полутора секунд на то, чтобы быть приведенным в исполнение; а в соответствии со вторым экспериментом — что осознание внешнего события, по-видимому, не происходит раньше, чем через полсекунды после момента события. Представим себе, что происходит, когда человек реагирует на некоторое неожиданное внешнее событие. Предположим также, что ответ требует моментального сознательного действия. Если принять в расчет открытие Либета, то должно пройти полсекунды прежде, чем сознание «включится»; и после этого, как следует из опытов Корнхубера, потребуется еще секунда, а то и более, прежде чем человек «осознанно» отреагирует на это событие. Таким образом, весь процесс — от сенсорного восприятия до моторного отклика — занимает примерно две секунды! Очевидный вывод из этих двух экспериментов, если рассматривать их вместе, напрашивается сам собой; сознание вообще не может быть задействовано там, где ответная реакция на внешнее событие должна занимать не более пары секунд!
Лестница Пенроуза в фильме режиссера Кристофера Нолана «Начало», 2010 г.(обратно)
Кусочки из литографий Морица Эшера
«Восхождение и спуск». Монахи, идущие во внешнем ряду, все время взбираются вверх, а кто движется во внутреннем, соответственно, неуклонно спускаются вниз.
«Водопад» Морица Эшера.― В этой работе изображен парадокс — падающая вода водопада управляет колесом, которое направляет воду на вершину водопада. Водопад имеет структуру «невозможного» треугольника Пенроуза. ― прим. верст. fb2(обратно)
Последние комментарии
1 день 15 часов назад
1 день 19 часов назад
1 день 21 часов назад
1 день 22 часов назад
1 день 23 часов назад
2 дней 1 час назад