Сопряжённые функции. Сопряженная функция

25.09.2019

Классическая механика и электродинамика при попытке применить их объяснению атомных явлений приводили к результатам, находящихся в резком противоречии с экспериментом. Наиболее яркий тому пример - попытка применения классической электродинамики к модели атома, в которой электроны движутся вокруг ядра по классическим орбитам. При таком движении, как и при всяком движении зарядов с ускорением, электроны должны были бы непрерывно излучать энергию в виде электромагнитных волн и, в конце концов, - неизбежно упасть на положительно заряженное ядро. Таким образом - с точки зрения классической электродинамики - атом неустойчив. Как мы видим - этот тезис не соответствует действительности. Такое глубокое противоречие теории с экспериментом свидетельствует о том, что описание микрообъектов требует фундаментального изменения в основных классических представлениях и законах.

Из целого ряда экспериментальных данных (таких, как дифракция электронов) следует, что механика, которой подчиняются атомные явления - квантовая механика - должна быть основана на представлениях о движении, принципиально отличных от представлений классической механики. В квантовой механике не существует понятия траектории частиц, а, следовательно - и других динамических характеристик. ЭТОТ ТЕЗИС СФОРМУЛИРОВАН В ПРИНЦИПЕ НЕОПРЕДЕЛЕННОСТИ ГЕЙЗЕНБЕРГА:

Нельзя со сколь угодной точностью одновременно измерить координату и импульс микрообъекта:

D x ·D p ³ h (II .1)

Следует отметить (и об этом будет говориться позднее), соотношение неопределенностей связывает не только координату и импульс, но и ряд других величин.

Вернемся теперь к рассмотрению математического аппарата квантовой механики.

Оператором А принято называть правило, согласно которому каждой функции f соответствует функция j :

j= А f (II.3)

Простейшие примеры операторов: извлечение квадратного корня, дифференцирование и т.д.

Не на каждую функцию можно подействовать любым оператором, например не дифференцируемую функцию нельзя подействовать оператором дифференцирования. Поэтому любой оператор бывает определен лишь на некотором классе функций и считается заданным, если указано не только правило, по которому он одну функцию преобразует в другую, но и множество функций, на которые он действует.

По аналогии с алгеброй чисел можно ввести и алгебру операторов:

1) Сумма или разность операторов

(A ± B ) · f = A · f ± B · f (II.4)

2) Произведение операторов

AB · f = A (B · f ) (II.5)

т.е. сначала на функцию f действует оператор B , образуя некоторую новую функцию, на которую затем действует оператор A . В общем случае действие оператора AB не совпадает с действием оператора BA .

Действительно, если A=d/dx и B=x ,

то AB·f=d/dx (xf )= f+xdf/dx ,

а BAf=xdf/dx¹f+xdf/dx

Если AB =BА , то операторы называются коммутирующими, а если AB -BАº{A,B} (II.6) , то они не коммутируют. Выражение в скобках называется коммутатором.

В квантовой механике обычно используются линейные самосопряженные (или эрмитовы) операторы. Свойство линейности означает, что

A (c 1 f 1 + c 2 f 2 )f =c 1 A f 1 + c 2 A f 2 (II.7)

где c 1 и c 2 - константы, а f 1 и f 2 - произвольные функции, на которых определен оператор A . Это математическое свойство тесно связано с принципом суперпозиции.

Самосопряженным эрмитовым оператором называется оператор, для которого выполняется равенство:

òf 1 * (x)(Af 2 (x))dx = òf 2 (x)(A * f 1 * (x))dx (II.8)

при этом предполагается, что A определен на f 1 * (x) и f 2 (x) и все интегралы, входящие в (1.8) существуют. Требование эрмитовости очень важно для квантовой механики и ниже мы выясним, почему.

Как уже говорилось, действие оператора сводится к преобразованию одной функции в другую, однако возможны и такие случаи, когда в результате действия оператора исходная функция не изменяется, либо помножается на константу. Простейший пример:

Можно утверждать, что каждому оператору A можно сопоставить линейное уравнение вида:

A f = af (II .9) ,

где a = const. a - собственное значение оператора, а f - собственная функция оператора. Это уравнение называется уравнением на собственное значение. Значения постоянных, при которых уравнение (1.9) принимает нетривиальные решения, называют собственными значениями. Все вместе они образуют спектр собственных значений, который может быть дискретным, непрерывным или смешанным. Каждому значению соответствует одна или несколько собственных функций f т , причем если одному собственному значению соответствует только одна функция, то оно является невырожденным, а если несколько - то вырожденным.

Собственные функции и собственные значения эрмитовых (самосопряженных ) операторов обладают рядом свойств:

1. Собственные значения таких операторов вещественны.

2. Собственные функции f 1 и f 2 таких операторов, принадлежащих различным собственным значениям с 1 и c 2 соответственно ортогональны между собой, т.е. ò f 1 * (x)f 2 (x)dx = 0 (II .10)

3. Они должны быть нормированы на единицу введением специального нормировочного множителя, что в общем случае описывается условием ортонормированности: ò f m * (x)f n (x)dx = d mn , d mn =0 при m ¹ n и d mn =1 при m = n (II.11)

4. Если два оператора A и B имеют общую систему собственных функций, то они коммутируют, справедливо и обратное утверждение

5. Собственные функции эрмитова оператора образуют полный ортонормированный набор, т.е. любую функцию, определенную в этой же области переменных можно представить в виде ряда по собственным функциям оператора A :

(II.12) ,

где c n - некоторые константы, и это разложение будет точным.

Последнее свойство очень важно для аппарата квантовой механики, поскольку на его основе можно построить матричное представление операторов и применить мощный аппарат линейной алгебры.

Действительно, поскольку в (II.12) собственные функции f n (x) считаются известными, то для нахождения функции F(x) необходимо и достаточно найти все коэффициенты разложения {c n }. Рассмотрим теперь некоторый оператор B , который действует на функцию c(x) и переводит ее в F(x) :

F (x ) = B c(x ) (II .13)

Представим теперь функции F(x) и B c(x) в виде рядов (II.12) :

(II.14)

и подставим их в (II.13)

(II.15)

(II.16)

Помножим обе части равенства на f k * (x) и проинтегрируем, учитывая условия ортонормированности:

Равенство (II.17) описывает переход от функции c(x) к функции F(x) , который осуществляется заданием всех коэффициентов M kn . Набор всех величин M kn есть оператор B в матричном представлении и его можно записать как

Таким образом, любой произвольный оператор B в матричном представлении можно представить в виде квадратной таблицы чисел, матрицы, и это представление будет определятся только видом оператора и исходным набором базисных функций.

Вспомним теперь вкратце основные положения теории матриц. Вообще матрицей называется совокупность вещественных или комплексных чисел a ij , называемыми элементами матрицы, расположенных в виде прямоугольной таблицы

Индексы i и j показывают, что элемент a ij расположен на пересечении i -й строки и j -го столбца. Если матрица имеет n строк и m столбцов, то говорят, что она имеет размерность (n xm ), если n = m , то матрица называется квадратной. Прямоугольная матрица размера (1 xm ) называется вектор-строкой, а (n x1) - вектор-столбцом. Матричный элемент a ij при i = j называется диагональным, матрица, в которой все элементы, кроме диагональных, равны нулю называется диагональной, а диагональная матрица, в которой все элементы равны единице - единичной. Сумма диагональных элементов называется следом: Sp .

Легко построить алгебру матриц, которая будет сводится к следующим правилам:

1. Матрицы и называются равными, если для всех i и j справедливо равенство: a ij = b ij

2. Суммой матриц и размерности (n xm ) будет матрица размерности (n xm ) такая, что для всех i и j справедливо равенство: c ij = a ij + b ij

3. Произведением матрицы на произвольное число a будет матрица такой же размерности, такая, что для всех i и j справедливо равенство: c ij = aa ij

4. Произведением матрицы размерности (n xm ) на матрицу размерности (m xp ) называется матрица размерности (n xp ) такая, что

(II.20)

5. Матрица называется комплексно-сопряженной к если в ней все матричные элементы a ij заменены на комплексно сопряженные a ij * . Матрица называется транспонированной к , если она получена заменой строк на столбцы и наоборот: a ’ ij = a ji . Транспонированная и комплексно-сопряженная к матрица называется сопряженной и обозначается

В большинстве случаен поиски функции удовлетворяющей заданным граничным условиям в плоскости z, начинаются с поисков такого преобразования, которое упростило бы формы границ. Если и новые граничные условия окажутся незнакомыми, нужно искать второе преобразование, еще более упрощающее граничные условия. В конце концов можно прийти к такой системе, в которой решение написать сравнительно просто. После этого необходимо проделать обратный

путь - к решению исходной задачи. Часто, однако, возможно, опуская промежуточные этапы, написать сразу функцию путем исключения промежуточных комплексных переменных. Но даже если это и невозможно, промежуточные переменные служат в качестве параметров, связывающих между собой

При совершении таких преобразований часто очень полезно представлять себе рассматриваемую область плоскости в виде упругой мембраны, обладающей свойством сохранять углы между любыми нанесенными на ней линиями при любых деформациях ее границ. При этом мембрана не может отрываться от границ, но может скользить вдоль них, а также бесконечно растягиваться и сжиматься.

Предположим, например, что в интересующей нас задаче границы проводника представляют собой две неконцентричные и непересекающиеся окружности, или две пересекающиеся окружности, или же, наконец, две окружности одного типа и одну или две другого тина, пересекающиеся ортогонально. При помощи соотношении (4.64) любую из этих областей можно преобразовать в прямоугольную:

Мы употребляем здесь вместо чтобы подчеркнуть чисто геометрический характер этого преобразовании. Из уравнений (4.67) и (4.68) следует, что когда х и у принимают значения - меняются в пределах Таким образом, функция (4.76) преобразует горизонтальную полоску шириной плоскости во всю плоскость z. Вертикальные линии внутри этой полоски превращаются, согласно уравнению (4.67), в окружвости, описываемые уравнением

а горизонтальные линии превращаются в окружности, проходящие через точки и описываемые уравнением (4.68)

Это преобразование можно представить себе, вообразив бесконечную горизонтальную полоску упругой мембраны шириной вращаемую в направлении против часовой стрелки вплоть до достижения ею вертикального положения в плоскости z. При этом точки превращаются соответственно в линии Сожмем теперь эту полоску около точек и начнем сближать точки перемещая их вдоль оси у, при этом центральная часть полоски будет растягиваться в горизонтальном направлении. Линии и подобно вееру развертываются соответственно около точек до тех пор, пока С А не совпадет с . В результате мембрана оказывается растянутой на всю плоскость z, а ее бесконечно малые дуги и становятся бесконечно удаленными дугами, разделяемыми осью х на две равные части.

Сопряженные функции. Субдифференциалы. Принцип минимакса. Задачи о проективной двойственности Срок сдачи 18 апреля 2014 г. (1) Найти сопряженные к функциям p (a) |x|p , p ≥ 1 (b) ex−1 (c) max{|x|, x2 } (d) f (x) = 12 hQx, xi + hb, xi + c, Q - симметричная положительная d × d матрица, b, x ∈ Rd , c ∈ R (e) f (x) = ln(1 + ex1 + · · · + exd) (f) max{x 1 , · · · , xn } √ (g) 1 + x2 (h) δA , где A - множество в Rd и δA (x) = 0, если x ∈ A, δA (x) = +∞, если x∈ /A (i) hA , где A - множество в Rd и hA (y) = sup{hx, yi, x ∈ A}. (2) Докажите неравенство p p hx, yi ≤ 1 + |x|2 − 1 − |y|2 , (3) (4) (5) (6) x, y ∈ Rd , |y| ≤ 1. Когда достигается точное равенство? Как устроена функция, сопряженная к функции, график которой - выпуклый многогранник? Рассмотрим множество отрезков длины 1 на R+ ×R+ с концами на координатных прямых. Докажите, что астроида является огибающей для этого множества. Какая функция является сопряженной к функции, графиком которой является астроида? Пусть f - функция, не являющаяся выпуклой. Опишите ее вторую сопряженную. Пусть f, f ∗ - гладкие выпуклые функции, причем в каждой точке матрицы вторых производных (гессианы) D2 f, D2 f ∗ невырождены. Докажите, что для любого x выполнено соотношение D2 f (x) · D2 f ∗ (∇f (x)) = I, где I - единичная матрица. (7) Найдите общее решение следующего дифференциального уравнения f 00 = (f − xf 0)2 . (8) Вычислить субдифференциал выпуклой функций в нуле (a) max{ex , 1 − x} P (b) di=1 |xi | (c) max1≤i≤d |xi | (9) Докажите, что x0 - точка минимума выпуклой функции f тогда и только тогда, когда 0 ∈ ∂f (x0). (10) Найти минимум функций (a) x2 + y 2 + 4p max(x, y) (b) x2 + y 2 + 2 (x − a)2 + (y − b)2 (11) Докажите соотношение (f ⊕ g)∗ = f ∗ + g ∗ , 1 где f ⊕ g(x) = inf a+b=x (f (a) + g(b)). (12) Докажите (не используя принцип минимакса), что максимум в задаче линейного программирования не превосходит минимума в двойственной. (13) Сформулируйте двойственную к задаче линейного программирования и решите ее. x1 + 2x2 + · · · + nxn → min x1 ≥ 1, x1 + x2 ≥ 2, · · · , x1 + x2 + · · · + xn ≥ n xi ≥ 0, 1 ≤ i ≤ n. Задачи о проективной двойственности Определение. Двойственной проективной плоскостью RP2∗ называется пространство прямых на проективной плоскости RP2 . 14) Докажите, что двойственная проективная плоскость имеет естественную структуру проективной плоскости, в которой прямая – это семейство прямых в RP2 , проходящих через данную точку. (В частности, многообразия RP2 и RP2∗ диффеоморфны.) 15) Рассмотрим произвольные две различные прямые a, b ⊂ RP2 , обозначим O = a ∩ b, a = a \ O, b = b \ O. На каждой прямой имеется естественная вещественная аффинная координата, определенная однозначно с точностью до композиции с аффинным преобразованием: a, b " R. Для любых x ∈ a и y ∈ b пусть l(x, y) – прямая, проходящая через x и y. Докажите, что отображение a × b → RP2∗ , (x, y) 7→ l(x, y) является аффинной картой. Определение. Пусть γ ⊂ RP2 – гладкая кривая. Двойственной кривой к γ называется кривая γ ∗ ⊂ RP2∗ , являющаяся семейством касательных прямых к γ. 16) Докажите, что γ ∗∗ = γ. 17) Пусть f (x) – гладкая строго выпуклая функция, a f ∗ (x∗) – сопряженная к ней. Рассмотрим их графики Γ(f) и Γ(f ∗) в соответствующих аффинных плоскостях (x, y) и (x∗ , y ∗) (точнее, конечные части графиков, где значения функций конечны). Докажите, что кривая Γ(f ∗) переводится аффинным преобразованием в кривую, двойственную к Γ(f). Указание: использовать результат задачи 2). 18) Докажите, что кривая, двойственная гладкой конике (кривой второго порядка, не сводящейся к паре прямых), также является гладкой коникой. 19) Дайте определение двойственной ломаной (двойственного многоугольника) и решите аналоги задач 3) и 4) для ломаной γ и кусочно-аффинной функции f (график – ломаная). 2

1 1 4 П Р И Л О Ж Е Н И Е Б: Т Е О Р Е Т И Ч Е С К И Е О С Н О В Ы Н О В О Й К О Н Ц Е П Ц И И

Принцип сопряженных подсистем

С выделением любой материальной системы автоматически появляется соответствующая среда, в которой существует эта система. Поскольку среда всегда больше системы, то эволюция системы диктуется изменениями среды. Идея эволюции подразумевает два главных и, в известном смысле, альтернативных аспекта: сохранения (С) иизменения (И) . Если одно из них отсутствует, то нет эволюции: система либо исчезает, либо стабильна. Отношениеизменения исохранения (И / С ) характеризует эволюционную пластичность системы. Отметим, что эти условия альтернативны: чем большеИ , тем меньшеС и, наоборот, так как они дополняют друг друга до единицы:С + И = 1 .

Для лучшей реализации только первого аспекта-сохранения-системе выгоднее быть устойчивой, стабильной, неизменяемой, то есть быть по возможности “дальше” (не в геометрическом смысле, а в информационном) от разрушающих факторов среды (Рис. Б.1 ). Однако эти же факторы одновременно несут полезную информацию о направлении изменений среды. И если системе необходимо приспособиться к ним, измениться согласно изменениям среды (второй аспект), то она должна быть чувствительной, лабильной и изменчивой, то есть быть по возможности “ближе” (в информационном смысле) к вредным факторам среды. Следовательно, имеет место конфликтная ситуация, когда системе с одной стороны надо быть “подальше” от среды, а с другой-“поближе”.

Среда Проблема

Чтобы измениться (получить полезную информацию) надо быть “ближе”

Возможные решения

Быть на “оптимальном расстоянии”

Разделиться на две сопряженные подсистемы

Рис. Б.1 Взаимоотношение системы со средой

Первое возможное решение: системе целиком быть на некотором оптимальном “расстоянии” от среды, выбирая некий компромиссный оптимум И / C. Второе решение: разделиться на две сопряженные подсистемы, одну убрать “подальше” от среды, а другую выдвинуть “поближе”. Второе решение снимает конфликтные требования ксохранению (С) иизменению (И) системы, и позволяет максимизировать одновременно и то и другое, повышая устойчивость системы в целом. Этот вывод лежит в основе новой концепции.

П Р И Л О Ж Е Н И Е Б: Т Е О Р Е Т И Ч Е С К И Е О С Н О В Ы Н О В О Й К О Н Ц Е П Ц И И 1 1 5

ПРИНЦИП СОПРЯЖЕННЫХ ПОДСИСТЕМ

ДИФФЕРЕНЦИАЦИЯ АДАПТИВНЫХ СИСТЕМ, ЭВОЛЮЦИОНИРУЮЩИХ В ИЗМЕНЧИВОЙ СРЕДЕ, НА ДВЕ СОПРЯЖЕННЫЕ ПОДСИСТЕМЫ С КОНСЕРВАТИВНОЙ И ОПЕРАТИВНОЙ СПЕЦИАЛИЗАЦИЕЙ, ПОВЫШАЕТ ИХ УСТОЙЧИВОСТЬ.

Выделение внутренних и внешних подсистем необходимо понимать не в геометрическом (морфологическом) смысле, а в информационном, то есть потоки информации от среды о происшедших изменениях в ней попадают сначала во внешние подсистемы (“оперативную память”), а потом уже во внутренние (“постоянная память” системы).

В таком общем виде концепция справедлива для эволюционирующих, адаптивных систем независимо от их конкретной природы-биологических, технических, игровых или социальных. Можно ожидать, что среди эволюционирующих, адаптивных систем, структуры, состоящие из двух сопряженных подсистем, должны встречаться довольно часто. Во всех случаях когда система вынуждена следить за “поведением противника” (среды) и в соответствии с этим строить свое “поведение”, дифференциация, разделение служб на консервативную и оперативную повышает устойчивость. Армия выделяет разведывательные отряды и посылает их в разные стороны навстречу противнику. Корабль имеет киль (консервативная служба) и отдельно руль (оперативная), самолет-постоянные плоскости и элероны; ракета-стабилизаторы и рули.

Общие черты бинарно-сопряженных дифференциаций

До появления сопряженных подсистем главный управляющий эволюцией поток информации шел непосредственно от среды к системе: E →S . После появления оперативных подсистем они первыми получают информацию от среды: среда → оперативная → консервативная подсистемы,E →o →k . Поэтомуновая подсистема всегда является оперативной и

возникает между консервативной подсистемой и средой.

Принципиальная разница между унитарными и бинарно-сопряженными системами в форме их информационного контакта со средой. У первых информация попадает от среды непосредственно к каждому элементу системы, а у вторых она попадает сначала к элементам оперативной подсистемы и от них к элементам консервативной подсистемы.

Дихронизм (асинхрония) и диморфизм (асимметрия) тесно связаны между собой: когда система одинаковых элементов делится на две части, пока они качественно однородны, нет ни диморфизма, ни дихронизма (Рис. Б.2 ). Но как только одна из них начинает эволюционировать, одновременно возникает и диморфизм и дихронизм. По морфологической оси это две формы, образующие структуру “стабильное ядро” (КП) и “лабильная оболочка” (ОП) (Рис. Б.3 ). Такая структура защищает консервативную подсистему от альтернативных факторов среды, например от низких и высоких температур.

1 1 6 П Р И Л О Ж Е Н И Е Б: Т Е О Р Е Т И Ч Е С К И Е О С Н О В Ы Н О В О Й К О Н Ц Е П Ц И И

Все эволюционные новации появляются сначала в оперативной подсистеме, проходят там проверку, после чего (спустя много поколений), отобранные попадают в консервативную подсистему. Эволюция оперативной подсистемы начинается и кончается раньше, чем консервативной. Поэтому по хронологической оси их можно рассматривать как “авангард” и

“арьергард” (Рис. Б.4 ).

По оси “система-среда” система разделяется на “стабильное ядро” и “лабильную оболочку”

По оси времени оперативную подсистему можно рассматривать как “авангард” по сравнению с консервативной.

Поток информации

Фронт среды

Консервативная Оперативная

Поток информации

Такое разделение и специализация подсистем по альтернативным задачам сохранения и изменения обеспечивает оптимальные условия для реализации основного метода эволюции живых систем-в известном смысле метода проб и ошибок. С сосредоточением проб в оперативной памяти там же локализуются и ошибки и находки. Это дает возможность системе

пробовать различные варианты решения эволюционных задач без риска закрепления неудачных решений.

Дифференциация на консервативные и оперативные подсистемы-не абсолютна, а относительна. Могут быть последовательные ряды подсистем: α, β, γ,…..ω, где самое консервативное (фундаментальное) звено- α, а самое оперативное- ω. А внутри ряда, в каждой паре, слева-консервативная, справа-оперативная подсистема (как ряд напряжений металлов в электрохимии).

Чтобы новая экологическая информация попадала в оперативную подсистему, фенотипическая дисперсия её элементов должна быть шире, чем элементов консервативной подсистемы, тогда их приспособленность будет ниже, а коэффициент отбора выше, чем последних. Для этого, у них должна быть ỳже норма реакции. Поскольку сохранение системы часто важнее, чем изменение (так как отсутствие последнего грозит застоем, а первого-исчезновением), то дочерние подсистемы неравнозначны. Консервативная подсистема важнее и ценнее чем оперативная. Она сохраняет за собой некоторые черты и функции материнской, унитарной системы, тогда как оперативная подсистема, приобретает новые. Поэтому для понимания эволюционного смысла бинарных дифференциаций достаточно понять лишь смысл оперативных подсистем.

П Р И Л О Ж Е Н И Е Б: Т Е О Р Е Т И Ч Е С К И Е О С Н О В Ы Н О В О Й К О Н Ц Е П Ц И И 1 1 7

ЧТОБЫ НОВАЯ ЭКОЛОГИЧЕСКАЯ ИНФОРМАЦИЯ ПОПАДАЛА В ОПЕРАТИВНУЮ ПОДСИСТЕМУ, ФЕНОТИПИЧЕСКАЯ ДИСПЕРСИЯ

ЕЁ ЭЛЕМЕНТОВ ДОЛЖНА БЫТЬ ШИРЕ, А НОРМА РЕАКЦИИ УЖЕ, ЧЕМ ЭЛЕМЕНТОВ КОНСЕРВАТИВНОЙ ПОДСИСТЕМЫ.

Для эффективной передачи информации между подсистемами (ОП КП ), элементы оперативной подсистемы также должны иметь более широкое “сечение канала” связи, чем элементы консервативной.

Асинхронная эволюция подсистем

Эволюцию системы (S) определяет среда (Е), ЕS. Поток информации, идущий от среды, выступает как некий экологический потенциал, заставляющий систему меняться. Рост дисперсии элементов унитарных систем, рано или поздно, автоматически приводит к их дифференциации на консервативную и оперативную подсистемы. Если сравнить экологический потенциал с электрическим, а унитарную систему с лампочкой, то бинарная система это две лампочки, которые могут быть подключены к источнику тока параллельно или последовательно (Рис. Б.5 ). Это принципиально новая возможность, которой не было у унитарных систем.

Рис. Б.5 Синхронная эволюция унитарных систем (УС) и бинарных несопряженных (БНС)

Аналог параллельной схемы. Асинхронная эволюция бинарных сопряженных дифференциаций (БСД)-аналог последовательной схемы. Фигурные стрелки- направление эволюции, простые-поток электронов и информации (Геодакян, 2005).

Три схемы-модели трех главных способов размножения и асимметрии. Схема одной лампочки-аналог бесполого способа, параллельная-гермафродитного, а последовательная схема-раздельнополого (и асимметричного мозга).

hram-bal.ru

Принцип сопряженных подсистем

Асинхронная эволюция подсистем