1. Методы переменной метрики

Методы переменной метрики называют также квазиньютоновскими или градиентными с большим шагом.

В этих методах в процессе поиска осуществляется аппроксимация матрицы вторых частных производных или обратной к ней. Причем для этого используются только первые производные.

Очередное приближение img001 в этих методах находится по формуле:

img002,                      (1)

где матрица img003, которую иногда называют матрицей направлений, представляет собой аппроксимацию

img004.

Для квадратичной целевой функции (или квадратичной аппроксимации целевой функции) имеем:

img005,

где img006.

Если вместо img007 подставить в формулу img008 и продифференцировать, то получим

img009,

img010.

Умножив на img011, получаем

img012.                           (2)

При этом, если img013 квадратичная функция, то img014– постоянная матрица.

Уравнение (2) можно рассматривать как систему img015 линейных уравнений с img016 неизвестными параметрами, которые необходимо оценить для того, чтобы аппроксимировать img017 или img018 при заданных значениях img019, img020 и img021 на более ранних этапах поиска.

Для решения этих линейных уравнений могут быть использованы различные методы, каждый из которых приводит к различным методам переменной метрики.

В большой группе методов матрица img022 аппроксимируется с помощью информации, полученной на предыдущем img023-м шаге:

img024,                               (3)

где img025 – матрица, аппроксимирующая img026 на предыдущем шаге. Вообще img027. В (3) img028 представляет собой определяемую матрицу, а img029 - масштабный (постоянный) множитель, в большинстве случаев равный единице.

Выбор img030 по существу и определяет соответствующий метод переменной метрики.

Для обеспечения сходимости метода матрица img031 должна быть положительно определенной и удовлетворять уравнению (2) в том случае, когда она заменяет img032.

На img033-м шаге мы знаем img034, img035, img036 и img037 и нам требуется вычислить img038 так, чтобы удовлетворялось соотношение (2).

Из выражения (2) с учетом (3)

img039

и

img040.                                                  (4)

Так как img041, то на основании (4) уравнение

img042                                    (5)

следует разрешить относительно img043.

Прямой подстановкой результата можно показать, что уравнение (5) имеет следующее решение:

img044,                                   (6)

где img045 и img046 – произвольные вектора размерности img047.

Например, если для img048 выбирается специальная линейная комбинация двух направлений img049 и img050:

img051,

то получают метод Бройдена.

Если же берется

img052     img053

то матрицу img054 строится в соответствии с алгоритмом Дэвидона-Флетчера-Пауэлла.

Так img055 и img056 – произвольные векторы, то оказываются допустимыми и другие возможности.

Если в этих алгоритмах шаги img057 строятся последовательно в результате минимизации функции img058 в направлении img059, то все методы, с помощью которых вычисляют симметрическую матрицу img060, удовлетворяющую соотношению (4), дают направления, являющиеся взаимно сопряженными (в случае квадратичной целевой функции).


Hosted by uCoz