Эконометрика лекции

Основная идея метода

Основная идея метода заключается в замене сильно коррелированных переменных совокупностью новых переменных, между которыми корреляция отсутствует. При этом новые переменные являются линейными комбинациями исходных переменных:

Image

Переменные Image называют главными компонентами. Будем подбирать их так, чтобы Image имела бы наибольшую дисперсию. Для каждой следующей компоненты дисперсия убывает, а последняя компонента будет иметь наименьшую дисперсию. Можно предполагать, что исходные переменные Image уже стандартизированы, так что все переменные имеют нулевое математическое ожидание и единичную дисперсию. При этом матрица Image является корреляционной матрицей для исходных данных.

Для первой главной компоненты Image где Image, справедливы равенства M(z1) = Image; Image.

Хорошо известно, что невырожденная корреляционная матрица Image имеет m положительных собственных значений и m соответствующих им собственных векторов.

Пусть Image собственный вектор матрицы Image, а l1 соответствующее этому собственному вектору собственное значение, то есть Image. Умножая последнее равенство слева на Image, получаем Image. Чтобы вектор Image однозначно определить, дополнительно потребуем, чтобы Image. Тогда Image и проблема нахождения первой главной компоненты с максимальной дисперсией решается путем нахождения наибольшего собственного значения Image и соответствующего ему собственного вектора Image корреляционной матрицы Image.

назад          далее