В математическом отношении МГК — статистический метод сжатия информации,базирующийся на выяснении внутренней структуры ковариационных и корреляционных матриц, рассчитываемых для множества случайных зависимых величин. В компонентном анализе применяется такое линейное преобразование р наблюдаемых переменных x1, x2, ..., xp, что получается совокупность р некоррелированных и нормированных переменных z1, z2, ..., zp, причем для этого никакие гипотезы о x1, x2 ..., p3 не требуются, т.е. не нужно делать никаких гипотез о переменных, они не обязаны даже быть случайными величинами, хотя на практике их наблюденные значения рассматриваются как выборки из некоторой популяции [3]. Реализация метода сводится к замене вектора случайных величин X = (x1, x2,..., xp) размерности р вектором независимых случайных величин Z размерности zр. Это достигается нахождением для ковариационной или корреляционной матрицы собственных чисел и векторов, по величине которых и выносится суждение о существенности влияния факторов Z (соответствующих собственным векторам и числам) как в целом на вектор X, так и на отдельные его компоненты. Таким образом, модель МГК проста и описывается уравнением [3]:



где Zr — независимая переменная (случайная) величина, обозначающая r-компоненту (r-фактор); ωir — масса r-компоненты в i-переменной. В результате вычислений определяются число независимых переменных (факторов) с выделением наиболее существенных компонент, дисперсии и факторные нагрузки для каждой из компонент (факторов), факторные дисперсии для каждой из переменных, а также значения факторов для всех точек наблюдения (векторов). Здесь важно подчеркнуть, что аппарат факторного анализа базируется именно на учете взаимосвязанных статистик изучаемой совокупности, что надо иметь в виду при рассмотрении моделей природных процессов, изученных методом главных компонент.
Расчетные операции проводились на ЭВМ БЭСМ-4 в режиме корреляционной матрицы по программе, составленной Л.Н.Дуденко [4]. Методика исследования не отличается от описанной в работе [2]. В результате была изучена выборка 264 химических анализов пород «плутона», выполненных по представительным пробам. В выборку были включены анализы всех основных разностей гранитоидов отмеченных выше фациальных рядов (172 анализа), рудных и безрудных магнезиальных и известковых                            
 
скарнов (51), роговиков (5), вмещающих карбонатных (известняков и доломитов — 23) и безкарбонатных (аргиллитов и алевролитов — 13) пород. Кроме общей выборки отдельно были изучены также выборка гранитоидов (157 анализов), скарнов (45), смешанная габброидов и скарнов известковых (31) и смешанная гранитов и гранодиоритов (70). Каждому химическому анализу исследуемых выборок соответствует одинаковый набор исходных переменных (признаков), состоящих из 11 оксидов (Si02, Ti02, AI203, Fe203, FeO, MnO, MgO, CaO, Na20, K20, P205).
В результате проведенных расчетных операций получены матрицы факторных нагрузок 11 рассчитанных факторов на 11 переменных (оксидов) для каждой выборки, а также дисперсии факторов и собственное значение главных факторов (главных компонент) для каждого объекта (анализа). Матрицы факторных нагрузок первых 2—3 главных факторов с максимальными дисперсиями, отражающими вклад каждого из данных факторов в суммарную дисперсию признаков, приведены в таблице. Содержания оксидов, которым соответствуют компонентные (факторные) нагрузки одного знака, связаны между собой прямыми линейными зависимостями, а имеющие нагрузки разных знаков — обратными.
Выданные ЭВМ факторные нагрузки признаков для каждой выборки представлены в виде формул главных компонент. Например, формула первого фактора общей выборки имеет вид:



где I42 — номер компоненты по массе и ее масса (дисперсия фактора,%): Si42, Na39, … — признаки компоненты с факторными нагрузками (*100). В числителе признаки с компонентой (фактором) связаны положительно, а следовательно, и воздействуют на систему положительно, в знаменателе— отрицательно, формулы для любых используемых ниже компонент могут быть легко составлены с помощью таблицы.
Значения главных компонент (факторов) выражаются графически в виде проекций исследуемых анализов на прямоугольную систему координат, в качестве которых используются главные компоненты. Это позволяет изобразить составы изучаемых пород в виде фигуративного поля на плоскости, которое отражает максимальную часть изменчивости совокупности (компонентная диаграмма). На компонентных диаграммах у положительных концов осей (компонент) выписываются факторные нагрузки элементов, связанных с фактором положительной зависимостью. Элементы, находящиеся у противоположных концов, имеют отрицательную связь.



Страницы: Обложка, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67
   
Яндекс.Метрика
Web-дизайн Куранов Н.В.