martes, 6 de octubre de 2009

Rotaciones Oblicuas y Ortogonales(Presentacion 1, de Econometria)

Rotacion Oblicua del Problema de 12 variables.


Al estar interesados en mantener las construcciones factoriales lo mas independientes posibles entres si, se debe mantener los angulos entre los factores lo mas cerca de 90 grados. Como en la siguiente grafica:

En la misma aparecen resultados de las rotaciones ortoganales del problema de las 12 variables. En el primer trazado del factor I con el factor III, como aparece en la siguiente grafica:


El vector de referencia I se mueve a la posición I4 desde la posición ortogonal final original en I3. El vector de referencia I4 esta realmente mas alejado de los puntos con proyecciones altas sobre este valor de referencia que lo que estaba I3, asi que la rotacion no ha hecho para acercar el vector de referencia I a un grupo de puntos con pesos altos en I. Como esta es la primera rotacion oblicua por vez primera el vector de referencia I y el factor I no coincidiran. Hasta que un vector de referencia sea rotado oblicuamente respecto a otro vector de referencia, aquel coincidira con su vector factorial asociado.

Los calculos para alterar A, la matrix de transformación ortogonal final, para incluir esta primera rotacion oblicua.

I’ = I – tg (phi)* III

Lan 11 = .711 - .2(.439) = .711 -0.88 = .623
Lan 21 = .057 -.2(-.237) = .057 + .047 = .104
Lan 31 = -.201-.2(.845) = -.201-.169 = -.370
Lan 41 = -.671-.2(.192) = -.671-.038=-.709


El hiperplano perpendicular al vector de referencia con posición III4 esta mejor situado que lo que estaba en la posición original perpendicular a III3. Los calculos para obtener la nueva columna III de la matriz A para llevar a cabo la rotacion son los siguientes:

III’ = III - .17(I)

Lan 13 = .439 - .17(.711) = .318
Lan 23 = -.237 - .17(.057) = -.247
Lan 33 = .845 -.17(-.201) = .879
Lan 43 = .192 -.17(-.671)=.306


La suma de los cuadrados de los valores de Lan i3 no normalizados de las Esc. es 1.0284 y su raiz cuadrada es 1.014

La matriz de correlaciones entre los vectores de referencia C, como sigue;

C = A1 ‘A1

Se multiplica la transpuesta de la matriz de transformación por la matriz de transformación misma para tener la matriz de correlaciones entre los vectores de referencia.

La matriz final de correlaciones entre los vectores de referencia para el problema de 12 variables es de esta forma:

I II III IV

I 1.000 .000 -.343 -.411
II .000 1.000 .000 -.001
III -.343 .000 1.000 .040
IV -.411 -.001 .040 1.000


Los ejes factoriales coinciden con las intersecciones de los hiperplanos. Si dos lineas de interseccion tales mantienen un angulo entre ellas menor de 90 grados, entonces el angulo entre los vectores de referencia perpendiculares a ellas debe ser mayor de 90 grados, produciendo una correlacion negativa. Sin embargo, si las lineas de interseccion de los hiperplanos mantienen un angulo mayor de 90 grados, sus normales, los vectores de referencia, deben mantener un angulo entre ellos menor de 90 grados.




Obtencion de las matrices adicionales

Consideremos la operación matricial esquematica de la figura Ilustrada:





Ignorando por un momento, la parte inferior T de la matrix de la izquierda y la parte inferior D de la matriz de la derecha, esta operación es justamente A ^A = V. Que producia la estructura final de los vectores de referencia V, multiplicando la matrix de pesos no rotados.


Puesto que los vectores factoriales rotados que estan representados por las filas de T en la figura ilustrada, tienen como longitud la unidad, y los vectores factoriales no rotados tienen como longitud la unidad, las correlaciones entre estos dos conjuntos de vectores vienen dadas por

Rij = hi hj Cos(Phi ij) = (1.0)(1.0) Cos(Phi ij) = Cos(Phi ij)

Los valores de cada fila de la matriz T son, por lo tanto, los cosenos direccionales de los vectores factoriales rotados oblicuos respecto a los vectores factoriales no rotados ortogonales. Por lo tanto, la fila i de la matriz T y la columna j de la matriz ^A representan los cosenos direccionales del vector factorial i y del vector de referencia j, respectivamente. Cuando i=j, estos son el vector factorial y el vector de referencia que se corresponden mutuamente en la solucion oblicua.

Correlaciones entre los factores

La matriz de correlaciones entre los factores oblicuos puede representar como sigue:

Obli= TT’

Donde T, como antes, es una matriz cuyas filas son cosenos direccionales de los vectores factoriales rotados oblicuamente de longitud igual a la unidad respecto a los vectores factoriales originales ortogonales y sin rotar, como se indica en la figura ilustrada anteriormente. La matriz TT’ proporciona los productos internos de los cosenos direccionales de todos los pares posibles de vectores factoriales rotados oblicuos. La matriz Obli es simetrica, ya que r ij=r ji y tiene 1.0 en los elementos de la diagonal puesto que la correlacion de cada factor consigo mismo es 1.0.


Como A^A es la matriz C, la matriz de correlaciones entre los vectores de referencia ya mencionanda, entonces se reduce a Obli = DC^-1D. Donde D son los valores de la diagonal de D.

Formulas para la matriz patron y la matriz estructura

La rotacion oblicua de los vectores de referencia termina con la formula

A^A = V

Donde A es la matriz de los pesos factoriales no rotados, ^A es la matriz con columnas de cosenos direccionales de lo vectores de referencia respecto a los vectores factoriales no rotados y V es la matriz de correlaciones de las variables con los vectores de referencia. Por analogia,

AT’=S

Donde las columnas de T’ son los cosenos direccionales de los vectores factoriales oblicuos respecto a los vectores factoriales no rotados y S es la matriz de correlaciones de las variables con los vectores factoriales oblicuos, estos es, la estructura factorial. La transpuesta T’ simplemente, coloca estos cosenos direccionales en las columnas en lugar de que en las filas.


La matriz de patron es la siguiente

P= VD^-1

El efecto de multiplicar la matriz de la estructura de los vectores de referencia V por D^-1 es simplemente multiplicar la columna i de la matriz V por el elemento dii^1 de D^-1. La matriz D^-1 es tambien una matriz diagonal cuyos elementos son iguales a los reciprocos de los elementos correspondientes de la matriz D.

Reproduccion de R a partir de los pesos factoriales oblicuos

Anteriormente se establecio que Z= AuFu, donde Z es la matriz de puntuaciones de las variables, Au es la matriz de los pesos factoriales no rotados, de los factores comunes, especificos y de error, y Fu es la matriz de puntuaciones factoriales para los factores ortogonales no rotados. La matriz de correlaciones tambien puede representarse por la ecuación siguiente:

R = 1/N(ZZ’)

Donde Z es la matriz de puntuaciones de variables. Cada fila de Z, multiplicada internamente por una columna de Z’, la transpuesta de Z, da la suma de los productos cruzados de las puntuaciones tipicas que, al ser dividida por, da el coeficiente de correlacion para el par de variables implicadas. Sustituyendo Z=AuFu se obtiene

R = Au[(FuFu’)/N]Au’

Soluciones oblicuas frente a soluciones ortogonales

Las complejidades que conlleva la utilización de solucione oblicuas y la carga adicional de calculos implicados han llevado a muchos investigadores a decidirse por las soluciones ortogonales, que son mucho mas simples. Algunos investigadores, por ejemplo, Cattell(1952), han insistido en la utilización de soluciones oblicuas porque piensan que los factores en la naturaleza no tienen tendencia a ser ortogonales y que, por lo tanto, el uso de soluciones ortogonales esta injustificado. Otros investigadores, como Guildford, han preferido generalmente mantenerse en las soluciones factoriales ortogonales basandose en que desean desarrollar construcciones tan independientes unas de las otras como sea posible. La aceptación demasiado rapida de soluciones oblicuas puede inhibir la busqueda de construcciones realmente independientes.



Capitulo 7

ESTRUCTURA SIMPLE Y OTROS CRITERIOS ROTACIONALES


Thurstine (1947) intento probar el valor de una estructura simple presentando una solucion a su famoso problema de las cajas. Reunio una muestra de 20 cajas y tomo varias funciones matematicas de tres dimensiones basicas para obtener un total de 20 variables. Empleo funciones x,y y z, x^2 +y^2 y funciones logaritmicas. De las intercorrelaciones de esas variables obtuvo tres dimensiones basicas llamadas: Longitud, anchura y altura.

Todos estos problemas demuestran, sin embargo, que hay casos en que en donde la estructura simple oblicua funciona. Debido a que no hay prueba de que siempre este metodo funcione. El uso indiscriminado de la estructura simple oblicua como criterio puede concluir a unas soluciones muy distorsionadas. Lan conclusión que llego el autor como resultado de sus experimentos fue que, con muchas variables y muchos factores en una matriz factorial, los hiperplanos pueden ser mejorados hasta proporciones extremadamente altas de pesos proximos a cero si se permite que los factores lleguen a estar lo suficientemente oblicuos entre si. La localizacion de buenos hiperplanos no es siempre suficiente para establecer buenas posiciones factoriales, tampoco no es necesario rotar para obtener los mejores hiperplanos oblicuos obteniendo asi la mejor solucion posible.

Una solucion rotacional no es nada mas que una interpretación de los datos. En anteriores capitulos se ha mostrado que hay infinitas interpretaciones posibles para la mayoria de las matrices de correlaciones en la vida real. La mejor solucion de estructura simple oblicua proporciona frecuentemente una interpretación que el investigador encuentra util para sus propositos. Sin embargo, todavía no ha sido probado que pueda ser utilizado para procedimientos cientificos.

Criterios Alternativos de Rotacion

Aunque la rotacion normal hacia la estructura simple oblicua, o hacia la mejor aproximación ortogonal a ella, ha sido el metodo de rotacion mas favorecido tradicionalmente. De hecho, en el momento presente, el enfoque tradicional de estructura simple, ha sido sustituido en popularidad por metodos para computador.

Rotacion para lograr la consistencia con resultados anteriores

El progreso cientifico significativo usando resultados de analisis factoriales surge con mayor probabilidad de una serie de investigaciones programadas que de un unico estudio aislado. Los investigadores implicados en la investigación programada naturalmente buscan descubrimientos que puedan generalizarse a traves de estudios. Desean poder reproducir los descubrimientos en orden a ganar confianza con sus conclusiones. En sus estudios de habilidades humanas, Guilford (1967) y sus colaboraciones han estado generalmente mas interesados en sus rotaciones en relacionar los resultadoes presentes con los descubrimientos pasados, que en satisfacer el criterio de estructura simple. Tambien se han adherido generalmente a soluciones ortogonales.

El metodo de adiciones ortogonales se clasifica quiza mejor bajo el encabezamiento de rotacion para lograr la consistencia con los resultados anteriores. Un investigador puede comenzar con un grupo de variables que definen un factor bien establecido. A continuación, situa un segundo factor en angulo recto con el primero, usando las variables existentes e intetando desarrollar otras nuevas hasta que el segundo factor este bien definido. Luego, continua desarrollando un tercer factor, ortogonal respecto a los dos primeros, y asi sucesivamente. En cada nuevo paso, los resultados estan construidos sobre y hechos para mostrar consistencia con los descubrimientos anteriores.


Rotacion para concordar con hipótesis

Este enfoque, en algunas de sus aplicaciones, es muy similar al anterior en que, al rotar los resultados presentes para hacerlos consistentes con hechos conocidos, incluyendo descubrimientos procedentes de investigaciones previas, hay un intento en lograr una congruencia entre los resultados presentes y una hipótesis compleja sobre su naturaleza. En otros casos, la hipótesis sobre resultados presentes pueden ser estrictamente generadas en base a una teoria mas que en base a los resultados pasados.

Metodos analiticos de rotacion

La distinción basica entre los llamados metodos analiticos y no analiticos de rotacion es que en los metodos analiticos pueden ser reducidos a reglas claramente especificadas que no requieren ningun juicio por parte del investigador. Los metodos no analiticos, como la rotacion manual a estructura simple oblicua, requieren que el investigador ejercite su juicio para determinar que se debe hacer en las diversas etapas del proceso de rotacion.

Soluciones de estructura simple por computador

Aunque la rotacion a la estructura simple oblicua no se clasifica como un metodo analitico, es posible formular un conjunto de reglas para aplicarlas por computador con el proposito de buscar soluciones que parezcan satisfacer las demandas de la estructura simple oblicua. Puesto que tales aplicaciones envuelven un conjunto explicito de reglas, seran clasificados como metodos analiticos.

Cattell y Muerle (1960) desarrollaron el programa Maxplane para rotacion factorial a estructura simple oblicua. Este programa cuenta con el numero de puntos que caen en el hiperplano para cada factor, por ejemplo, dentro del rango + .10 a -.10. Los factores se rotan sistemáticamente por computador para incrementar el numero de puntos en los hiperplanos.

Soluciones de tipo Procrusto
Las soluciones de tipo procusto se clasifican aquí como de carácter analitico, porque en ellas se establece un conjunto especifico de reglas que gobierna cuantas rotaciones se han de hacer para transformar la matriz factorial no rotada en una forma máximamente similar en algun sentido a una matriz objetivo predeterminada. La matrix objetivo puede tener especificados todos los valores o solo alguno de ellos.

Metodos de rotacion analitca ortogonal

El descontento con la subjetividad y la vaguedad de los criterios de la estructura simple condujo a un esfuerzo para proporcionar enunciados matematicos mas precisos de los criterios que debe satisfacer una solucion rotacional. Se publicaron varios metodos en los anos cincuenta que demostraron ser bastante similares entre si( Carroll, 1953; Ferguson, 1954; Neuhaus y Wrigley, 1954; Saunders, 1960) según Harman (1967), Harman denomina a estos metodos similares, colectivamente, metodo Quartimax. La idea esencial subyacente a este enfoque es rotar de tal modo que cada variable tenga, idealmente, un peso principal en uno, y uno, de los factores. Es decir, cada variable aparecia como una medida factorial pura. En la practica, naturalmente, no es posible, en general, obtener una solucion idealizada semejante. Solo se consiguien aproximaciones tan precisas como es posible en la solucion Quartimax.

Metodos de rotacion analiticos oblicuos

Los metodos de busqueda de la estructura simple por computador y los enfoques de tipo Procrusto que producen soluciones oblicuasya han sido mencionadas. Mucho antes del desarrollo de estos metodos, sin embargo, Thurstone(1947) presento su metodo de Plano Unico, que es un procedimiento semianalitico para la obtención de soluciones oblicuas. El investigador comienza con una variable dada, pensada para ser una variable que probablemente defina un factor particular. Se situa un vector de prueba a traves de esta variable y se obtienen las proyecciones de los vectores de datos sobre este vector de prueba. Se trazan estos valores junto a todos los vectores factoriales no rotados y se realiza simultaneamente un ajuste en la posición del vector de prueba con respecto a todos lo ejes factoriales no rotados para mejorar la estructura simple. Se calculan las proyecciones de los vectores de datos sobre el nuevo vector de prueba y se realizan nuevo diagramas. Se hace un nuevo ajuste en la posición del vector de prueba con respecto a todos los ejes factoriales no rotados y se realiza simultaneamente un ajuste en la posición del vector de prueba si es necesario. El proceso continua hasta que no necesiten nuevos ajustes.

El metodo de Varimax de Kaiser

(1958,1959) Se basa en la idea de que el factor mas interpretable tiene pesos altos y bajos, pero pocos de magnitud intermedia. Tal factor tendria una gran varianza de pesos al cuadrado, ya que los valores estan separados al maximo. Usando la varianza como valor maximo como se ilustra en la iguiente formula:

V=Sum (desviación estandar de j)^2, desde j=1, hasta m.

En la practica, V no es maximizado en una sola operación. Mas bien,los factores unos con otros sistemáticamente, dos cada vez y todos los pares posibles,maximizando cada vez la (desviación estandar 1)^2 + (desviación estandar 2)^2. Despues de que cada factor ha sido rotado con cada uno de los demas factores, completando un ciclo, se calcula V y comienza otro ciclo. Estos ciclos se repiten hasta que V no se pueda incrementar.

Considere lo siguiente:



Donde V1 es una matrix de pesos factoriales que han de ser rotados para maximizar (desviación estandar 1)^2 + (desviación estandar 2)^2, V2 es la matrix de pesos factoriales para la cual (desviación estandar i)^2 + (desviación estandar j)^2 es una maximo, y ^A es la matrix de transformaciones ortogonales que realiza la rotacion deseada. Los valores en V1 son conocidos. Los valores en V2 no. Sin embargo, los valores en V2 son funciones del angulo Phi y los valores en v1, como sigue:

Xj=xj Cos(Phi) + yj Sen(Phi)
Yj=-xj Sen(Phi) + yi Cos(Phi).

La suma de las variazas que ha de maximizarse viene dada por:

(desviación estandar 1)^2 + (desviación estandar 2)^2 = (1/n)*Sum(X^2)^2-(1/n^2)*Sum(X^2)^2-(1/n)* Sum(Y^2)^2-(1/n^2)*Sum(Y^2)^2.

El metodo de criterio en Tandem

Principio I. Si dos variables entan correlacionadas, deben aparecer en el mismo factor.

Rotacion por el criterio I de los criterio en tandem

El principio I puede ser expresado matemáticamente de la siguiente manera:

F = Sum desde k=1, hasta m * Sum desde i=1, hasta m* Sum desde j=1, hasta m (r’ij^2) (aik^2) (ajk^2)

Donde r ij = Sum (aik ajk) desde k =1, hasta n, la correlacion reproducida entre la variable i y la variable j,

a ik es el peso factorial de la variable i en el factor k,
a jk es el peso factorial de la variable j en el factor k.

La funcion F debe maximizarse. Esto ocurrira cuando las variable que estan correlacionadas entre si esten puestas en el mismo factor. Como el metodo de Varimax, la maximización de la funcion F se realiza rotando los factore de dos en dos, maximizando la funcion en cada rotacion separadamente. Despues de que se ha rotado cada factor con cada uno de los otros factores, y de este modo se ha completado un ciclo, se calcula el valor de la funcion.

No hay comentarios:

Publicar un comentario