Medicion de hechos sociales
Transcription
Medicion de hechos sociales
Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -1- CAPÍTULO 21 LA MEDICION DE HECHOS Y FENÓMENOS SOCIALES Por Vidal Díaz de Rada2 Planteada la investigación, definido el marco teórico y las hipótesis de trabajo comenzamos uno de los capítulos más importantes de esta obra relativo a la medición en Ciencias Sociales. El capítulo comienza con una definición del concepto "medir" y expone las peculiaridades de los fenómenos sociales, peculiaridades que afectan sustancialmente a los procesos de medición. Posteriormente son expuestos los sucesivos estadios del proceso de medición en la investigación social, terminando con la elaboración de índices. Definido el proceso de medición, a continuación se expondrán los tipos de escalas desarrolladas por Stevens a mediados de siglo, y cómo éstas condicionan la elección de las técnicas de análisis de datos a utilizar. El capítulo finaliza con una breve exposición sobre la fiabilidad y validez de instrumentos de medida, aspecto fundamental en investigación social puesto que en numerosas ocasiones estamos interesados en medir fenómenos no directamente observables, y sólo tras realizar un detallado análisis de su fiabilidad (reliability = confiabilidad) y su validez podremos decir que el instrumento de medida está midiendo lo que realmente debe medir. 1. PROBLEMAS INHERENTES AL HECHO DE MEDIR. LOS HECHOS SOCIALES Y SU MEDICION El fin de la medición es conocer mejor un determinado objeto o fenómeno. Con este fin compararemos el objeto o fenómeno a conocer con otro objeto "patrón" ya conocido: nuestra altura la medimos comparándola con un sistema conocido como son los centímetros, el calor del día de hoy lo medimos con un sistema de medición en grados y así decimos que ha sido el día más caluroso del año... Incluso para definir el estado de ánimo o las características de personalidad realizamos mediciones respecto a otro momento dado: "cuando lo conocí era más optimista", "el mes pasado estaba muy serio", etc. Cureton (1969) define la medición como el procedimiento mediante el cual los números son asignados de modo individual a entidades, personas, objetos, niveles o eventos. Otra definición adopta el diccionario de la Real Academia Española cuando define medir como "comparar una cantidad con su respectiva unidad, con el fin de averiguar cuántas veces la primera contiene a la segunda". Esta definición, muy apropiada para las ciencias físico matemáticas no puede utilizarse para la medición y comprensión de los fenómenos sociales: tomando uno de los ejemplos anteriores; cuando lo conocí "¿era "tres veces" más optimista que hoy?, ¿o era cuatro veces?". "El mes pasado estaba muy serio ¿cuántas veces más seno que hoy?". Estas preguntas ya proporcionan una idea de la complejidad de los procesos de medición en ciencias sociales, de modo que adoptaremos una amplia definición basada en la definición de Stevens (1951: 22)3: medir es el proceso de unir números a objetos o eventos en modo de significado y de acuerdo a unas reglas, para que representen sus propiedades relaciones. Stevens señala que la naturaleza de la regla es fundamental porque ésta determina el tipo de operaciones matemáticas que es posible realizar con cada medición, como veremos a lo largo de este capítulo. El proceso de medición comienza con la observación e identificación de un objeto, suceso, idea, etc. centrando nuestra atención en las propiedades que deseamos medir. No debemos olvidar que dentro del pro1 Texto scaneado del original al que se le aplico el programa de Reconocimiento Óptico de Caracteres: OmniPage 5.0. El subrayado, la negrita y los comentarios o notas pertenecen al editor del texto con la sigla RJR, la itálica pertenece a la autora. (RJR). 2 Diaz de Rada, Vidal (1999): Técnicas de Análisis de datos para investigadores sociales. Aplicaciones prácticas con SPSS para Windows (Versión SPSS 8.0 Español), Madrid, Ra-Ma, 1999, capítulo 2, pp. 15-30. (RJR) 3 Stevens, S. S. (1951): “Mathematics, Measurement and Phychophysics”, en S.S. Setevens (ed.), Handbook of Experimental Psychology, Wiley, Nueva York. Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -2- ceso de medición el análisis teórico del suceso analizado adquiere una importancia capital puesto que la teoría precede a la medición, de modo que cada medición implicará la adquisición de un marco teórico previo (Anderson 1983: 234-236). Seleccionadas las propiedades a medir el siguiente paso consiste en establecer una regla de asignación sistemática de símbolos de modo que la relación existente entre éstos sea la misma que la relación entre las características que representan (Green et al, 1988: 242; Walance 1980: 41). La gran aportación de esta definición es que tiene en cuenta un elemento fundamental en el proceso de medición como es el concepto de isomorfismo: para medir correctamente un objeto o hecho debe existir una igualdad entre las operaciones que se pueden hacer con los números y las que se pueden realizar con los propios objetos o hechos (Anderson, 1983: 239). Es en este punto donde el debate sobre los procesos de medición en Ciencias Sociales alcanza el punto más álgido, puesto que es muy difícil una aplicación estricta de esta condición a las mediciones de fenómenos sociales: los números pueden ser clasificados según su orden o secuencia numérica ordenada, según su distancia o diferencia numérica, y según su origen 4 (Grande 1996: 319); clasificaciones que no siempre es posible aplicarlas a los fenómenos sociales. Este debate ha dado lugar a diferentes concepciones sobre la posibilidad de medición de estos fenómenos, desde los que niegan cualquier posibilidad de cuantificación de los mismos hasta aquellos que -sin plantearse los problemas inherentes al proceso de medición- realizan mediciones uniendo conceptos o características con códigos numéricos (Anderson y otros 1983: 233; González Blasco 1989:228-29). En este trabajo adoptaremos la concepción realizada por González Blasco que considera el proceso de medición como una "correspondencia entre números y propiedades de los objetos o hechos sociales considerados en el quehacer sociológico" (1986: 229). Esta concepción adquiere un mayor grado de complejidad cuando es empleada para medir las características específicas de -los fenómenos sociales (Del Rincón y otros, 1995: 50-51): En numerosas ocasiones deseamos medir características, hechos, fenómenos o aspectos que no son directamente observables (grado de felicidad, postmaterialismo, etc.), siendo necesario localizar las acciones o los efectos visibles de los sentimientos o concepciones objeto de estudio. Relacionado con lo anterior, otra de las peculiaridades de los fenómenos sociales es el carácter cualitativo de algunos de ellos, carácter cualitativo que presenta una gran dificultad para una correcta medición. En numerosas ocasiones la solución consistirá en separar las distintas dimensiones de cada fenómeno y buscar indicadores que posibiliten la medición de cada una de ellas. En otras ocasiones no será posible medir los fenómenos en toda su complejidad, teniéndonos que contentar con medir una parte del mismo. En tercer lugar la falta de instrumentos de medida generalizados hace necesaria una elaboración ad hoc con objeto de estudiar cada fenómeno concreto. Pese a realizar esta construcción de forma muy rigurosa y someter el instrumento de medida a diversas pruebas antes de determinar la versión final, en numerosas ocasiones los instrumentos construidos no pueden medir toda la complejidad de los fenómenos sociales. Utilizaciones posteriores de determinados instrumentos ponen de relieve los fallos de éstos, invalidando así los procesos de medición efectuados. Además, la elaboración de instrumentos de medida tiene en ocasiones una validez temporal limitada: instrumentos que en un momento pueden detectar ciertos fenómenos, no son capaces de medirlos correctamente en otros momentos históricos. Son estas características específicas de los fenómenos sociales las que hacen tan problemático el proceso de medición en ciencias sociales. Además de los problemas citados puede ocurrir que tras realizar una medición en dos momentos temporales se obtengan resultados diferentes. Al preguntamos por la causa de las diferencias el número de posibles respuestas será amplio: este cambio en los valores obtenidos puede estar provocado por una escasa precisión del instrumento de medida. En ocasiones puede ser debida al proceso de medición y a la complejidad que conlleva. Otra posibilidad es que la medición efectuada sea válida, y la diferencia respecto a la medición anterior esté causada por un cambio en las características de los fenómenos recogidos hace un tiempo. En el último apartado de este capítulo dedicado a la fiabilidad y validez analizaremos con detalle cómo conocer y resolver cada uno de estos problemas. El proceso de medición en la investigación social 4 Orden: o secuencia numérica ordenada: una persona, dos personas, etc. Distancia: entre números: entre una renta de 250.000 y otra de 200.000 hay una diferencia de 50.000 pesetas. Origen: determinado de la secuencia. Algunas magnitudes pueden tener su origen en el nivel cero (por ejemplo mientras que otras presentan números superiores. renta), Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -3- Aún a riesgo de parecer reiterativos con algunas de las ideas expuestas en el capítulo anterior, comenzamos la investigación formulando unas hipótesis sobre determinados hechos y fenómenos presentes en la realidad social. En la medida en que les prestamos más atención comprobamos cómo estos fenómenos se repiten regularmente en unas condiciones determinadas. Esto permitirá enunciar una serie de reglas "aproximativas" sobre las situaciones en las que se repite este fenómeno, reglas que permitirán definir conceptualmente el hecho social considerado. La primera fase del proceso de medición está a punto de finalizar, faltando tan sólo la comprobación "retroactiva" del concepto definido, la "vuelta atrás" para comparar el concepto elaborado con el hecho social que representa (Figura 2. l). FIGURA 2. 1: PROCESO DE MEDICIÓN Del hecho social a su definición conceptual Hecho social Regularidades Reglas de comportamiento Concepto Relación entre el concepto elaborado y el hecho social Análisis y verificación del concepto elegido Concepto Dimensiones Operacionalización Fenómeno Proceso completo: Del hecho social al hecho social Hecho social Regularidades Indicadores Reglas de comportamiento Concepto Dimensiones Fuente: Adaptado de González Blasco, 1989: 232 Una vez realizada la definición conceptual del fenómeno será necesario analizar otros conceptos relacionados y definir las dimensiones o factores que los integran. Se trata de "movemos" paulatinamente del lenguaje de la teoría al lenguaje de la investigación. Los conceptos son abstracciones que miden nuestras impresiones sobre el mundo, no son observables puesto que son construcciones mentales y por ello son difíciles de medir. Para conocer la presencia de estos conceptos en la realidad social será necesario buscar indicadores que permitan medir este fenómeno. Este proceso de "traspasar" el lenguaje de la teoría (conceptos) al lenguaje de la investigación (indicadores) recibe el nombre de operacionalización: la definición operacional es el proceso donde los investigadores especifican observaciones empíricas que pueden ser tomadas como indicadores de los atributos contenidos dentro de un concepto (Babbie, 1990: 121). De este modo, una vez definidas las dimensiones del concepto, el siguiente paso será operacionalizar cada una de estas dimensiones buscando indicadores que permitan medir estas dimensiones en la realidad social. Para finalizar, este concepto (con todas sus dimensiones e indicadores) será comparado con el hecho inicial, con las regularidades del fenómeno observado para ser redefinido si es necesario. Esta comparación se realizará preguntándonos en todo momento si el concepto recoge (abarca) todos los aspectos del fenómeno observado. Utilicemos un ejemplo para una mejor comprensión de este proceso: tras el análisis de la estructura social de una Comunidad Autónoma se aprecia que en una de las regiones que la componen los residentes en municipios pequeños tienen menor nivel educativo que los residentes en ciudades. La curiosidad del investigador le incita a buscar si esta relación se da también en el resto de regiones de esta comunidad, y posteriormente en todo el conjunto nacional. La búsqueda de estas regularidades va generando en el Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -4- todo el conjunto nacional. La búsqueda de estas regularidades va generando en el investigador la idea "en los municipios pequeños hay menos posibilidades para desarrollar el nivel cultural5-que en las ciudades". El investigador ha formulado de forma más o menos general el concepto "Nivel Cultural" y es el momento de medirlo empíricamente analizando su presencia en la realidad social. Para ello será necesario descomponerlo en partes más pequeñas, en dimensiones o factores que "engloben" el fenómeno, y que variarán según el marco teórico y la definición elegida del concepto (Anderson y otros, 1983: 233). Si hubiera definido el concepto "nivel cultural" como el nivel de estudios terminados de una población la única dimensión del concepto será el "nivel de estudios terminados". El investigador del ejemplo considera una definición algo más amplia al contemplar distintas dimensiones en su concepción del nivel cultural: nivel de estudios terminados, lectura de publicaciones periódicas (frecuencia y tipo), lectura de libros, número de horas viendo la televisión, asistencia a actos culturales, y una escala de conocimiento de personajes relevantes en diferentes ámbitos (Cuadro 2. l). Incluso podría emplearse una escala con proposiciones verdaderas y falsas sobre diversos temas y pedir a los entrevistados que señalen cuáles dicen la verdad y cuáles no, tal y como hacen J. L. Luján y L. en un estudio sobre la percepción de la Ingeniería Genética en España: "... el alto interés hacia la Ciencia y la Tecnología contrasta con el conocimiento de hechos científicos, como se constata tras analizar el promedio de respuestas correctas dadas a enunciados de hechos científicos recogidos por el Eurobarómetro de 1992..." (Luján y Moreno, 1994, Cap. 3, pág. 5). Es evidente que con este proceso se gana en precisión, pero también se pierde en amplitud, puesto que el cuadro 2.1 es un concepto "aproximativo" del nivel cultural al no incluir determinadas características (dimensiones) del mismo. Esta definición está referida a las siete dimensiones expuestas en el cuadro 2. 1. El resto de acepciones del nivel cultural quedará fuera de esta investigación al no ser recogido por los indicadores que formularemos para cada dimensión. No obstante, es conveniente señalar que recoger muchas dimensiones de un fenómeno complica en exceso el tratamiento posterior de las mismas de modo que será necesario lograr un punto medio entre el número de dimensiones de un concepto, la importancia de cada una y el número de dimensiones que decidamos utilizar en nuestra investigación para que el fenómeno quede correctamente delimitado. Establecidas las dimensiones del nivel cultural el siguiente paso es la operacionalización de éstas eligiendo las medidas concretas (indicadores) que permitan analizar cada una de las dimensiones establecidas. Se trata de seleccionar una serie de semejantes equivalentes empíricos o indicadores para aquellas dimensiones que, en principio, sólo han sido definidas teóricamente y que han de constituir el objeto de la investigación" (Mayntz y otros 1975: 53). Es preciso señalar que la utilización de indicadores en cada dimensión vuelve a reducir la amplitud de las distintas dimensiones, reducción que redundará en una mejor capacidad de medición, en una mayor precisión. 5 Tener en cuenta que en la primera proposición se decía que "los residentes en municipios pequeños tienen menor nivel educativo…” Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -5- CUADRO 2.1: ALGUNAS DIMENSIONES o FACTORES DEL NIVEL CULTURAL Variable Conceptual: NIVEL CULTURAL Dimensiones Indicadores 1 Estudios * Estudios alcanzados. 2 Lectura de revistas * Tipo de revistas: científicas, culturales, cotilleos. * Frecuencia de lectura: Número de revistas leídas. 3 Lectura de libros * Tipo: Novela, best-sellers, libro científico, etc. * Frecuencia de lectura (Número de libros al año) * Últimos libros leídos. 4 Cine * Frecuencia de asistencia al cine * Criterios para elegir una película * Últimas películas vistas * Conocimiento de actores, directores, etc. 5 Televisión * Programas preferidos * Número de horas semanales viendo la televisión * Selección de programas, espectador pasivo 6 Asistencia a actos culturales * Posibilidad de asistencia en su ciudad * Frecuencia con la que asiste. 7 Conocimiento de personajes * Políticos (actuales y del pasado) * Personajes del mundo cultural: escritores, actores, etc. Entre las muchas clasificaciones existentes atenderemos a la que realizan Mayntz y otros (1975: 5458) según la relación del indicador con la dimensión teórica que representa. Según este criterio clasifican los indicadores como definitorios, correlativos internos, correlativos externos y de inferencia. Los primeros definen la dimensión investigada y suelen utilizarse para conceptos sencillos. Los correlativos internos son parte de la dimensión teóricamente definida (los utilizados por nosotros en el cuadro 2. l), mientras que los externos no son partes de la dimensión definida pero muestran una gran correlación con ella. Los indicadores de inferencia son utilizados para inferir valores de dimensiones no directamente observables. (Mayntz y otros 1975: 54-58). 6 Los indicadores elegidos para cada dimensión del ejemplo utilizado se encuentran a la derecha del cuadro 2. 1. Algunas dimensiones únicamente necesitan un indicador, mientras que otras están formadas por dos o más. Esto nos lleva a preguntar cuántos indicadores son necesarios para definir una dimensión. La respuesta es similar a la que hacíamos unas líneas más arriba a la hora de preguntar por las dimensiones de un concepto: se trata de elegir un número de indicadores que representen de la mejor forma posible la dimensión con la que están relacionados, de modo que la elección de este número variará según la complejidad del fenómeno. Debi6 Para una ampliación de la clasificación de indicadores consultar: Sierra Bravo, R (1998): Técnicas de Investigación Social. Teoría y Ejercicios: Madrid, Paraninfo, 1998, Las variables empíricas o indicadores, pp. 112-114 y Lazarsfeld, P. y Boudon, R. (1965): Metodología de las Ciencias Sociales. Conceptos e Indices. Tomo I: Barcelona, Editorial Laía, 1973, capítulo 1: De los conceptos a los índices empíricos, pp. 35-46. (RJR) Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -6- do a la dificultad de medir correctamente dimensiones de fenómenos muy complejos lo mejor será seleccionar en un primer momento un gran número de indicadores que serán desechados a medida que avance el proceso de investigación: el comparar la definición del concepto con el hecho social permitirá eliminar algunos indicadores y seleccionar los mejores para la medición de este hecho social (Figura 2. l). La sucesiva redefinición de los conceptos empleados incluirá o eliminará ciertos indicadores y dimensiones. La elección del número de indicadores no sólo depende de la complejidad de la dimensión, sino que varía también según el medio social del individuo estudiado. Si en nuestro ejemplo estamos interesados en comparar el nivel cultural de los municipios menores de 1.000 habitantes en zonas de montaña con poca accesibilidad, algunos de los indicadores seleccionados no tendrán sentido en estos municipios: más que analizar el tipo de revistas que lee será mejor preguntar por el tipo de revistas que llegan a su municipio y de éstas cuáles suele leer. La ausencia de una sala de cine cuestionará la utilización de los indicadores relacionados con esta actividad. No obstante, en última instancia la realización del pretest previo al cuestionario permitirá seleccionar qué indicadores miden mejor las dimensiones seleccionadas. Ésta es la razón por la que aconsejábamos utilizar en un primer momento un gran número de indicadores. El pretest siempre podrá seleccionar los que mejor funcionan. Si hemos elegido un indicador por cada dimensión y tras realizar del pretest nos encontramos con que algunos de ellos no miden adecuadamente la dimensión que representan, será necesario volver a realizar todo el proceso, incluido el pretest. Si por el contrario éste lo realizamos con un gran número de indicadores tendremos más "capacidad de maniobra" para eliminar los que no funcionan, o incluso para quedarnos con los que mejor funcionan si varios de ellos miden correctamente la dimensión. En esta línea numerosos investigadores aconsejan testar las hipótesis más importantes con más de un indicador, construyendo escalas multi-ítem7. La gran ventaja de éstas es que posibilitan recoger la totalidad de un determinando concepto de forma más precisa que si se realiza una única pregunta. Además, la calidad de la medición efectuada es mayor, puesto que si algunos entrevistados no han entendido determinado ítems el utilizar varios indicadores para una dimensión nos asegura -al menos- una medición válida en cada dimensión. Por último estas escalas permiten hacer distinciones precisas entre los entrevistados al recoger mayor información de cada uno. En el proceso de construcción de estas escalas se puede optar por elaborar una escala amplia con un gran número de ítems que engloben los indicadores de todas dimensiones, o bien por utilizar varias escalas, cada una con menos ítems. El cuestionario incluido en el Anexo 1 se ha utilizado una única escala con indicadores de varias dimensiones a fin de conocer las actitudes y comportamientos de compra de consumidores (Pregunta 10 del cuestionario definitivo expuesto en el Anexo l). El último apartado de este capítulo se exponen los criterios seguidos para la construcción de la misma y las depuraciones de ítems llevadas a cabo con el pretest. Todo el proceso realizado hasta ahora ha consistido en una "descomposición” paulatina de un fenómeno social en partes más pequeñas que puedan ser medidas. Realizada la recogida de datos comienza el proceso inverso. Una vez definidas dimensiones del concepto y los indicadores de cada una, será preciso abandonar las explicaciones parciales combinando los valores obtenidos en cada uno de indicadores utilizados para medir las dimensiones definidas: la unión de los indicadores de cada dimensión definirá el concepto "nivel cultural". Este proceso por el cual combinaciones de valores de varios indicadores son unidos para representar una dimensión o concepto recibe el nombre de construcción o elaboración de índices. May define los índices como "una variable unidimensional con r valores sobre la que representan las v clases de posibles combinaciones de atributos en un espacio pluridimensional" (1976: 61). Estos autores señalan dos elementos a tener muy en cuenta en la elaboración de índices: el primero tiene que ver con la representación de todas dimensiones parciales que forman parte del concepto, mientras que el segundo hace referencia a la forma en la que se unen estos datos: la asignación de determinados valor numéricos, combinación de los mismos, ponderación de determinados indicadores tener más importancia que otros en la definición del concepto, etc. Los criterios utilizados para este segundo aspecto pueden ser tomados del marco teórico elegido en investigación, del análisis crítico de índices sobre temáticas similares realizados por otros autores, e incluso de la validación empírica del 7 Para concer el procedimiento técnico de construcción de escalas multi-ítem, Cf. Arce, Constantino (1994b): Técnicas de construcción de escalas psicológicas: Madrid, Síntesis, 1994, capítulo 3: Escalamiento de sujetos (Modelo Likert), pp. 31-44. (RJR) Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -7- índice construido (Mayntz 1976: 62). En el capítulo 5 expondremos diversos índices para medir el estatus social, índices que servirán como punto de partida para la realización de un índice sobre estatus social e los datos obtenidos con nuestro cuestionario. 2. VARIABLES Y ESCALAS DE MEDIDA. TIPOS DE ESCALAS En el apartado anterior se ha explicado el método que utiliza el investigador social para convertir los hechos sociales en proposiciones conceptuales que ser definidas según sus diferentes dimensiones. En numerosas ocasiones las "representaciones simbólicas de las dimensiones" reciben el nombre de variables, aunque "otras veces se utiliza este nombre para hacer referencia a los conceptos mismos, sin ser descompuestos en dimensiones" (González Blasco, 1989: 234). Para Sierra Bravo 1as variables presentan dos características fundamentales: ser características observables de algo y ser susceptibles de cambio con relación a uno o diferentes objetos (1988: 98). De las múltiples clasificaciones sobre los tipos de variables que intervienen en la investigación social adoptaremos la tipología realizada por Sierra Bravo (1988: 105-108) que las clasifica en cinco grupos según su naturaleza (cuantitativas y cualitativas), la amplitud de las unidades de observación a las que se refieren (individuales y colectivas), el nivel de abstracción (generales, intermedias e indicadores), el carácter de los elementos de variación que comprenden (nominal, ordinal, intervalo y razón), y su posición en la investigación atendiendo a la relación entre variables. Bisquerra (1989: 75-9) añade nuevos elementos a esa tipologización cuando clasifica las variables según el control experimental (aleatorias y controladas) y según el enfoque teórico-explicativo (variables estímulo, variables respuesta y variables intervinientes). De esta clasificación nos centraremos en el primer criterio, la naturaleza de las variables referido a la métrica de la variable distinguiendo entre variables categóricas o cualitativas, donde los elementos de variación tienen carácter no numérico, y variables numéricas o cuantitativas cuyos elementos tienen carácter numérico. Aprovecharemos esta clasificación para exponer pormenorizadamente los tipos de escalas de medición -el carácter de los elementos de variación en palabras de Sierra Bravo- propuestas por Stevens (1 946, 1951) y sus aplicaciones para el uso de procedimientos estadísticos. Tras definir el proceso de medición como “la asignación de números a cosas y propiedades según ciertas reglas”, a mediados de siglo Stevens (1946, 1951) formuló un concepto de medida para hechos sociales que sigue utilizándose hoy en día. Stevens elabora cuatro tipos de escalas según la regla utilizada en la asignación de códigos numéricos a las propiedades de los hechos sociales. Cada escala tiene distintas propiedades matemáticas que posibilitan utilizar determinados test estadísticos. La elección de la escala condicionará la prueba estadística a utilizar. Algunos hechos sociales pueden ser medidos utilizando una única escala, mientras que las propiedades de otros hechos posibilitarán la utilización de cualquier tipo de escala. Dos criterios deben utilizarse cuando se va a elegir una determinada escala: a) si una variable puede ser medida de diferentes formas deberemos utilizar el nivel de medida que posibilite aplicar los test estadísticos más poderosos, y b) e1 criterio que debe guiar la utilización de cada una es conseguir medir un fenómeno con la máxima precisión. Respecto a este criterio, adelantemos la exposición de algunas de las características de las escalas mediante la utilización de un ejemplo: Dentro de la definición del "nivel cultural" expuesta en el cuadro 2.1, estábamos interesados en la asistencia al cine. Este hecho puede ser medido utilizando diferentes cuestiones: a) Preguntando si va al cine: Respuesta: sí/no b) Preguntando con qué frecuencia va al cine: Respuesta: Todos o casi todos los días. 1 vez a la semana. Varias veces al mes. Una vez al mes. Nunca. c) Preguntando el número de veces que va al cine cada mes: Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -8- Respuesta: Decir número de veces. Es evidente que la calidad de la información recogida por la pregunta "c" es muy superior a la pregunta "b", y ambas miden la asistencia al cine mejor que la pregunta “a”. A esto nos referimos cuando decimos que cuando se mida un fenómeno hay que intentar hacerlo con el máximo nivel de precisión. Además, siempre será posible "reducir"8 –en un segundo momento- el nivel de precisión convirtiendo, en este ejemplo, la pregunta "e" en la "b": los que van al cine 2 veces al mes pueden ser codificados en la pregunta "b" como varias veces al mes, los que van 4 veces como una vez a la semana, etc. Incluso es posible convertir las posibilidades de respuesta de ambas opciones a la dicotomía sí/no de la pregunta "a". Es evidente que no puede realizarse el proceso contrario, pese a que se han realizado numerosos intentos para lograrlo (Villarejo Ramos y otros, 1996: 465-470). Sin más preámbulos veamos las características de las escalas propuestas por Stevens, cuyo resumen se expone en el cuadro 2.2. 2.1. Escala nominal La escala nominal es la más simple y débil forma de medición puesto que únicamente permite decir que las categorías difieren unas de otras. Los números sirven únicamente para identificar o catalogar los objetos o sucesos, no siendo posible establecer ninguna relación de orden entre las categorías: una categoría de una variable no es necesariamente "mayor o menor" que otra, simplemente es diferente. Estas escalas son utilizadas para las formas más sencillas de medición, clasificar e identificar fenómenos, y la única restricción es no asignar a dos categorías o sucesos el mismo número, o a dos números una misma categoría. La información debe ser clasificada en categorías no numéricas, exhaustivas y mutuamente excluyentes (No numéricas en sentido estricto). Ejemplos de escalas nominales son la medición del estado civil, sexo, tipos de comunidad, voto político, lugar de residencia, matrículas de coche, etc. Algunos de estos ejemplos (sexo, por ejemplo) únicamente admiten dos posibles respuestas (hombre o mujer), y por ello son definidas como variables dicotómicas. Una variable dicotómica es normalmente una escala nominal, puesto que cumple las características de éstas, aunque en determinados momentos puede ser considerada como una variable ordinal si es posible encontrar una relación de orden en su dicotomía: la presencia o ausencia de una característica podría entenderse como una relación ordinal (Bryman y Cramer, 1997: 57). En cuanto a las medidas descriptivas y los tests estadísticos utilizados para el nivel de medeición nominal, al ser este la forma más débil de medición, es también la que permite utilizar un menor número de estadísticos. La tendencia central podrá ser conocida utilizando la moda, mientras que la dispersión y la distribución de los valores podrá conocerse mediante distribuciones de frecuencias. No es posible utilizar la media ni la mediana puesto que requieren propiedades del sistema de medición no conseguidas por esa escala. (La Hipótesis Nula (H0) de independencia entre variables categoriales se pone a prueba mediante el Test de significación estadística Chi Cuadrado. RJR). Las relaciones de dependencia entre variables nominales podrán medirse mediante los Coeficientes de Asociación9: C de Contingencia, V de Cramer, Phi, Lambda y otro que serán mostrados en capítulo 7. 8 La función de ‘recatecorización’ puede ser realizada con el comando “Recodificar” (Recode), ( > En distintas variables), del menú Transformar, del paquete estadístico SPSS. RJR 9 Para profundizar las medidas de asociación para variables categóricas de nivel nominal, Ver: a) Ato García, Manuel y López García, Juan José (1996): Análisis estadístico para datos categóricos, Madrid, Síntesis, 1996, punto 2.6.1: Medidas de asociación nominales, pp. 49-58; y b) Siegel, sidney y Castellan, N. John (1956):Estadística no paramétrica. Aplicada a las ciencias de la conducta. México, Editorial Trillas, 1998, 437 pp. RJR Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -9- 2.2. Escala ordinal La escala ordinal representa el siguiente nivel de medición, ya que además de catalogar e identificar los objetos permite el establecimiento de relaciones de orden entre las diferentes categorías, siendo posible establecer entre los individuos relaciones de preferencia, de mayor o menor que... A las relaciones de diferencia propias de las escalas nominales las ordinales añaden una diferencia de grado. El estatus socioeconómico es un ejemplo de escala ordinal. Considerado un criterio definitorio (un indicador) (por ejemplo, los ingresos) todos los miembros de la clase alta lo poseerán en mayor medida que los de la clase media, y éstos a su vez más que la clase baja. Otros ejemplos de escala ordinal son el nivel de estudios, escala de situación política, etc. En cuanto a las restricciones, además de las propias de las escalas nominales la medición ordinal debe respetar las relaciones observadas en la asignación del sistema de medición, ordenando los números según su orden serial. Los atributos o variables a analizar expresados en escala ordinal pueden cuantificarse por rangos; asignando a cada categoría el número de orden que le corresponda en la ordenación de tales categorías (por ejemplo, nivel de estudios de mayor a menor, etc.). Según las distintas posibilidades de cuantificación de las categorías, Ruiz-Maya y otros (1990: 26-27) consideran dos tipos de escalas ordinales: Las escalas de fijación arbitraria que se caracterizan por una "asignación arbitraria de valores numéricos a las categorías manteniendo la información del factor original", mientras que la fijación por rangos "asigna a cada categoría el número de orden correspondido en la ordenación de tales categorías". Los autores ponen el ejemplo del Nivel de Estudios, formado por tres categorías: Básicos, Medios y Superiores. La fijación arbitraria asignaría los valores -1, 0 y 1 respectivamente, mientras que en la fijación por rangos estas categorías adoptarían los valores 1, 2 y 3 respectivamente. La escala ordinal permite utilizar más estadísticos que la anterior. Para conocer la tendencia central pueden utilizarse la moda y la mediana, muy interesante esta último porque no varía con los casos extremos ni por la existencia de individuos atípicos. La dispersión de los datos puede ser conocida con el rango y la desviación intercuartílica, mientras que los percentiles y las distribuciones de frecuencias permiten conocer su distribución. Para analizar las relaciones entre variables utilizaremos10 11 12 los Coeficientes de Asociación: D de Somers, Gamma, Tau-a, Tau-b de Kendall, Rho de Correlación por Rangos Spearman. Como se puede apreciar en el cuadro 2.2. el elemento común a las dos escalas explicadas hasta el momento es que utilizan procedimientos estadísticos no paramétricos.13 A lo largo de la exposición se ha comprobado cómo las escalas ordinales cumplen todas las propiedades y restricciones de las nominales, además de tener algunas propiedades más. En el párrafo anterior se ha puesto de manifiesto que los estadísticos utilizados en las escalas nominales sirven también para las ordinales, aunque ello implicará no considerar las relaciones de orden: al utilizar las escalas ordinales con los estadísticos propios de las nominales todas las variables son consideradas como no- 10 Para profundizar las medidas de asociación para variables categóricas de nivel ordinal, Ver: Ato García, Manuel y López García, Juan José (1996), ob. cit.., punto 2.6.2: Medidas de asociación ordinales, pp. 59-64. RJR 11 En Díaz de Rada, Vidal (1999), ob. cit. se desarrolla una extensa explicación de la estadística bivariada para variables nominales y ordianles (Capítulo 6) y una detallada aplicación de la misma al problema de investigación: un nuevo consumidor que experimenta un elevado placer en el acto de compra (Capítulo 7). RJR 12 Una excelente monografía de análisis estadístico para tablas de contingencia bidimensionales es: Aguilera del Pino, Ana María (2001): Tablas de contingencia bidimensionales. Cuadernos de Estadística nº 15, Madrid, Editorial La MurallaEditorial Hesperides, 2001, 214 pp. RJR 13 “ Estadística No Paramétrica: Parte de la estadística formada por las técnicas estadísticas que no llegan a cumplir los requisitos de: nivel de medición interval, distribución poblacional normal, e igual o similar varianzas en la distribución de frecuencias de dos o más variables (homocedasticidad)”, Sierra Bravo, Restituto (1991): Diccionario Práctico de Estadística. Madrid, Paraninfo, 1991, p. 273. RJR Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -10- minales, es decir, no se tienen en cuenta las relaciones de orden entre las categorías. Evidentemente no es posible realizar la operación inversa; utilizar los estadísticos de las escalas ordinales para escalas nominales. Como se ha afirmado las escalas ordinales miden si un objeto tiene más o menos de una característica con respecto a otro objeto, pero no proporcionan información sobre la mayor o menor cantidad de esta característica que posee el objeto. Es decir, sabemos que tiene una característica en mayor grado que otro, pero no es posible cuantificar la diferencia. Éste será el elemento diferenciador del siguiente tipo de medición. 2.3. Escala de intervalo Además de las propiedades de la escala ordinal, la escala de intervalo establece una unidad de medida de modo que puede cuantificarse numéricamente la distancia existente entre dos observaciones cualesquiera. La característica distintiva de las escalas de intervalo es la igualdad de los intervalos: en esta escala la diferencia en la ordenación de los intervalos es expresada en unidades que tienen el mismo valor absoluto y que permanecen constantes a lo largo de toda la escala (intervalos iguales) De este modo el investigador puede especificar el número de características que tiene una categoría respecto de la anterior; “cuanto mayor" es una categoría respecto a otra. Un ejemplo ayudará a expresar este concepto. Supongamos una variable de un cuestionario como podría ser la edad en años. Con esta variable es posible cuantificar numéricamente la distancia (en años) entre dos individuos, así diremos que el entrevistado de 30 años tiene 10 años más que el entrevistado de 20. Los intervalos de la escala son iguales al estar dividida en años, expresando cada entrevistado el número de unidades que posee de esta característica (años). A medida que aumenta o disminuye la escala la unidad de medida no varía: en las edades superiores la medición no se realiza en quinquenios, ni en las edades inferiores se realiza por meses, y un año implica la misma cantidad de meses vividos si el entrevistado está al principio o al final de la escala; cumpliendo así que "la diferencia entre los intervalos se expresa en unidades que tienen el mismo valor absoluto y que permanecen constantes a lo largo de toda la escala". Al igual que indicábamos en las páginas anteriores es posible agrupar los distintos valores de una escala de intervalo formando así una escala ordinal. Al categorizar la edad de los entrevistados en tres grupos ("entre 19 y 30 años", "entre 31 y 40", y "más de 40") obtendríamos una escala ordinal, y ya no sería posible cuantificar la distancia existente entre los que tienen 40 y los que tienen 20 años. Tan sólo puede decirse que unos tienen más edad que otros. Respecto a los estadísticos a utilizar, la escala de intervalo es denominada por otros autores como variable continua o cuantitativa, permitiendo la utilización de todos los estadísticos descriptivos excepto la media geométrica, la media armónica y el coeficiente de variación: Para conocer la tendencia central se utiliza la moda, la mediana, la media, y la media truncada (menos sensible a la presencia de casos extremos), mientras que la dispersión puede conocerse con la Desviación típica, el Recorrido intercuartílico (Desvío intercuartílico) y el rango (Amplitud total). La especificidad de esta escala requiere en ocasiones conocer la Asimetría y la Curtosis (Curtosis) de los datos recogidos. Además de estos estadísticos descriptivos, las escalas de intervalo permiten utilizar todos los procedimientos estadísticos paramétricos, siempre que los datos cumplan los requisitos especificados por cada técnica estadística: Coeficiente de Correlación Lineal r de Pearson, Coeficiente de Correlación Parcial, Coeficiente de Regresión Lineal Múltiple, (y otros coeficientes derivados del r de Pearson que se usan en diferentes condiciones. Ver Tabla 2.2. RJR14), Análisis Factorial, etc. (y otras técnicas de Análisis Multivariado, tanto técnicas descriptivas o de interdependencia como explicativas o de interdependencia. RJR). 14 Para conocer una clasificación de coefcientes de asociación y correlación y sus respectivas fórmulas, Ver: a) Sierra Bravo, R. (1998), ob. cit., p. 507; y b) Fernádez Díaz, María José et.al. (1999): Resolución de problemas de estadística aplicada a las ciencias sociales. Guía práctica para profesores y alumnos. Madrid, Editorial Síntesis, punto 3: Medidas correlacionales, pp.58-72. RJR Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -11- En numerosas ocasiones los investigadores no muy familiarizados con estos conceptos suelen tener problemas para diferenciar entre los tipos de escalas, diferencia que se hace más patente entre escalas ordinales y de intervalo. Las respuestas a las escalas tipo Likert, que estrictamente hablando son escalas ordinales, suelen ser consideradas en numerosas ocasiones como escalas de intervalo para poder utilizar así los test estadísticos más potentes. No hay un acuerdo claro sobre el error que se comente al tratar estas escalas como de intervalo, si bien muchos investigadores minimizan la magnitud de estos errores puesto que el único criterio no respetado al considerar una variable ordinal como si fuera de intervalo es la "igualdad de intervalos" (Kinnear y Taylor, 1993: 233)15. En esta misma línea se posiciona Lavovitz (1970 y 1971) cuando dice que la cantidad de error que se comete con esta estrategia es mínimo, fundamentalmente si se consideran las enormes ventajas que pueden obtenerse al utilizar técnicas de análisis como la Correlación y Regresión, técnicas muy potentes y con una enorme facilidad de interpretación. Tras analizar estos comentarios, nuestro punto de vista se inclina más por seguir los consejos de O'Brien (1979) y Schroeder (1990: 46-47) cuando exponen algunos de los problemas derivados de este hecho: "Bajo ciertas condiciones puede ser apropiado tratar una variable ordenada como si fuera continua... En particular, cuando una variable discreta cuantitativa ordenada toma un amplio rango de valores, es razonable tratar la variable como si fuera continua. No obstante, es inapropiado tratar como variable continua aquellas variables ordenadas con pocas categorías (cinco o menos)". Hemos señalado que con la escala de intervalo proporciona información sobre la diferencia entre valores, pero la ausencia de valor cero impide conocer la proporción existente entre las magnitudes: no es correcto decir que 80 grados es el doble de temperatura que 40 grados. Esto tan sólo lo cumple el modo más preciso de medición, la escala de razón. 15 “…Es mjy común tratar las escalas de clasificación (ordinal) como escalas de intervalos y hacer el cálculo de las medias y las desviasiones estándar en tales mediciones. El investigador debe tener en cuenta esta práctica y recordar el potencial de error de medición en los hallazgos de la investigación”., Kinnear, T. y Taylor, J. (1981): Investigación de Mercados. Un enfoque aplicado. 4ª ed., México. McGraw-Hill, 1993, p. 233. RJR Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -12- FIGURA 2.2. ESTRATEGIAS PARA DIFERENCIAR LOS TIPOS DE ESCALAS ¿Tiene más de dos categorías? Escala Dicotómica (Escala Nominal) NO SI ¿La distancia entre categorías es la misma? Escala de Intervalo o Razón SI NO ¿Pueden ordenarse las categorías según sus rangos? Escala Ordinal Escala Nominal SI NO Fuente: Bryman y Cramer, 1997: 59. 2.4. Escala de razón Las escalas de razón alcanzan el más alto nivel de medida, puesto que las escalas de intervalo no contemplan el valor cero, o en caso de considerarlo éste es arbitrario y no indica el verdadero significado del punto 0. Longitud, peso, años, ingresos, número de clientes, etc. son ejemplos de escalas de razón puesto que contemplan el valor cero al medir los ingresos, la longitud, el peso, etc. En el apartado anterior hemos utilizado el ejemplo de la edad porque permitía explicar muy gráficamente las características de la escala de intervalo, pese a que esta variable tiene el valor cero. La utilización de este ejemplo no es incorrecto puesto que como hemos señalado cada escala de medición cumple las características de los sistemas de medición anteriores. Además, y como señalan Bryman y Cramer, la diferencia entre escalas de intervalo y de razón "no es examinada por los científicos sociales porque en ciencias sociales la mayoría de las escalas de intervalo son también de razón" (1997: 56-57). Al ser la forma más completa de medición es posible hacer comparaciones de las proporciones entre magnitudes, además de utilizar todos los estadísticos expuestos en las escalas anteriores, si bien la pe- Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada -13- culiaridad de ésta hace más apropiado medir la tendencia central con la media geométrico y la media armónica, mientras que la dispersión se mide adecuadamente con el Coeficiente de variación. Tras la exposición de los tipos de escalas existentes el lector experimentado estará de acuerdo con nosotros en que las escalas nominales y ordinales son las más utilizadas en la investigación social, además de que necesitan cumplir menos requisitos (postulados) para ser aplicadas a las diversas técnicas de análisis de datos. Sorprendentemente el número de publicaciones sobre análisis de datos nominales y ordinales no es muy elevado en ciencias sociales, pese al gran desarrollo de éstas en los últimos años (Amemiya 1981: 1485). La gran utilización de estas escalas en ciencias sociales, unido al gran desarrollo de las técnicas de análisis de datos nominales y ordinales, así como el escaso número de publicaciones nos han animado a centrar la exposición de la segunda parte del libro al análisis de las Técnicas de Análisis de Datos Nominales y Ordinales.. Terminaremos este apartado con un planteamiento crítico: en cada una de las escalas se han explicado los procedimientos estadísticos más apropiados, tal y como fue formulado por Stevens y otros investigadores que han teorizado sobre estos aspectos. Stevens propuso que ciertos estadísticos eran apropiados para cada tipo de escala puesto que las operaciones estadísticas de los datos dependen del tipo de escala empleado, de modo que los estadísticos de escalas "superiores" (intervalo, razón) no pueden ser utilizados para escalas que no cumplan esas propiedades (nominal). No obstante, en los últimos años están apareciendo trabajos que cuestionan esta proposición al argumentar que los aspectos y problemas de la medición tienen que ser analizados independientemente de las técnicas de análisis de datos a utilizar. Esto lleva a otros autores de esta escuela a considerar que las propiedades de los eventos medidos son irrelevantes a la hora de realizar el tratamiento estadístico-matemático: las propiedades de las escalas son irrelevantes a los requerimientos matemáticos para aplicar un cierto conjunto de datos. En este trabajo consideraremos la propuesta de Stevens, entre otras razones por ser ampliamente utilizada por los investigadores sociales más relevantes (ver entre otros Agresi 1996, Calvo 1990, García Ferrando 1985, Hildebrand y otros 1977, Tacq 1997, Reynolds 1984, Ruiz Maya 1990, etc.), de modo que cuando se realice la exposición sobre las técnicas de análisis de datos, el tipo de escala será uno de los criterios fundamentales para la selección entre una técnica u otra. No obstante, y respecto a la polémica planteada en el párrafo anterior, aconsejamos a los lectores interesados la lectura de los trabajos de MacRae (1988), Maxwell (1985) y Wren (1989), entre otros. Técnicas de análisis de datos para investigadores sociales. Aplicaciones con SPSS - Capítulo 2-Vidal Díaz de Rada CUADRO 2.2. ESCALAS DE MEDICIÓN ESCALA PROPIEDADES DEFINICIÓN RESTRICCIONES EJEMPLOS PROCEDIMIENTOS ESTADÍSTICOS TIPO DISTRIBUCIÓN MEDIDAS16 DISPERSIÓN Chi Cuadrado Nominal Ordinal Interval Razón 16 Equivalencia Equivalencia Mayor que Menor que Equivalencia Mayor que Menor que Conocimiento del ratio entre dos intervalos. Equivalencia Mayor que Menor que Conocmiento del ratio entre dos valores de la escala. Asignar número a No asignar a dos observaciones elementos el mismo para número. ordenar/clasificar Estado civil Voto político Sexo Asinar número a observaciones respetando su secuencia numérica Nivel de estudios Nivel Socioeconómico Escalafón Adm Pública Asignar números a las observaciones reflejando una unidad constante entre las unidades de medida. No asignar a dos elementos el mismo número. Números ordenados según orden serial. Idem anterior, además de la igualdad de las medidas entre los intervalos. Asignar núimeros a las observaciones Idem anterior, más reflejando el seginficado del cantidad de valor cero. referencia al valor cero. Temperatura Escalas de Opinión/Actitud Números íindices Fechas IQ o CI GRÁFICOS χ2 Coef. Q de Yule Coef. Phi ϕ No paramétricos No paramétricos Moda Frecuencia Moda y Mediana Frecuencia Coef. de Contingencia C Coef. V de Cramer Coef. Lambda λ Tau y τ de Goodman y Kruskal Rango y Desviación inter- cuartílica. Porcentajes. Frecuencias. Barras Sectores y Coef. Tau a y Tau b de Kendall Coef. Gamma γ Coef. d de Sommers por Coef. Rho ρ Barras Sectores Gráfico de líneas Ragos de Spearman No paramétricos y paramétricos (*) Moda, Mediana, Media y Media Truncada Rango y Desviación inter- cuartílica, y Desviación típica Coef de Correlación r12 de Pearson Coef. de Correlación Parcial r12.3 Coef. de Correlación Múltiple R1.23 Coef. Biserial rb Coef. Punto Biserial rpb Coef. Tetracorico rt Coef. Curvilineal Etha Histograma Polígono de f Gráfico semilogarítmico η Altura Peso Edad Ingresos Nº de hijos Cantidad de libros No paramétricos y paramétricos (*) Moda, Mediana, Media, Media Truncada, Media Geométrica y Media Armónica. Rango, Desviación intercuartílica, Desviación Típica y Coeficiente de Variación. Se completo la tabla original con la casi totalidad de las pruebas y coeficientes pertinentes a cada nivel de medición. RJR. Idem. Histograma Polígono de f Gráfico semilogarítmico -14-