3. ANALISIS ESTADÍSTICO
Como todo en investigación, para que el análisis sea correcto se precisa que sea sistemático y ordenado. La secuencia de actividades que deber íamos adoptar para analizar correctamente un estudio se concreta en los siguientes aspectos:
1. ¿Cómo se distribuye cada variable?
2. Generar nuevas variables a partir de las originales
3. Describir los principales aspectos de la muestra
4. Estudiar la relación existente entre variables
5. Valorar la necesidad de otro tipo de análisis
Vamos a repasar brevemente cada una de estas actividades y las pruebas estadísticas que son de aplicación en cada una de ellas, aunque, como ya se dijo, no se pretende hacer una monografía sobre estadística sino repasar algunos aspectos de dichas pruebas, sus condiciones de aplicación y sus resultados.
1. ¿Cómo se distribuye cada variable?
En este primer momento nos interesa conocer qué valores toma cada una de las variables (edad, sexo, opinión) que hemos medido. Recordar que dichas variables podían clasificarse como cualitativas (representa una cualidad o atributo) y cuantitativas, que son las variables que se expresan numéricamente. En este último caso se suele hacer la distinción entre variables cuantitativas discretas (sólo admiten números enteros) y variables cuantitativas continuas (admiten valores decimales).
Los objetivos de este análisis son varios: en primer lugar poder detectar esos datos que pueden ser incorrectos y que precisan de corrección; también es importante en este momento que estudiemos si la distribución de datos obtenida sigue alguna distribución matemática previamente definida (las más conocidas la distribución Normal o de Gauss, distribución binomial y la distribución de Poisson); por último, poder reducir el volumen total de información a unos pocos índices que la representen.
Para detectar los posibles errores de información o de transcripción, una vez que hemos leído los datos (Epi Info a Análisis a Read [Nombre del Archivo]), nos es de utilidad la orden Freq seguida de las variables que queremos listar (o de'*' si queremos que sean todas). Esta orden generará una salida de datos de cada una de las variables donde se recogen los valores que toma cada una de las categorías de la variable, el porcentaje sobre el total de casos y el porcentaje acumulado.
Otro de los objetivos de este primer análisis era el de reducir el volumen de datos a unos pocos índices que representen la distribución de datos original. Esta posibilidad viene determinada por dos tipos de medidas:
a) Medidas de centralización: responden a la pregunta de alrededor de qué valor se agrupan los datos. Las más conocidas: «Media», que se obtiene al dividir la suma de todas las observaciones por el número de observaciones; «Moda», que es el dato que más se repite en la distribución; y «Mediana», que es el número que se encuentra en la mitad del número total de observaciones.
b) Medidas de Dispersión: supuesto que los datos se agrupan alrededor de un número, ¿cómo lo hacen: muy concentrados o muy dispersos?
Las dos medidas más conocidas y utilizadas son la «Varianza » (se suman las diferencias al cuadrado de cada una de las observaciones y se dividen por el número de observaciones) y la «Desviación típica», (raíz cuadrada de la varianza).
Estos dos tipos de medidas son de aplicación en el caso de variables cuantitativas (sean discretas o continuas). En el caso de variables cualitativas se calcula la proporción (p) que supone cada una de las categorías referente al total de estudiados. Así, si se estudian 300 individuos y 130 reconocen fumar, sabemos que el 43,33% de la muestra son fumadores.
También podemos calcular el contrario de la proporción (generalmente 'q'): q = 1-p y, por tanto, que el 56,66% de esos 300 individuos son no fumadores.
Es importante tener en cuenta que si hemos codificado las variables cualitativas (en el ejemplo anterior hemos asignado un 1 a la opción fumar y un 2 a no fumar) el programa informático nos puede dar como resultado que la variable «fumar» tiene una media de 1.56, que no es sino un resultado sin sentido. Conviene recordar que codificar no implica nunca transformar la variable.
Para determinar la adecuación de la distribución obtenida con respecto a una distribución teórica (generalmente la Normal), además de la representación gráfica que incorporan la mayor parte de los programas estadísticos, podría hacerse por medio de la comparación entre estos índices que acabamos de ver. Cuando las observaciones se distribuyen de forma completamente homogénea alrededor de su punto medio, media, mediana y moda toman el mismo valor (o muy parecido) y la distribución se puede considerar normal. Quizás la mejor manera de comprobar la adecuación o no de nuestra distribución sea la aplicación del test de Kolmogorov Smirnoff (no disponible en Epi Info).
De que nuestra distribución de datos siga a no una distribución normal va a depender, como veremos más adelante, el modelo de análisis estadístico que podemos realizar, además de facilitarnos el conocimiento de la distribución de datos, pues es sabido que si a la media de la distribución le sumamos y restamos una vez la desviación típica entre estos valores se encontrar ía el 68% de los datos de la distribución, o del 95% si sumamos y restamos 1.96 veces la desviación típica. Podríamos fácilmente determinar el porcentaje de población entre dos valores cualesquiera de la distribución de datos por medio de una transformación matemática conocida como tipificación.
2. Generar nuevas variables a partir de las originales
Es una de las posibilidades más interesantes que nos ofrecen la mayor parte de los programas informáticos, ya que nos van a facilitar en gran medida el trabajo de recogida y/o los cálculos posteriores al posibilitar generar nuevas variables de interés a partir de otras variables. Como es obvio, requiere como requisito imprescindible que previamente hayamos comprobado que no hay errores en las variables originales.
Esta posibilidad nos permite, por ejemplo, que podamos generar la variable «cumplimiento terapéutico» en base a los resultados de la analítica sanguínea, la prescripción reflejada en historia, lo relatado por el paciente y la propia percepción del profesional. Implica también que es preferible anotar la fecha de nacimiento de los sujetos y posteriormente calcular la edad tomando como fecha de referencia la que determine el investigador, independientemente de cuándo se hayan recabado los datos.
|
1. Psiquiatría. Metodología de la investigación (2/4) Esta es la continuación del curso Psiquiatría . Metodología de la investigación... [02/11/10] |
697 | ||||
|
2. Psiquiatría. Metodología de la investigación (1/4) La realización de trabajos de investigación es una tarea compleja y complicada.... [01/11/10] |
319 | ||||
|
3. Psiquiatría. Metodología de la investigación (4/4) Con este curso te traemos la última parte del curso de metodología de la... [03/11/10] |
272 | ||||