I. Objetivo

Contar con información de una amplia gama de indicadores sociales es sumamente valioso en el campo de la política pública y de la investigación.

Es de interés de varios usuarios acceder a información con diferentes desagregaciones como: nivel territorial y poblacional, considerando desagregaciones por sexo, etnia, grupos etarios, entre otros. Sin embargo, en el caso de los indicadores provenientes de encuestas de hogares es importante conocer los criterios de validez estadística para el caso de estimaciones con desagregaciones más pequeñas que los dominios de la encuesta. Los mismos que proporcionan a los usuarios la calidad de información de los indicadores sociales que se presentan en este sistema.

En función de ello, el objetivo de este documento es presentar los criterios a considerar para realizar el análisis de validez estadística de las estimaciones de indicadores sociales con base en encuestas de hogares.

II. Definiciones previas

Para poder interpretar la pantalla Estadísticos es importante conocer las siguientes nociones:

Población. Es una colección completa de individuos, personas o cosas de las cuales se desea recolectar datos.

Muestra. Es un grupo de unidades seleccionadas aleatoriamente de la población de acuerdo con un plan o diseño, con el objetivo de obtener conclusiones sobre la población de la cual proviene.

Factor de expansión. Es la capacidad que tienen cada individuo seleccionado en una muestra probabilística para representar a la población. Es el inverso de la probabilidad de selección de un individuo. El factor de expansión teórico viene de la muestra maestra de la encuesta. El factor de expansión corregido se ajusta por falta de cobertura y las proyecciones poblacionales.

Indicador. Es una medida única de algún atributo de una muestra que sirve como estimador de un atributo poblacional.

Numerador. Es el número de casos elegidos o que tienen las características de interés, constituye una parte de la totalidad de casos o denominador. En la pantalla Estadísticos del SICES, el numerador hace referencia al numerador poblacional, es decir, el número de casos elegidos a partir de la muestra expandida.

Numerador muestral. Es el número de casos elegidos o que tienen las características de interés con base en el número de observaciones muestrales sin expandir.

Denominador. Es el número total de casos, para el que se divide el numerador. En la pantalla Estadísticos del SICES, el denominador hace referencia al denominador poblacional, es decir, el número de casos de la muestra expandida.

Desviación estándar. La desviación estándar, notada como , de un conjunto de mediciones , es la raíz cuadrada de la suma de los cuadrados de las desviaciones de las mediciones, respecto al promedio , dividida entre ; es decir:



Error estándar. Es la desviación estándar de la distribución muestral de un estadístico.

Intervalo de confianza. Es un rango de valores, calculado a partir de los datos muestrales, el cual probablemente incluye el valor de un parámetro desconocido. Un intervalo de confianza está compuesto del límite superior y del límite inferior.

III. Criterios de validez estadística

El análisis de factibilidad de las estimaciones de los indicadores del SICES se basa en el cumplimiento de los siguientes criterios simultáneamente:

Serie del indicador. Se debe analizar el comportamiento del indicador y su varianza en los periodos válidos, observando que no tenga una evolución errática.

Número de observaciones muestrales. De acuerdo a la literatura, y a los criterios establecidos en el SICES, se considera que un indicador cumple con un número adecuado de observaciones muestrales, si su numerador contiene por lo menos 200 casos. De esta forma, los intervalos de confianza serán más estrechos mejorando la precisión del indicador estimado.

Margen de Error (Coeficiente de Variación). El margen de error está asociado con el diseño de la muestra de la fuente de datos y, para el caso de las Encuestas de Condiciones de Vida - ECV, estas contemplan los siguientes aspectos: 


Se calcula el coeficiente de variación, para lo cual se debe estimar la varianza del indicador, que para el caso de proporciones está dado por el siguiente esquema:
1. El indicador se calcula por cada dominio de la encuesta, así como el tamaño de muestra y el número de casos expandidos

Dominio Indicador P Muestra Universo
1 P1 n1 N1
2 P2 n2 N2
3 P3 n3 N3
4 P4 n4 N4
5 P5 n5 N5
6 P6 n6 N6


2. Se calcula la varianza del indicador por cada dominio, dado por la siguiente expresión que surge del muestreo por conglomerados:



3. Se calcula la varianza combinada para el indicador en toda la población, dado por un diseño de muestreo estratificado:



Finalmente, se define el coeficiente de variación, para el indicador por la siguiente expresión:



Este coeficiente nos indica la variación del indicador, teniendo que, por recomendaciones y experiencias de expertos, se tiene un indicador confiable y representativo de la población respectiva, si éste es menor al 15%. Para efectos de los indicadores calculados en el SICES, un coeficiente de variación menor a 10% significa que el valor del indicador estimado es de “buena calidad” en el sentido de que tiene una baja dispersión, por lo que su intervalo de confianza no será muy grande. Un CV entre el 10% y el 15%, señala que el indicador estimado es “aceptable”, mientras que valores superiores a 15% señalan que el indicador estimado es “no aceptable”.

Adicionalmente, se calcula un intervalo de confianza al 95%, para el indicador dado por:



Este intervalo nos indica el rango de valores, dentro del cual se ubica el valor exacto del indicador. Cabe señalar que el investigador interesado en un análisis más exhaustivo en la confiabilidad de los indicadores, puede calcular el  “efecto de diseño”, como la razón entre la varianza del diseño muestral,  y la varianza del indicador calculada por un diseño aleatorio simple.  Estas varianzas pueden ser deducidas a partir de la información proporcionada.

Diseño de la muestra.

Se debe considerar cuáles son las variables que se utilizan para diseñar cada encuesta, la cobertura que pretende alcanzar y principalmente los objetivos para la que está dirigida.

Bibliografía


© 2017 Sistema integrado de Conocimiento y Estadística Social del Ecuador –SiCES-