martes, 17 de mayo de 2016

TEORÍA DE MUESTREO

Teoría Elemental de Muestreo.
La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística. Por ejemplo permite estimar cantidades desconocidas de la población (tales como la media población, la varianza, etc.), frecuentemente llamada parámetros poblacionales o brevemente parámetros, a partir del conocimiento, de las correspondientes cantidades muestrales (tales como la media muestral, la varianza , etc.), a ,menudo llamadas estadísticos muestrales o brevemente estadísticos.
La teoría de muestreo es también útil para determinar si la diferencias que se puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son solamente significativas. Tales preguntas surgen por ejemplo, al ensayar un nuevo suero para el tratamiento de una enfermedad, o al decir si un proceso de producción es mejor que otro. Estas decisiones envuelven a los llamados ensayos e hipótesis de significación, que son de gran importancia en la teoría de la decisión.

Ventajas de la utilización de las muestras 
1) El costo es menor y se puede obtener un mejor rendimiento del dinero invertido.
 2) Se obtiene una disminución notable del tiempo necesario para alcanzar la información Cuando una muestra posee 30 o más datos se denomina grandes muestras y si la muestra tiene menos de 30 observaciones se denomina pequeñas muestras. Al procedimiento utilizado para elegir una muestra se denomina Muestreo. 

Tipos de muestreo 
Muestreo de juicio o no probabilístico. (opinático). Se basa en el conocimiento de la población por parte de alguien, quien hace a la muestra representativa, dependiendo de su intención, por lo tanto es subjetiva. 
Probabilístico(Errático): Todos los elementos de la población tienen la posibilidad de pertenecer a la muestra. Muestreo Aleatorio: 
1. Muestreo aleatorio simple 
2. Muestreo Sistemático. 
3. Muestreo Estratificado 
4. Muestreo por Conglomerado 
Muestreo de juicio: A través del conocimiento y la opinión personal, basada en la experiencia del investigador, se identifican los elementos de la población que van a formar parte de la muestra. Una muestra seleccionada por muestreo de juicio se basa en el conocimiento de la población por parte de alguien. Por ejemplo, un guardabosques tomará una muestra de juicio si decide con antelación que parte de una gran zona reforestada deberá recorrer para estimar el total de metros de madera que pueden cortarse. En ocasiones el muestreo de juicio sirve de muestra piloto para decidir cómo seleccionar después una muestra aleatoria. 
 Muestreo aleatorio: Cuando se conoce la probabilidad de que un elemento de la población figure o no en la muestra, puede ser: Muestreo Aleatorio Simple (Irrestrictamente Aleatorio): Un muestreo es aleatorio cuando cada elemento de la población tiene la misma probabilidad de ser escogido para formar parte de la muestra. Este tipo de muestreo evita que la muestra sea sesgada evitando por lo tanto que se realice una mala inferencia estadística. Por ejemplo, supóngase que un investigador quiera estimar el módulo de ruptura promedio de un material determinado formado por una población de tamaño N = 500; por ser ensayos destructivos este quiere seleccionar una muestra de tamaño n = 10 que le permita realizar la inferencia, ahora bien el criterio que usó el investigador para seleccionar dicha muestra fue el de tomar 10 materiales que estaban más próximos a él; evidentemente esta muestra no es representativa de la población, se dice que esta sesgada, por lo que la inferencia estadística que se realice será errónea. Por lo tanto, una muestra se dice que esta sesgada cuando los elementos seleccionados tenían mayor probabilidad de pertenecer a la misma. 
 Cómo hacer el muestreo aleatorio 
 forma más fácil de realizarlo es usando números aleatorios, para esto se puede recurrir a una tabla o a un generador de números aleatorios. Actualmente, se recurre a computadora. 
Muestreo Sistemático o Secuencial. Los elementos se seleccionan de la población con un intervalo uniforme en el tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere estudiar una determinada característica de un producto fabricado en serie y se decide seleccionar a cada veinte producto hasta formar la muestra, para esto se escoge un punto aleatorio de arranque en los primeros veinte productos y luego se escoge cada vigésimo producto hasta completar la muestra. Una de las ventajas de este muestreo es cuando los elementos presentan un patrón secuencial, tal vez requiera menos tiempo y algunas veces cuesta menos que el método de muestreo aleatorio. 
Muestreo Estratificado. Para aplicar el muestreo estratificado, se divide la población en grupos homogéneos, llamados estratos, los cuales son heterógeneos entre si. Después se recurre a uno de dos métodos posibles: a) Se selecciona al azar en cada estrato un número especificado de elementos correspondientes a la proporción del estrato de la población total b) Se extrae al azar un número igual de elementos de cada estrato y damos un peso a los resultados de acuerdo a la proporción del estrato en la población total El muestreo estratificado es adecuado cuando la población ya está dividida en grupos de diferentes tamaños y queremos reconocer este hecho. La ventaja de las muestras estratificadas, es que cuando se diseñan bien, reflejan más exactamente las características de la población de donde se extrajeron que otras clases de muestreo. 
Muestreo por Conglomerado. En el muestreo por conglomerados, se divide la población en grupos o conglomerados de elementos heterogéneos, pero homogéneos con respecto a los grupos entre si. Un procedimiento bien diseñado, de muestreo por conglomerados, puede producir una muestra más precisa a un costo mucho menor que el de un simple muestreo aleatorio. Se usa el muestreo estratificado cuando cada grupo presenta una pequeña variación en su interior, pero existe una amplia variación entre ellos. Se usa el muestreo por conglomerado en el caso contrario, cuando hay considerable variación dentro de cada grupo pero los grupos son esencialmente semejantes entre sí.


Tamaño de la muestra


es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población. 

Objetivos de la determinación del tamaño adecuado de una muestra

  1. Estimar un parámetro determinado con el nivel de confianza deseado.
  2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mínimo de garantía.
  3. Reducir costes o aumentar la rapidez del estudio.
Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño adecuado de la muestra tendría como objetivo su factibilidad. Así:
  1. Si el número de sujetos es insuficiente habría que modificar los criterios de selección, solicitar la colaboración de otros centros o ampliar el período de reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe tal diferencia.
  2. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista económico y humano. Además es poco ético al someter a más individuos a una intervención que puede ser menos eficaz o incluso perjudicial.
El tamaño de una muestra es el número de individuos que contiene.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente:

n=\frac{{Z}^{2}_{\alpha}Npq}{e^2(N-1)+{Z}^{2}_{\alpha}pq}

N: es el tamaño de la población o universo (número total de posibles encuestados).
Zα: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de Zα se obtienen de la tabla de la distribución normal estándar N(0,1).
Los valores de Zα más utilizados y sus niveles de confianza son:

Valor de Zα1,151,281,441,651,962,242,58
Nivel de confianza75%80%85%90%95%97,5%99%

(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la fórmula Zα=1.96)
e: es el error muestral deseado, en tanto por ciento. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplos:
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarán.
Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estará en el intervalo 52-58% (55% +/- 3%).
p: proporción de individuos que poseen en la población la característica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción más segura.
q: proporción de individuos que no poseen esa característica, es decir, es 1-p.
n: tamaño de la muestra (número de encuestas que vamos a hacer).
Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos.
Otra fórmula para calcular el tamaño de la muestra es:

n={{N\sigma^{2}Z^{2}_{\alpha}} \over {e^2(N-1)+\sigma^{2}Z^{2}_{\alpha}}}

Donde: n = el tamaño de la muestra.
N = tamaño de la población.
\sigma= Desviación estándar de la población, que generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5.
Zα: Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.



No hay comentarios:

Publicar un comentario