jueves, 14 de mayo de 2020

CONTINUACIÓN DE LA UNIDAD IV

 Establecimiento de la precisión 4.4.2. Cálculo del número mínimo de observaciones necesarias
El tamaño de la muestra o cálculo de número de observaciones es un proceso vital en la etapa de cronometraje, dado que de este depende en gran medida el nivel de confianza del estudio de tiempos. Este proceso tiene como objetivo determinar el valor del promedio representativo para cada elemento.
Los métodos más utilizados para determinar el número de observaciones son:
  • Método Estadístico
  • Método Tradicional

Método estadístico

El método estadístico requiere que se efectuen cierto número de observaciones preliminares (n’), para luego poder aplicar la siguiente fórmula:
NIVEL DE CONFIANZA DEL 95,45% Y UN MÁRGEN DE ERROR DE ± 5%
Siendo:
n = Tamaño de la muestra que deseamos calcular (número de observaciones)
n’ = Número de observaciones del estudio preliminar
Σ = Suma de los valores
x = Valor de las observaciones.
40 = Constante para un nivel de confianza de 94,45%
Ejemplo:
Se realizan 5 observaciones preliminares, los valores de los respectivos tiempos transcurridos en centésimas de minuto son: 8, 7, 8, 8, 7. Ahora pasaremos a calcular los cuadrados que nos pide la fórmula:
n’ = 5
Sustituyendo estos valores en la fórmula anterior tendremos el valor de n:
Dado que el número de observaciones preliminares (5) es inferior al requerido (7), debe aumentarse el tamaño de las observaciones preliminares, luego recalcular n. Puede ser que en recálculo se determine que la cantidad de 7 observaciones sean suficientes.
Intervalos de confianza
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional.
Intervalo de confianza = media +- margen de error
Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado. Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto medio en consumo por hogar de esa población? En principio sí. Simplemente tendríamos que hacer una encuesta entre todos los hogares y calcular la media. Sin embargo, seguir ese proceso sería tremendamente laborioso y complicaría bastante el estudio.
Ante situaciones así, se hace más factible seleccionar una muestra estadística. Por ejemplo, 500 personas. Y sobre dicha muestra, calcular la media. Aunque seguiríamos sin saber el verdadero valor poblacional, podríamos suponer que este se va a situar cerca del valor muestral. A esa media le sumamos el margen de error y tenemos un valor del intervalo de confianza. Por otro lado, le restamos a la media ese margen de error y tendremos otro valor. Entre esos dos valores estará la media poblacional.
Muestras definitivas
Confección de muestras físicas de etiquetas tejidas; Antes de la fabricación de las etiquetas, el cliente recibe muestras definitivas, fabricadas con los mismos colores, diseños y materiales que tendrán las etiquetas fabricadas posteriormente según el pedido.
Estadísticas descriptivas
Se denomina estadística descriptiva a las cantidades matemáticos (tales como la media, mediana, desviación estándar) que resumen e interpretan algunas de las propiedades de un conjunto de datos (muestra), pero que no miden las propiedades de la población de la que se extrajo la muestra (ocupándose de este extremo la estadística inferencial).
estadistica descriptiva
Las estadísticas descriptivas son coeficientes descriptivos que permiten mostrar información resumida de un conjunto de datos, que puede ser una representación de toda la población o una muestra de ella. La estadística descriptiva se descompone en las medidas de tendencia central y medidas de variabilidad, o dispersión. Medidas de tendencia central incluyen la media, la mediana y la moda, mientras que las medidas de la variabilidad incluyen la desviación estándar o la varianza, el mínimo y el máximo de la variable, y la curtosis y asimetría.

estadistica descriptiva


Diseño de la Calidad de la Simulación

Lista de estimadores a obtener de la simulación


  • Parámetros, los cuales corresponden a los verdaderos valores de interés en cuanto a los parámetros que ya conocemos antes de realizar la simulación.
  • Parámetros estimativos, son aquellos valores numéricos que estimamos en la simulación, son valores generados por el simulador en una determinada muestra.
  • Vies y no vies, son los valores que se calculan a partir de los parámetros estimativos.



  Instrumentos de medición
El análisis de la literatura existente arroja un resultado de 17 instrumentos de medida de las actitudes y la ansiedad hacia la estadística. Exceptuando dos instrumentos elaborados a partir de escalas bipolares, a la manera del diferencial semántico de Osgood (<biblio>), todas los instrumentos revisados son escalas tipo Likert. En lo que sigue vamos a describir brevemente estos cuestionarios, poniendo un mayor énfasis en aquellos que han sido usados más frecuentemente.
Medios de registro de datos
La elección del método depende de la estrategia de recopilación de datos, el tipo de variable, la precisión necesaria, el punto de recopilación y la formación del encuestador. Los vínculos entre una variable, su origen y los métodos prácticos para su recopilación. Pueden ayudar a escoger métodos apropiados. Los principales métodos de recopilación de datos son:

Registros: los registros y licencias son particularmente valiosos para los censos completos, pero se limitan a variables que cambian lentamente, como el número de embarcaciones pesqueras y sus características.

Cuestionarios: formularios que los encuestados devuelven cumplimentados. Un método poco costoso que resulta útil cuando los índices de alfabetización son altos y los encuestados colaboran.

Entrevistas: formularios que se cumplimentan a lo largo de una entrevista con el encuestado. Más caros que los cuestionarios, pero mejores para preguntas más complejas, y cuando se dan unos índices de alfabetización bajos o se encuentra menos colaboración.

Observaciones directas: la realización de mediciones directas es el método más preciso para todas las variables, como las capturas, pero a menudo resulta caro. Muchos métodos, como los programas de observación, se limitan a la pesca industrial.

Presentación de informes: la principal alternativa a la realización de mediciones directas consiste en pedir a los pescadores y a terceros que presenten informes de sus actividades. La preparación de informes presupone la alfabetización y requiere espíritu de colaboración, pero ello puede reforzarse mediante una obligación legal y mediciones directas. Las técnicas de recogida de la información no son un fin en sí mismo, sino que dependen de: a- El tipo de investigación que se esté haciendo- El tipo de análisis de datos que vamos a utilizar posteriormente- El problema que queramos estudiad- Los objetivos que pretendamos alcanzar con la investigación. Algunas técnicas se pueden utilizar en distintos diseños, por ejemplo la entrevista se puede utilizar en: investigación acción, en estudios de caso, en investigación etnográfica, etc.

  Identificación del estimador determinante (estimador líder) del tamaño de la simulación
El valor inicial de una variable se modifica al avanzar la simulación. El valor de un parámetro será constante pero se puede modificar mientras se evalúan las alternativas en otras simulaciones.

El modelo se desvía por unos valores iniciales que varían hasta que el modelo se estabiliza, para poder manejar este inconveniente se siguen los siguientes planteamientos:

Descartar los datos producidos en las primeras partes de la ejecución.
Seleccionar las condiciones iniciales que disminuyen la duración del período de calentamiento.
Seleccionar las condiciones iniciales que eliminan el sesgo.
ESTIMADORES, MUESTRAS Y CARACTERÍSTICAS DEL ESTIMADOR LIDER

En la estadística tiene un papel destacado la noción de MUESTRA ALEATORIA. Una muestra aleatoria de tamaño n es:

Una colección de n variables aleatorias

Todas con la misma distribución

Todas independientes Esta definición idealiza la operación de repetir n veces la observación de la misma variable aleatoria,siendo las repeticiones independientes una de otra.La colección de donde extraemos la muestra aleatoria, se denomina POBLACIÓN. Nuestra intenciónal tomar una muestra, es la de hacer INFERENCIA. Este término lo usamos en estadística paradenotar al procedimiento con el que hacemos afirmaciones acerca de valores generales de lapoblación mediante los números que observamos en la muestra.
Ejemplo
Suponga que observamos el proceso de fabricación de las ``bolitas'' que se le ponen al envase delos desodorantes ``roll on''. No todas las bolitas van a tener el mismo diámetro, si escogemos, alazar una bolita, tendremos un valor para el diámetro que es una variable aleatoria. Podemossuponer que los diámetros tienen la distribución normal, debido a nuestra experiencia con elproceso, conocemos que la desviación estándar de la población es de 4 mm (aproximadamente).Pero, también por experiencia, sabemos que el diámetro promedio puede variar por desajuste dela maquinaria productora. De modo que tenemos:

Una POBLACIÓN, que son todas las bolitas que se producen

Un PARÁMETRO de la población conocido (o casi) que es la desviación estándar

Otro PARÁMETRO cuyo valor es desconocido: la mediaPara tratar de conocer el valor del parámetro que desconocemos, tomamos una MUESTRA de lasbolitas. Supongamos que son 100 bolitas en la muestra. Con un instrumento de precisión, y conmucho cuidado, medimos los diámetros de las 100 bolitas de la muestra y calculamos su promedio
  







miércoles, 18 de marzo de 2020

Algoritmo congruencial multiplicativo

Algoritmo Congruencial Multiplicativo

Un algoritmo que se utiliza para generar números pseudo aleatorios, es el algoritmo congruencia multiplicativo. Tiene como base al algoritmo congruencia lineal pero conlleva una operación menos.
La operación principal es la siguiente:
X_{i+1} = (aX_{i}) mod (m)
Es decir, se toma una semilla a la que llamaremos X_{0}. Se multiplica por un número a y al resultado de la multiplicación se divide por m recuperando solo el residuo o módulo de la división. Este valor será X1, y así sucesivamente.
Esta operación nos da un valor entero. Si deseamos un número pseudo aleatorio en el intervalo (0,1), debemos realizar la siguiente operación sobre el número anteriormente obtenido.
R_{i} = X_{i} / (m-1)
Es decir, al número que produjo la primera operación, se le divide entre m-1. Nos dará un valor entre 0 y 1.
Para mejorar la eficiencia del algoritmo se deben seguir ciertas condiciones para los valores a, m, X_{0}. (Banks, Carson, Nelson y Nicol, citados por García, García y Cárdenas (2006).

Condiciones

M = 2^g
A = 3+8k o bien a = 5+8k
K = 0,1,2,3,…
X_{0} debe ser impar
G debe ser enterición) de m/4 o de 
2^{g-2}

martes, 10 de marzo de 2020

Algoritmo Lineal

Algoritmo Lineal
El algoritmo congruencial lineal genera una secuencia de números enteros por medio de la siguiente ecuación recursiva:


X1+1 = (aX0 + b) mod(m)


donde X0 es la semilla, a es la constante multiplicativa, b es una constante aditiva y m es el módulo; X0 > 0, a > 0, b > 0 y m > 0 deben ser números enteros. La operación "mod m" significa multiplicar Xi por a, sumar b y dividir el resultado entre m para obtener el residuo Xi+1. Es importante señalar que la ecuación recursiva del algoritmo congruancial lineal genera una secuencia de números S = {0,1,2,3,...,m-1}, y que para obtener números pseudo aleatorios en el intervalo (0,1) se requiere la siguiente ecuación:


ri = Xi/(m-1)

Este algoritmo congruencial fue propuesto por D.H,Lehmer en 1951.Segun Law y Kelton, este algortimo ha sido el mas usado. El algoritmo congruenca lineal genera una secuencia de numeros enteros por medio de la siguiente ecuacion recursiva:


Xi+1=(aXi+C)mod(m)      i=0,1,2,3,...,n.

donde X0 es la semilla, a es la constante muliplicativa c, es una constante aditiva y m es el modulo;Xo>,a>0,c>0, m>0 deben ser numeros enteros.La operacion "mod m"significa multiplicar X, por a, sumar c y dividir el resultado entre m paa obtener el residuo X1+i. .Es importante señalar que la ecuacion recursiva del algoritmo congruencial lineal genera una secuencia de numeros enteros s={1,2,,2,..,m-1), y que para obtner numeros pseudo aleatorios en el intervalo(0,1) se requiere la siguiente ecuacion:


ri=Xi/m-1    i-1,2,3...n


martes, 3 de marzo de 2020

Multiplicador Constante


Algoritmo de multiplicador constante

Algoritmo de multiplicador constante


Este algoritmo no congruencial es similar al algoritmo de productos medios.
Los siguientes son los pasos necesarios para generar números pseudo aleatorios con el algoritmo de multiplicador constante.


1. Selecciona una semilla ( ) X0 con D dígitos (D > 3).


2. Seleccionar una constante (a) con D dígitos (D > 3).


3. Sea Y0 = a * X0 ; sea X1 = los D dígitos del centro y sea r1 = 0.D dígitos del centro.


4. Sea Yi = a * Xi ; sea Xi+1 = los D dígitos del centro y sea ri+1 = 0.D dígitos del centro para toda i = 1, 2, 3,...,n .


5. Repetir el paso 4 hasta obtener los n números ir deseados.


Ejemplo en Excel:

Productos Medios


Algoritmo de productos medios


Este algoritmo es similar al anterior, la diferencia entre los dos es que este algoritmo requiere de dos semillas; ambas con D dígitos; además de elevarlas al cuadrado, las semillas se multiplican y del producto resultante se seleccionan los D dígitos del centro, los cuales formaran el primer número de D dígitos. Después se elimina una semilla y la otra se multiplica por el primer número de D dígitos, para luego seleccionar del producto los D dígitos que conformaran un segundo número ri. Entonces se elimina la segunda semilla, y se multiplica el primer número de los D dígitos por el segundo número de los D dígitos; del producto se obtiene el tercer número de ri. Siempre se ira eliminando el número más antiguo y el procedimiento se repetirá hasta generar los n números pseudo aleatorios.

Pasos para generar números con el algoritmo de producto medios:

1.- Seleccionar una semilla (X0) con D dígitos (D>3).

2.- Seleccionar una semilla (X0) con D dígitos (D>3).

3.- Sea Y0 = X0 * X1; sea X2 = los D dígitos del centro, y sea ri = 0. D dígitos del centro.

4.- Sea Yi = X1 * Xi+1; sea Xi+2 = los D dígitos del centro, y sea ri+1 = 0. D dígitos del centro para toda i= 1, 2, 3,…, n.

5.- Repetir el paso 4 hasta obtener los n números ri deseados.

Ejemplo en Excel:

martes, 25 de febrero de 2020

Cuadrado Medios

https://app.box.com/s/n3xb472hltg4b2crpkvoxnn9qkns1gif
¿Que son los cuadrados medios?
Los cuadrados medios representan una estimación de la varianza de la población. Se calculan dividiendo la suma correspondiente de los cuadrados entre los grados de libertad.

Regresión

En regresión, los cuadrados medios se utilizan para determinar si los términos de un modelo son significativos.
  • El cuadrado medio del término se obtiene dividiendo la suma de los cuadrados del término entre los grados de libertad.
  • El cuadrado medio del error (MSE) se obtiene dividiendo la suma de los cuadrados del error residual entre los grados de libertad. El MSE es la varianza (s2) en torno a la línea de regresión ajustada.
Al dividir el MS (término) entre el MSE, se obtiene F, que sigue la distribución F con grados de libertad para el término y grados de libertad para el error.

ANOVA

En ANOVA, los cuadrados medios se utilizan para determinar si los factores (tratamientos) son significativos.
  • El cuadrado medio del tratamiento se obtiene dividiendo la suma de los cuadrados del tratamiento entre los grados de libertad. El cuadrado medio del tratamiento representa la variación entre las medias de las muestras.
  • El cuadrado medio del error (MSE) se obtiene dividiendo la suma de los cuadrados del error residual entre los grados de libertad. El MSE representa la variación dentro de las muestras.
Por ejemplo, usted hace un experimento para probar la efectividad de tres detergentes para ropa. Recolecta 20 observaciones para cada detergente. La variación entre las medias de Detergente 1, Detergente 2 y Detergente 3 es representada por el cuadrado medio del tratamiento. La variación dentro de las muestras es representada por el cuadrado medio del error.

¿Qué son los cuadrados medios ajustados?

Los cuadrados medios ajustados se calculan dividiendo la suma ajustada de los cuadrados entre los grados de libertad. La suma ajustada de los cuadrados no depende del orden en que los factores se ingresan en el modelo. Es la porción única de SC Regresión explicada por un factor, si todos los demás factores están en el modelo, independientemente del orden en que se ingresaron en el mismo.
Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la suma ajustada de los cuadrados para X2 muestra qué tanto de la variación restante es explicada por X2, si X1 y X3 también se encuentran en el modelo.

¿Qué son los cuadrados medios esperados?

Si usted no especifica que los factores son aleatorios, Minitab presupondrá que se trata de factores fijos. En este caso, el denominador para los estadísticos F será el MSE. Sin embargo, para los modelos que incluyen términos aleatorios, el MSE no siempre es el término de error correcto. Puede examinar los cuadrados medios esperados para determinar el término de error que se utilizó en la prueba F.
Cuando usted ejecuta Modelo lineal general, Minitab muestra una tabla de cuadrados medios esperados, componentes estimados de la varianza y el término de error (los cuadrados medios del denominador) utilizados en cada prueba F de forma predeterminada. Los cuadrados medios esperados son los valores esperados de estos términos con el modelo especificado. Si no hay una prueba F exacta para un término, Minitab calcula el término de error apropiado para construir una prueba F aproximada. Esta prueba se denomina prueba sintetizada.
Las estimaciones de los componentes de la varianza son las estimaciones sin sesgo del ANOVA. Se obtienen al establecer cada cuadrado medio calculado en su cuadrado medio esperado, lo cual proporciona un sistema de ecuaciones lineales en los componentes desconocidos de la varianza, que luego se resuelve. Desafortunadamente, este método puede generar estimaciones negativas, que deben establecerse en cero. Sin embargo, Minitab muestra las estimaciones negativas porque algunas veces indican que el modelo que se está ajustando no es apropiado para los datos. Los componentes de la varianza no se calculan para los términos fijos.

Es una técnica numérica para conducir experimentos con relaciones matemáticas y lógicas, las cuales son necesarias para describir el comportamiento y la estructura de sistemas complejos del mundo real a través de largos periodos de tiempo.
El método consiste en tomar un número al azar, X° de 2n cifras que al ser elevado al cuadrado resulta un número de hasta 4n cifras, de no ser así se deben agregar ceros a la izquierda de dicho resultado para que éste tenga exactamente 4n cifras.
Se denomina X1 al número resultante de seleccionar las 2n cifras centrales del resultado anterior.

Aplicación del Método

Se genera el número pseudoaleatorio U1 ubicando un punto decimal delante de las 2n cifras de X1 y así sucesivamente para los demás números psudoaleatorios.

Algoritmo de cuadrados medios

  1. Se elige como valor semilla un número de más de 3 dígitos (t=cantidad de dígitos del valor semilla)
  2. Se eleva ese número al cuadrado.
  3. Al valor que resultó, seleccione los t dígitos de en medio (si se requiere, utilice un 0 como primer dígito).
  4. Repetir desde el paso número 2 tomando éste nuevo número.
Ejemplo en Excel
https://app.box.com/s/n3xb472hltg4b2crpkvoxnn9qkns1gif