martes, 13 de octubre de 2015

Estadistica Descriptiva




INTRODUCCIÓN

Cuando hablamos de la estadística nos referimos a datos numéricos. Se sobrentiende que dichos datos han de estar presentados de manera ordenada y sistemática. Por tanto, el objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos de masa.

Su importancia está relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y analizar datos, así como de sacar conclusiones válidas y tomar decisiones con base en este análisis, así también realizar predicciones a cerca del conjunto del cual se han seleccionado dichos datos.


ÍNDICE
Itroducción 
Objetivo del portafolio
Asignación I
Asignación II
Asignación III
Mini-Proyecto I
Temas y asignaciones del segundo corte.
Conclusión.

OBJETIVO DEL PORTAFOLIO

Su objetivo es recopilar o ilustrar cualquier tipo de investigación realizado por cualquier estudiante y así compartir la información o tener un enlace directo con el profesor y de esta forma comentar su evolución respecto al tema, es decir es un instrumento de enseñanza, aprendizaje y evaluación que a su vez sirve como agente motivador.
;objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos de masa.

Su importancia está relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y analizar datos, así como de sacar conclusiones válidas y tomar decisiones con base en este análisis, así también realizar predicciones a cerca del conjunto del cual se han seleccionado dichos datos.


En la ciencia estadística hay diferentes aspectos importantes, entre ellos la conceptualización de la estadística que consiste en la recopilación de datos o información para la obtención de resultados inclinados a lo que posiblemente según estudios podría ser bien sea de un grupo de individuos en una determinada población, en la economía, en la política, en empresas y organizaciones y o estudios biológicos. También fue observada su historia rica en cultura basada en el siglo XVI, mucho tiempo antes sin saberlo los individuos en la prehistoria ya utilizaban la estadística al momento de contar sus recursos disponibles, números de hombre y números de arma para la caza.
Las civilizaciones de Sumaria, Egipto y China que realizaron recuentos de censos de carácter fiscal y militar, en la edad media el rey de Grecia para esta fecha se decidió realizar un censo de propiedades para su reino. Para el renacimiento los censos ya eran un poco mas complejos y en el reinado de Enrique VII se empiezan a registrar las defunciones mientras que en Francia de manera obligatoria se debían registrar los nacimientos, bautizos y matrimonios.
Para el siglo XVI se comenzaron a recontar asuntos de estado para la evolución del proceso científico llamado Estadística.
Para el siglo XIX se comenzó a estudiar la estadística para las ciencias sociales para la reducción de incertidumbres en la toma de decisiones por medio de métodos para el mejoramiento de aquellas organizaciones que tienen un objetivo trazado por cumplir.
Seguido a todo esto encontramos que la estadística se calcifica en tres partes, la estadística descriptiva, la estadística matemática y la inferencia estadística cada una de ellas siendo vitales para la vida actual en diferentes áreas. La estadística descriptiva es la que utiliza sus métodos en representaciones graficas, mientras que la estadística matematiza estudia las variables de modelos probalisticos, la misma es una combinación de la estadística y el calculo de la probabilidad, por otro lado la Inferencia estadística desarrollo un conjunto de métodos y técnicas dirigidas a la estimación de hipótesis con la obtención de muestras con el fin extender los resultados que se obtenga para la población en general.
Esta ciencia su puede medir por medio técnicas tales como el calculo de media, desviación típico y muchos mas cálculos.
La estadística fue es y será una gran ciencia para nuestros estudios y desarrollo en cualquier ámbito pues sin ella podríamos tener un vivir lleno de incertidumbres casi imposibles de resolver.

Es interesante saber que hay muchas maneras de aprender y conocer sobre la estadística, los videos son fundamentales con respecto a este tema, pues es un método visual ideal para el conocimiento de la ciencia estadística, aportando así ayuda cultural y necesaria para el que hacer diario.


La estadística se ocupa en recoger, organizar, resumir y analizar datos, así como también para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
Estadística descriptiva.
Ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay varias formas simples e interesantes de organizar los datos en gráficos que permiten detectar tanto las características sobresalientes como las características inesperadas.
Ejemplo: Un economista registra el crecimiento de la población en un área determinada.
Estadística inferencial.
Hace referencia a un conjunto de métodos que permiten hacer predicciones acerca de características de un fenómeno sobre la base de información parcial acerca del mismo.
Ejemplo: Se desea establecer el promedio de bateo de un equipo determinado.
Conceptos básicos que integran la estadística.
·         Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.


 •         Muestra: Es un conjunto de mediciones u observaciones tomadas a partir de una población.



 ·         Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.





 ·         Datos: Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar.



·         Escala de razones: Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real en su origen, se llama escala de razón.

·         Variables: Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. 

·         Variable constante: Característica que presenta una sola modalidad.

·         Variables continúas: Una variable continua es aquella que puede tomar valores comprendidos entre dos números.

·         Variables cuantitativas: Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas. 

·         Variables discretas: es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos.

·         Variables cualitativas: refieren a características o cualidades que no pueden ser medidas con números.


·         Parámetros: Un índice estadístico calculado a base de los datos de una población y que cuantifica una característica de esa población.

·         Estadígrafo:    Un estadígrafo o Estadístico es una función matemática que utiliza datos de muestra para llegar a un resultado que debe ser un número real.

                                                              Representaciones Gráficas

Los datos estadísticos son representados en tablas estadísticas, donde es observada toda la información de modo esquemático están preparadas para  cálculos posteriores. Los gráficos estadísticos nos transmiten esa información de modo más expresivo, nos van a permitir, con un sólo movimiento visual, entender de que información se nos esta hablando, observar sus características más importantes, incluso sacar alguna conclusión sobre el comportamiento de la muestra donde se esta realizando el estudio.
Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia, es por ello que a continuación se detallaran las siguiente graficas:




-       Diagramas de barras.

Es un gráfico que se utiliza para representar datos de variables cualitativas o discretas. Está formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de la variable.




-       Histogramas.
Es una representación gráfica estadísticas. El histograma es útil para la observación visual, ordenada y  comprensión de todos los datos numéricos estadísticos que pueden ser difíciles de comprender, también es de especial utilidad y eficacia para las ciencias sociales, ya que, permiten comparar datos sociales como los resultados de un censo, la cantidad de mujeres y/o hombres en una comunidad, el nivel de analfabetismo o mortandad infantil, entre otros.
Hay muchos tipos de histogramas y cada uno se ajusta a diferentes necesidades como también a diferentes tipos de información.

·         Histogramas de barras simples son los más comunes y utilizados.
·         Histogramas de barras compuestas que permiten introducir información sobre dos variables.
Histogramas de barras agrupadas según información y por último el polígono de frecuencias y la ojiva porcentual, ambos sistemas utilizados por expertos.


-        Polígonos de frecuencias.

Es aquella gráfica  donde se forman  a partir de la unión los distintos puntos medios de las cimas de las columnas que configuran lo que es un histograma de frecuencia.






-       Gráfico de sectores.

Es un gráfico el cual se puede utilizar para todo tipo de variables, en forma global, haciendo una comparación inmediata de la frecuencia de cada una de sus categorías, facilitando el reconocimiento de cada una de ellas al total de la variable.




-       Pictogramas.

Los pictogramas utilizan símbolos para representar un conjunto de datos. La mayor frecuencia se identifica por la mayor acumulación de símbolos. Los pictogramas se emplean sobre ver de manera más entendible los informes estadísticos.


-       Pictogramas.

Los pictogramas utilizan símbolos para representar un conjunto de datos. La mayor frecuencia se identifica por la mayor acumulación de símbolos. Los pictogramas se emplean sobre ver de manera más entendible los informes estadísticos.




-       Cartogramas.

Es un diagrama que muestra datos cuantitativos asociados a áreas, mediante la modificación de los tamaños de las unidades de enumeración que comprenden un mapa geográfico, en pocas palabras son expresiones gráficas a modo de mapa.



-       Pirámides de población.
Establece las clasificaciones de grupos de población por sexo y edad
Existen tres tipos de pirámides de población que son:
·         Pirámide con forma de pagoda o progresiva.
·         Pirámide con forma de campana o estable.
·         Pirámide con forma de bulbo o regresiva.



  
Tablas De Estadística
-       Distribución de frecuencias
La distribución de frecuencias o tabla de frecuencias es u orden en forma de tabla de los datos estadísticos, para la asignación de cada dato su frecuencia correspondiente.


-       Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si lasvariables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.


-       Tabla bidimensional simple.
Está formada por tres filas o columnas en las que se representan ordenadamente los valores de las variables y sus frecuencias. Está indicada para casos con pocos datos y pocos valores o ninguno repetidos.





-       Tabla de doble entrada.
Está formada por tantas filas y columnas como valores tengamos de cada una de las variables, más una fila y una columna más para indicar los totales. Está probada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la otra.


Estructura y elementos de un gráfico estadístico

Todo gráfico estadístico debe tener un código o número, título y cuerpo. Así, los elementos de un gráfico estadístico son:

Código o número de gráfico
Título
Cuerpo
Figura
Escala o eje de valores
Leyenda
Eje de conceptos
Pie
Nota
Llamada
Fuente
Errores comunes al momento de elaborar una gráfica.

Al realizar un gráfico se pueden cometer dos tipos de errores: errores de forma y errores de contenido.

De forma:
· No uso de la identificación.
· Aparecen el título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.
· Gráficos muy cargados y/o sumamente complejos de interpretar.
· Desproporción notable entre las longitudes de los ejes.
· Omisión de los rótulos de los ejes y/o las unidades de medida.
De contenido:
· Uso de gráficos inadecuados dada la naturaleza de lo que se representa.
· Omisión de la leyenda donde de ellas colocan claves o símbolos.
· No respetar alguna de las reglas establecidas para la construcción del gráfico en particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.


Ejemplos de Entidades económicas que utilicen la estadística como herramienta fundamental tomando en cuento si las mismas siguen los pasos correctos para la creacón de los gráficos.


BCV (Banco Central de Venezuela)






La representación gráfica del BCV es una Grafica Ojiva o de Líneas. Esta representación grafica es de suma importancia para el país en materia económica, pues en ella se refleja el crecimiento del PIB (Producto Interno Bruto) el cual se refiere a la producción del país. En dicha gráfica se visualiza la siguiente información:

-          PIB. La producción venezolana creció 0,7% durante el primer trimestre, lo que demuestra una desaceleración con respecto al mismo periodo del año pasado (4,8%) y al último trimestre de 2012 (5,5%).”

La grafica del BCV no cumple con los lineamientos de cómo se debe realizar una grafica, la misma no posee su propio código de grafico, titulo, y leyenda.

FMI (Fondo Monetario Internacional)




La representación grafica del FMI es una Gráfica de Barras y consiste al igual que la del BCV en el PIB pero de manera contrario. En esta se representa el PIB de forma negativa para nuestro país, como se puede observar en la imagen.
En dicha gráfica se visualiza la siguiente información:
-          “El Fondo Monetario Internacional (FMI) estima que la economía venezolana tendrá dos años de caída económica, según indica su informe Perspectivas Económicas Mundiales (WEO, en inglés)”.

La grafica del FMI no cumple con los lineamientos de cómo se debe realizar una grafica, la misma no posee su propio código de grafico, titulo, leyenda, eje de conceptos y pie.



CEPAL (Comisión Económica Para América Latina)




Es una grafica circular y de barras, las mismas podrían ser combinadas de acuerdo a la información.
La representación grafica de CEPAL consiste en las exportaciones de bienes de toda América latina según sus series.
Cumple con todos los parámetros para realizar la grafica. 


Tablas De Distribución De Frecuencias

Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas se pueden representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para datos agrupados. Estas últimas se utiliza cuando se tienen muchos datos.

Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente :


Cuando hay muchos datos se agrupan en clases.
Clase es cada uno de los grupos en que se dividen los datos.

Para determinar cuántas clases crear, se puede utilizar la siguiente fórmula:
(fórmula de Sturges)
Número de clases = 1 + 3,322 log n  donde n es el número total de datos.
Si al aplicar la fórmula se obtiene un número decimal, se aproxima al siguiente entero.


El intervalo de clase o el ancho de la clase (tamaño de la clase) es  el espacio que hay entre el límite superior y el límite inferior de la clase, los cuales corresponden a los valores extremos de la clase.
 Para obtener el ancho de clase se utiliza la siguiente fórmula:

Ancho de clase = (dato superior – dato inferior)/ número de clases

La marca de clase es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de los valores extremos de cada clase.

El rango es la diferencia entre el valor mayor y el valor menor en estudio de una distribución de datos.

Ejemplos de una tabla de frecuencias.


A continuación se plantean algunos ejercicios prácticos para ser resueltos..

1.-) Los siguientes datos corresponden al número de bibliotecarios en las bibliotecas públicas de las diferentes provincias españolas:

4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4 3 2 4 4 1 10 2 5 3 2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7 12

(a)                 Ordena los datos de Menor a Mayor,
(b)                 Construya una Tabla de Distribución de Frecuencia
(c)                 Obtener todas las distribuciones estudiadas en  clases
(d)                 ¿Qué proporción de provincias tiene más de 7 bibliotecarios?
(e)                 ¿Que tipo de Datos son? Explique.
Respuesta (a)
1-1-1-2-2-2-2-2-2-2-3-3-3-3-3-3-3-3-3-4-4-4-4-4-4-4-4-4-4-5-5-5-5-5-5-5-6-6-6-6-7-7-7-7-8-8-10-12-12-15-16
Dato menor: 1
Dato mayor: 16
Total de la muestra: 50

Tabla de datos no ordenados
Frecuencia
Absoluta
fi
Frecuencia
Absoluta
Acumulada
Fi
Frecuencia
Relativa
hi
Frecuencia
Relativa
Acumulada
Hi
3
3
0,06%
0,06




7
10
0,14%
0,2
9
19
0,18%
0,38
10
29
0,2%
0,58
6
35
0,12%
0,7
4
39
0,08%
0,78
4
43
0,08%
0,86
2
45
0,04%
0,9
1
46
0,02%
0,92
2
48
0,04%
0,96
1
49
0,02%
0,98
1
50
0,02%
1
















Distribución de bibliotecarios por provincias
Dato menor: 1
Dato mayor: 16
Total de la muestra: n= 50Rango o recorrido:   
R=Valor máximo (16) – Valor mínimo (1
R= 16-1= 15
R= 15
Numero de intervalo (K):
K= 1+3, 3. LOG (n)
K= 1 + 3, 3 * LOG (50) = 6.60
C=15/6= 2,5 aproximación = 3   C=3





TABLA DE DATOS ORDENADOS
I
Xi
Fi
Fi
Hi
Hi
(%) Simple
(%) Acumulado
(1;4[
2,5
19
19
0,38
0,38
38%
38%
(4;7[
5,5
20
39
0,4
0,78
40%
78%
(7;10[
8,5
6
45
0,12
0,9
12%
90%
(10;13[
11,5
3
48
0,06
0,96
6%
96%
(13;16[
14,5
1
49
0,02
0,98
2%
98%
(16;19[
17,5
1
50
0,02
1
2%
100%
40
1
100
Columna 1 (I):
Intervalo se toma el valor mínimo y se le suma la amplitud y así sucesivamente
Fila #1:(1+3=4[
Fila #:2(4+3=7[
Fila #3:(7+3=10[
Fila #4:(10+3=13[
Fila# 5:(13+3=16[
Fila #6:(16+3=19[




Columna 2(xi):
Marca o punto medio (X1) se determina con la siguiente formula
Límite inferior + límite superior
2
1 + 4= 5/2= 2,5
4+ 7=11/2= 5,5
7+10 = 17/2=8,5
10 + 13= 23/2=11,5
13+ 16= 29/2=14,5
16 + 19= 35/2=17,5
Columna 3 (fi):
Frecuencia absoluta simple (fi): Cantidad de datos que hay en cada intervalo en los datos ordenados que la suma debe el total de los datos
Columna 4 (Fi):
Frecuencia absoluta acumulada (Fi): la primera es igual al resultado de la primeraColumna 4 (Fi):
Frecuencia absoluta acumulada (Fi): la primera es igual al resultado de la primera frecuencia absoluta simple y sucesivamente se va acumulando
Columna 5 (hi):
Frecuencia relativa simple (hi): se determina dividiendo la frecuencia absoluta simple entre
Fila #1: 19/50=0,38
Fila #2: 20/50=0,4
Fila #3: 6/50=0,12
Fila #4: 3/50=0,06
Fila #5: 1/50=0,02
Fila #6: 1/50=0,02








Columna 6 (hi):
Frecuencia relativa acumulada: va acumulando las frecuencias relativas simples

Columna 7 (% simple):
Porcentaje simple: Se le saca multiplicando 100 a la  frecuencia relativa simple.


0,38*100=38%
0,4*100= 40%
0,12*100=12%
0,06*100=6%
0,02*100=2%
0,02*100=2%







Columna 8 (% acumulado):
Porcentaje Acumulado: va acumulando el porcentaje simple

d.- ¿Qué proporción de provincias tiene más de 7 bibliotecarios?
La proporción es una razón en la cual los elementos están incluidos en el denominador, se utiliza como estimación de la probabilidad. En el rango es de 0 a 1  o de 0 a100%
La fórmula que se utiliza es la siguiente: p= x/n donde x es el  de existos  u  observaciones de interés y n es el tamaño de la muestra. La distribución muestra de proporciones es la adecuada para dar respuesta a  este tipo de situaciones
p= x/n
x= 7
n= 50     p= 7 / 50= 0,14
La proporción es 0,14

e.-¿Qué tipo de Datos son? Explique
Se utilizaron variables cuantitativas ya que se utilizaron variables o datos numéricos  que pueden medirse y a su vez son variables cuantitativas discretas porque nos permitió determinar el número de provincias que tiene más de 7 bibliotecarios.


2.-)  Los datos mostrados a continuación representan el costo de la energía eléctrica durante julio de 2004 para una muestra aleatoria de 50 departamentos de una habitación en una gran ciudad, datos suministrados por EDELCA, región central gran caracas
96
171
202
178
147
102
153
197
127
82
157
185
90
116
172
111
148
213
130
165
141
149
206
175
123
128
144
168
109
167
95
163
150
154
130
143
187
166
139
149
108
119
183
151
114
135
191
137
129
158

1.)     Ordena los datos de menor a mayor
2.)     Construye la Tabla de Distribución de Frecuencia con todas sus partes
3.)     ¿Calcula el porcentaje de apartamentos que pagan menos de 150 Bs?
4.)     ¿Cual es la Proporción de apartamentos que paga más de 90 Bs?



¿Que tipo de Datos son? Explique Ordena los datos de menor a mayor: Método de tallo-hoja

8              2
9              6-0-5-
10            2-9-8 116-1-9-4-
12            7-3-8-9-
13           0-0-9-5-7-
14            7-8-1-9-4-3-9- 
15            3-7-0-4-1-8-
16            5-8-7-3-6-
17            1-8-2-5-
18            5-7-3-
19            7-1-
20            2-6-
21            3-
                          

Datos ordenados  de menor a mayor

82-90-95-96-102-108-109-111-114-116-119-23-127-128—129-130-130-135-137-139-141-143-144-147-148-149-150-151-153-154-157-158-163-165-166-167-168-171-172-175-178-183-185-187-191-202-206-213
Dato menor: 82
Dato mayor. 213
Muestra numero: 50
Rango: R= valor Max- Valor min
             R= 213-82= 131   R=131

Numero de intervalo: K=1+3,3log(n)
                                   K=1+3,3Log (50)= 6,60 aprox 7  K=7

Amplitud: C= R/K
                  C=131/7= 18,71 aprox19


TABLA DE FRECUENCIAS DATOS ORDENADOS:

I
Xi
Fi
Fi
hi
Hi
%
simple
%
acumulado
(82; 101[
91,5
4
4
0,08
0,08
8%
8%
(101;120[
110,5
7
11
0,14
0,22
14%
22%
(120,139[
129,5
8
19
0,16
0,38
16%
38%
(139;158[
148,5
13
32
0,26
0,64
26%
64%
(158;177[
167,5
9
41
0,18
0,82
18%
82%
(177;196[
186,5
5
46
0,1
0,92
10%
92%
(196;215[
205,5
4
50
0,08
1
8%
100%
50
1
100%



RESOUESTRA 1
El 38% pagan menos de 150 Bs

¿Cuál es la Proporción de apartamentos que paga más de 90 Bs?
p= X/N
X= 90
N=50
P= 90/50= 1,8
¿Qué tipo de Datos son? Explique
Son datos cuantitativos porque están representados en números y se pueden realizar operaciones con ellos.
  
3.- Construye Gráficos para cada uno de los ejercicios antes mencionados: Barras

Grafico 1






     Gráfico 2








Medidas De Tendencia Central

Son categorías o puntos dentro del recorrido de la variable, que nos ayudan a localizar valores centrales en un conjunto de datos. Los promedios no matemáticos, sucede que cuándo estos promedios se calculan en una distribución de frecuencia, se denominan medidas de tendencia central o de posición, debido a su situación en la zona central de la distribución. 
Como medidas de tendencia central tenemos:
     Media:  Es la suma de un conjunto de cantidades dividida entre el numero de ellas .
     Mediana: Es el punto dentro del recorrido de una variable que supera a no mas de la mitad de los datos     y es superado por no mas de la otra mitad.
      Moda: Es el dato de variable que aparece Mas veces en una distribución.
 Ejemplos:
1) Se  selecciona “Una (1)” muestra no ordenada de un texto bibliográfico de estadística, luego construye lo siguiente: (que sean ejercicios no resulto por el autor  y no deben ser ejercicios ya planteados en las clases pasadas).
1.1-            La tabla de distribución con todas sus partes, es decir con lo antes visto en el primer corte y las clases de este corte.
1.2-             Realiza la representación grafica (Una Ojiva, un polígono y histograma).
1.3-            Calcula las medidas de Tendencia Central y No Central.
1.4-            Explica que significa cada valor obtenido dentro del cálculo de las medidas de tendencia central y no central en tu ejemplo.
v  Un fabricante de cosméticos adquirió una máquina para llenar botellas de perfume de 3 onzas para probar la precisión del volumen depositado en cada botella hizo una corrida de prueba con 18 recipientes, los volúmenes resaltantes (en onzas) de la prueba fueron los siguientes.
3.02-2.89-2.92-2.84-2.90-2.97-2.95-2.94-2.93-3.01-2.97-2.95-2.90-2.94-2.96-2.99-2.97-2.99.
Datos de menor a mayor
2.84-2.89-2.90-2.92-2.93-2.94-2.95-2.96-2.97-2.99-3.01-3.02
Tipo de variable:
Tamaño de la muestra:
N=18
Rango: valor min – valor max
                R=2.84-3.02=0,18
Moda (Mo): Numero mayor correspondiente a la columna de la frecuencia absoluta es 3 que corresponde a un total de onzas de 2.97.
Media aritmética: Sumatoria de fi/n
fi=1+1+2+1+1+2+2+1+3+2+1+1/18= 1
El promedio de botellas de perfumes es de 1

Mediana (Me): es el punto medio  de la muestra: n/2= 18/2=9
Un número mayor o igual a 9 en la columna de la frecuencia absoluta acumulada (Fi) seria 10



Fi
hi
Fi
Hi
%
2.84
1
0,05
1
0,05
5
2.89
1
0,05
2
0,1
5
2.90
2
0,11
4
0,21
11
2.92
1
0,05
5
0,26
5
2.93
1
0,05
6
0,31
5
2.94
2
0,11
8
0,42
11
2.95
2
0,11
10
0,53
11
2.96
1
0,05
11
0,58
5
2.97
3
0,16
14
0,74
16
2.99
2
0,11
16
0,85
11
3.01
1
0,05
17
0,9
5
3.02
1
0,05
18
0,95
5

18



95%



2.        Selecciona  Dos (2) muestras ordenadas de un texto bibliográfico de estadística (no resueltos por el autor) y solo calcula las medidas de tendencia central y no central.
2.1-            Un bibliotecario encuesto a 20 personas al salir de la biblioteca y les pregunto cuántos libros habían sacado. Las respuestas fueron las siguientes.
1-0-2-2-3-4-2-1-2-0-2-2-3-1-0-7-3-5-4-2
Datos ordenados
0,0,0-1,1,1-2,2,2,2,2,2,2-3,3,3-4,4-5-7
Tamaño de la muestra
N=20
Moda (Mo):
Se toma el mayor número de la columna de la frecuencia absoluta (fi) el cual es 7 siendo su categoría xi el 2 eso quiere decir que dos personas sacaron 7 libros.

Media aritmética: fi/n
fi = 3+3+7+3+2+1+1/20=1
El promedio de libros sacados son de 1.

Mediana (Me): es el punto medio de la muestra
N/2=  20/2= 10
Se busca un número en la columna de la frecuencia absoluta acumulada  que sea mayor o igual a 10 el cual seria  13  con un  xi de  2

xi
fi
hi
Fi
Hi
%
0
3
0,15
3
0,5
15
1
3
0,15
6
0,3
15
2
7
0,35
13
0,65
35
3
3
0,15
16
0,8
15
4
2
0,1
18
0,9
10
5
1
0,05
19
0,95
5
7
1
0,05
20
1
5

20



100%

2.2-            Las edades de una muestra de estudiantes que asisten a sandhills community college este semestre son:

19-17-15-20-23-41-33-21-18-20-18-33-32-29-24-19-18-20-17-22-55-19-22-25-28-30-44-19-20-39
Ordenar datos
15-17,17-18,18,18-19,19,19,19-20,20,20,20-21-22,22-23-24-25-28-29-30-32-33,33-39-41-44-55.
Tamaño de la muestra:
N=30

xi
fi
hi
Fi
Hi
%
15
1
0,03
1
0,03
3
17
2
0,06
3
0,09
6
18
3
0,1
6
0,19
10
19
4
0,13
10
0,32
13
20
4
0,13
14
0,45
13
21
1
0,03
15
0,48
3
22
2
0,06
17
0,54
6
23
1
0,03
18
0,57
3
24
1
0,03
19
0,6
3
25
1
0,03
20
0,63
3
28
1
0,03
21
0,66
3
29
1
0,03
22
0,69
3
30
1
0,03
23
0,72
3
32
1
0,03
24
0,75
3
33
2
0,06
26
0,81
6
39
1
0,03
27
0,84
3
41
1
0,03
28
0,87
3
44
1
0,03
29
0,9
3
55
1
0,03
30
0,93
3

30



93%

Moda (Mo):
Se toma el mayor número de la columna de la frecuencia absoluta (fi) el cual es 4 siendo su categoría xi el 20 eso quiere decir que hay 4 estudiantes de 20 años de edad.

Media aritmética: fi/n
fi = 1+2+3+4+4+1+2+1+1+1+1+1+1+1+2+1+1+1+1/19=1,57
El promedio de número de estudiantes es de 1,57.

Mediana (Me): es el punto medio de la muestra
N/2=  30/2= 15
Se busca un número en la columna de la frecuencia absoluta acumulada  que sea mayor o igual a 15 el cual seria  15  con un  xi de  21.



Medidas De Dispersión

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información.
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.

Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Se representa por S².
DesviaciónEs sin duda la medida de dispersión más importante, ya que además sirve como medida previa al cálculo de otros valores estadísticos.

La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución, es decir, la raíz cuadrada de la varianza
Coeficiente De VariaciónCuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética, representa el numero de veces que la desviación típica contiene la media aritmética y por lo tanto cuanto mayor es el coeficiente de variación mayor es mayor es la dispersión y menor la representatividad de la media.

 Ejemplos:

Ejercicios  medidas de dispersión


1) Calcular todas las medidas de dispersión para la siguiente distribución
Xi
5
10
15
20
25
ni
3
7
5
3
2

  Tamaño de la muestra
 N =5

 Rango: valor max – valor min
R= 25-5= 20 20

Media aritmética
X = Xi / N

X= 5+10+15+20+25 / 5 = 15


v  Varianza


S2= (Xi- X)2 *n
          N
S2= (5-15)2 x3+(10-15)2 x7+(15-15)2 x5+(20-15)2 x3+(25-15)2 x2
                                                    20
S2= 300+175+0+75+200
               20
S2=750   = 37.5
       20          
v  Desviación estándar

S = raíz de varianza
S= (37,5)= 6,12
v  Coeficiente de variación

Cv= s/ x
Cv= 6,12/ 15= 0,408 x 100 = 40,8%

1.1)  Los siguientes datos de muestras se han obtenido para el número de clientes diarios de la florería “El Tulipán negro”: 25, 38, 20, 48, 29, 32, 24, 50. Calcula la varianza, la desviación estándar y el rango.

v  Tamaño de la muestra
 N =8

v  Rango: valor max – valor min
                                  R=50-20=30
                                         R= 30
v   Media aritmética
X = Xi / N
X= 25+38+20+48+29+32+24+50/ 8= 33,25

v  Varianza
 S2 = (Xi – X)2 (cuadrado) / dividido entre n

S2=(25-33,25)2+(38-33,25)2+(20-33,25)2+(48-33,25)2+(29-33,25)2+(32-33,25)2+(24-33,25)2+(50-33,25)2 / 8 = 108,687
v  Desviación estándar

S= raíz cuadrada de  S2 (varianza)

(108,685)= 10,42

1.2)  Dada la siguiente muestra de 20 medidas

15
9
19
7
2
9
6
1
11
9
3
4
0
8
4
21
1
-7
8
7

a)      Construye un diagrama de puntos




b)       Encuentra la media, la mediana, la varianza y la desviación estándar
-7;0;1,1;2;3;4,4;6;7,7;8,8;9,9,9;11;15;19;21

N=20
Rango: valor max – valor min
                          21-(-7)=28
Numero de intervalo
K=1+3,3log(20)=5

Amplitud
28/5=5,6=6


Xi
Fi
Xi-Fi
Xi2-Fi
-7:-1
-4
1
-4
16
-1:5
2
7
21
42
5:11
8
8
64
512
5:17
14
2
28
392
17:23
20
2
40
800


20
149
1042

v  La media
Es la  sumatoria de Xi / n
X= -4+2+8+14+20/ dividido entre 20 =  2
v  La mediana
20/2=10
v  La varianza
S2 = (Xi – X)2 (cuadrado)*ni / dividido entre n
                           
S2= (-4-2)2*1+(2-2)2*7+(8-2)2*8+(14-2)2*2+(20-2)2*2

                                           20
                                                      
S2= 63

v  Desviación estándar
       
S= raíz cuadrada de S2
S= (63)= 7,93

2) Utiliza los ejercicios resueltos en la segunda asignación y aplicar las medidas de dispersión a cada uno. Explica cada caso?
Ejercicio N°1 (Asignación 2)
Los siguientes datos corresponden al número de bibliotecarios en las bibliotecas públicas de las diferentes provincias españolas:

4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4 3 2 4 4 1 10 2 5 3 2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7 12
Ordenados de menor a mayor
v  1-1-1-2-2-2-2-2-2-2-3-3-3-3-3-3-3-3-3-4-4-4-4-4-4-4-4-4-4-5-5-5-5-5-5-6-6-6-6-7-7-7-7-8-8-10-12-12-15-16
N= 50
R=15
K=6
C=3



Xi
Fi
Xi-Fi
Xi2-Fi
1-4
2,5
19
47,5
118,75
4-7
5,5
20
110
605
7-10
8,5
6
51
433,5
10-13
11,5
3
34,5
396,75
13-16
14,5
1
14,5
210,25
16-19
17,5
1
17,5
306,25


50
275
         2070,5

Media aritmética: es la  sumatoria de Xi / n
X= 2,5+5,5+8,5+11,5+14,5+17,5 / 50 = 1,2
Desviación media: Xi – X / n
Dm= 2,5-1,2+5,5-1,2+8,5-1,2+11,5-1,2+14.5-1,2+17,5-1,2 / 50                                      
Dm= 1,056

Varianza:
S2 = (Xi – X)2 (cuadrado)*ni / dividido entre N (tamaño de la muestra)
S2=(2,5-1,2)2*19+(5,5-1,2)2*20+(8,5-1,2)2*6+(11,5-1,2)2*3+(14,5-1,2)2*1+(17,5-1,2)2*1

                                                 50     


S2= 29,62
Desviación Estándar:
S= raíz cuadrada de S2
S= (29,62)= 54,42
Coeficiente de variación:
CV= S/X(media aritmética)
CV= 54,42/ 1,2= 45,35.
El rango de bibliotecarios en las bibliotecas públicas de las diferentes provincias españolas es 15, La media aritmética es 1,2 la deviación media 1,056, la Varianza 29,62, La Desviación Estándar es 54,42 y finalmente el coeficiente de variación es de 45,35.
Ejercicio N°2 (Asignación 2)

Xi
Fi
Xi-Fi
Xi2-Fi
80-101
91,5
4
366
33489
101-120
110,5
7
773,5
85471,75
120-139
129,5
9
1165,5
150932,25
139-158
148,5
13
1930,5
286679,25
158-177
167,5
8
1340
224450
177-196
186,5
5
932,5
173911,25
196-215
205,5
4
822
168921


50
7330
1123854,5

Media aritmética:
X= 91,5+110,5+129,5+148,5+167,5+186,5 +205,5/ dividido entre 50= 20,79
Desviación media:
Dm=91,5-20,79+110,5-20,79+129,5-20,79+148,5-20,79+167,5-20,79+186,5-20,79+205,5-20,79 / 50
Dm= 17,8794
Varianza:
 S2=(91,5-20,79)2*4+(110,5-20,79)2*7+(129,5-20,79)2*9+(148,5-20,79)2*13+(167,5-20,79)2*8+(186,5-20,79)2*5+(205,5-20,79)2*4 / 50
S2= 16813,6861
Desviación Estándar:
S= raíz cuadrada de S2
S= (16813,6861)2
S=12966,7598
Coeficiente de variación:
CV= 12966,7598/ 20,79
CV= 623,701

El rango  de la energía eléctrica para julio de 2004 es de 131, La media aritmética es 20,79 la deviación media es 17,8794 la Varianza es 16813,6861, La Desviación Estándar es 12966,7598 y finalmente el coeficiente de variación es de 623,701.
3) De los ejercicios encontrados por ti en la tercera asignación aplícale las medidas de dispersión y explica que sucede en cada caso.

Ejercicio N°1 (Asignación 3)
v  Tamaño de la muestra
N= 18
v  Rango valor min – valor Max
R=  2.84 – 3.02=0,18
v  Media aritmética = 1
v  Varianza
S2=(1-1)2+(1-1)2+(2-1)2+(1-1)2+(1-1)2+(2-1)2+(2-1)2+(1-1)2+(3-1)2+(2-1)2+(1-1)2+(1-1)2 / 18= 0,44
v  Desviación media
DM=1-1+1-1+2-1+1-1+1-1+2-1+2-1+1-1+3-1+2-1+1-1+1-1 / 18= 0,33
v  Desviación estándar
Raíz cuadrada de s2 = (0,44)2= 0,66
v  Coeficiente de variación
CV= S/X (media aritmética)
Cv=0,66/1= 0,66
El rango  de botellas de perfume de 3 onzas es de 0,18, La media aritmética es de 1 la deviación media es de 0,33 la Varianza es de 0,44, La Desviación Estándar es de 0,66 y finalmente el coeficiente de variación es de 0,66.

Ejercicio N°2 (asignación 3)
v  Tamaño de la muestra
            N= 20
v  Rango valor min – valor max
                                   R=  0-7=7
v  Media aritmética = 1
v  Varianza
                S2= (3-1)2+(3-1)2+(7-1)2+(3-1)2+(2-1)2+(1-1)2+(1-1)2 / 20= 2,45
v  Desviación media
             DM= (3-1)+(3-1)+(7-1)+(3-1)+(2-1)+(1-1)+(1-1) / 20= 0,65
v  Desviación estándar
              Raíz cuadrada de s
             S= (2,45)2= 1,56
v  Coeficiente de variación
          CV= S/X (media aritmética)
          CV =1,56 /1
          CV=1,56
El promedio de libros sacados en la bibliotecas rango es de 7, La media aritmética es 1 la deviación media es 0,65  la Varianza es 2,45, La Desviación Estándar es 1,56 y finalmente el coeficiente de variación es de 1,56.





Ejercicio N°3 (asignación 3)
v  Tamaño de la muestra
N=30
v  Rango Valor Min- Valor Max
                  R=15-55=40
v  Media aritmética
X=1
v  Varianza
S2=25
v  Desviación media
Dm=11
v  Desviación estándar raíz cuadrada de s2
S= (25)2 = 5
v  Coeficiente de variación
CV= S/X
CV= 5/1= 5

El promedio de edades de una muestra de estudiantes de un semestre, el rango es de 40, La media aritmética es de 1 la deviación media es de 11  la Varianza es de 25, La Desviación Estándar es de 5 y finalmente el coeficiente de variación es de 5.

CONCLUSIÓN
El primer paso para elaborar una estadística es conseguir todos los datos  a través de la obtención de una colección de los mismos, que no han sido ordenados. Existen dos tipos de variables: discreta 8numeros enteros) y continua (números decimales)
Rango o recorrido: es la diferencia entre el mayor y el menor valor que toma la variable
Existe una distribución de frecuencia absoluta para datos no agrupados la cual está compuesta por los valores de variable y por las frecuencias (absolutas)
Así mismo también existe una distribución de frecuencia para datos agrupados que es utilizada cuando el número de datos de una muestra es muy grande y se agrupan  en los que menciono los siguientes:
·         Intervalos de clase: corresponde tanto el límite superior como el límite inferior.
·         Amplitud de un intervalo: es la diferencia entre el límite superior y el límite inferior
·         Marca de clase o punto medio: es el punto medio del intervalo.
Las medidas de tendencia central: son las medidas que reúnen en un solo valor, las características de las distribuciones  entre la cuales se pueden mencionar: media, moda mediana.
La media es el valor que tendría la muestra si estuviese formada por un solo elemento (sumatoria de las clases entre el número de la muestra)          
·         Mediana: es el valor que divide a la muestra
·         Mediana: es el valor que divide a la muestra
·         Moda: es el valor que se presenta con la mayor frecuencia ósea el valor más común.
Las medidas de dispersión pueden ser absolutas o relativas
·         El Rango que es limite dentro del cual se encuentran todos los valores.
·         Desviación media: variación esperada con respecto de la media aritmética, es decir que tan cerca o lejos están los puntos de la media.
·         Desviación estándar: es la variación de los datos respecto a la media.

·         Varianza: Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto centra..





4 comentarios:

  1. Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas.

    Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.

    ResponderEliminar
  2. La estadística es una de las ramas de la ciencia matemática que se centra en el trabajo con datos e informaciones que son ya de por sí numéricos o que ella misma se encarga de transformar en números. Podemos decir que la función principal de la estadística es justamente la recolección y agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que nos den idea sobre diferentes y muy variados temas siempre desde un punto de vista cuantitativo y no cualitativo.

    ResponderEliminar
  3. En un excelente blog la estadisitca descriptiva registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que describen el conjunto estudiado.

    ResponderEliminar