INTRODUCCIÓN
Cuando hablamos de la estadística nos referimos a datos
numéricos. Se sobrentiende que dichos datos han de estar presentados de manera
ordenada y sistemática. Por tanto, el objetivo de la estadística es hallar
las regularidades que se encuentran en los fenómenos de masa.
Su importancia está relacionada
con el estudio de proceso cuyo resultado es más o menos
imprescindible y con la finalidad de obtener conclusiones para tomar decisiones
razonables de acuerdo con tales observaciones. La Estadística se ocupa de los
métodos científicos para recolectar, organizar, resumir, presentar y analizar
datos, así como de sacar conclusiones válidas y tomar decisiones con base en
este análisis, así también realizar predicciones a cerca del conjunto del cual
se han seleccionado dichos datos.
ÍNDICE
Itroducción
Objetivo del portafolio
Asignación I
Asignación II
Asignación III
Mini-Proyecto I
Temas y asignaciones del segundo corte.
Conclusión.
OBJETIVO DEL PORTAFOLIO
Su objetivo es recopilar o
ilustrar cualquier tipo de investigación realizado por cualquier estudiante y
así compartir la información o tener un enlace directo con el profesor y de
esta forma comentar su evolución respecto al tema, es decir es un instrumento
de enseñanza, aprendizaje y evaluación que a su vez sirve como agente motivador.
;objetivo de la estadística es hallar
las regularidades que se encuentran en los fenómenos de masa.
Su importancia está relacionada
con el estudio de proceso cuyo resultado es más o menos
imprescindible y con la finalidad de obtener conclusiones para tomar decisiones
razonables de acuerdo con tales observaciones. La Estadística se ocupa de los
métodos científicos para recolectar, organizar, resumir, presentar y analizar
datos, así como de sacar conclusiones válidas y tomar decisiones con base en
este análisis, así también realizar predicciones a cerca del conjunto del cual
se han seleccionado dichos datos.
Las
civilizaciones de Sumaria, Egipto y China que realizaron recuentos de censos de
carácter fiscal y militar, en la edad media el rey de Grecia para esta fecha se
decidió realizar un censo de propiedades para su reino. Para el renacimiento
los censos ya eran un poco mas complejos y en el reinado de Enrique VII se
empiezan a registrar las defunciones mientras que en Francia de manera
obligatoria se debían registrar los nacimientos, bautizos y matrimonios.
Para el siglo
XVI se comenzaron a recontar asuntos de estado para la evolución del proceso
científico llamado Estadística.
Para el siglo
XIX se comenzó a estudiar la estadística para las ciencias sociales para la
reducción de incertidumbres en la toma de decisiones por medio de métodos para
el mejoramiento de aquellas organizaciones que tienen un objetivo trazado por
cumplir.
Seguido a todo
esto encontramos que la estadística se calcifica en tres partes, la estadística
descriptiva, la estadística matemática y la inferencia estadística cada una de
ellas siendo vitales para la vida actual en diferentes áreas. La estadística
descriptiva es la que utiliza sus métodos en representaciones graficas,
mientras que la estadística matematiza estudia las variables de modelos
probalisticos, la misma es una combinación de la estadística y el calculo de la
probabilidad, por otro lado la Inferencia estadística desarrollo un conjunto de
métodos y técnicas dirigidas a la estimación de hipótesis con la obtención de
muestras con el fin extender los resultados que se obtenga para la población en
general.
Esta ciencia su
puede medir por medio técnicas tales como el calculo de media, desviación
típico y muchos mas cálculos.
La estadística
fue es y será una gran ciencia para nuestros estudios y desarrollo en cualquier
ámbito pues sin ella podríamos tener un vivir lleno de incertidumbres casi
imposibles de resolver.
Es interesante
saber que hay muchas maneras de aprender y conocer sobre la estadística, los
videos son fundamentales con respecto a este tema, pues es un método visual
ideal para el conocimiento de la ciencia estadística, aportando así ayuda
cultural y necesaria para el que hacer diario.
La estadística se ocupa en recoger, organizar, resumir
y analizar datos, así como también para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.
Estadística descriptiva.
Ayudan a
presentar los datos de modo tal que sobresalga su estructura. Hay varias formas
simples e interesantes de organizar los datos en gráficos que permiten detectar
tanto las características sobresalientes como las características inesperadas.
Ejemplo: Un
economista registra el crecimiento de la población en un área determinada.
Estadística inferencial.
Hace referencia
a un conjunto de métodos que permiten hacer predicciones acerca de
características de un fenómeno sobre la base de información parcial acerca del
mismo.
Ejemplo: Se
desea establecer el promedio de bateo de un equipo determinado.
Conceptos básicos que integran la estadística.
·
Población: es la colección de todas
las posibles mediciones u observaciones que pueden hacerse de una variable bajo
estudio.
• Muestra: Es un conjunto de mediciones u observaciones
tomadas a partir de una población.
· Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.
· Datos: Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar.
·
Escala de razones: Cuando una escala tiene todas las características de
una escala de intervalo y además un punto cero real en su origen, se llama
escala de razón.
·
Variables:
Una variable es una característica que al ser
medida en diferentes individuos es susceptible de adoptar diferentes valores.
·
Variable constante: Característica que
presenta una sola modalidad.
·
Variables
continúas: Una variable continua es aquella que
puede tomar valores comprendidos
entre dos números.
·
Variables
cuantitativas: Una variable cuantitativa es la que
se expresa mediante un número,
por tanto se pueden realizar operaciones
aritméticas.
·
Variables
discretas: es aquella que toma valores aislados, es decir no admite valores intermedios entre dos
valores específicos.
·
Variables
cualitativas: refieren a características o cualidades que no pueden ser medidas con números.
·
Parámetros: Un índice
estadístico calculado a base de los datos de una población y que cuantifica una
característica de esa población.
·
Estadígrafo: Un
estadígrafo o Estadístico es una función matemática que utiliza datos de
muestra para llegar a un resultado que debe ser un número real.
Representaciones Gráficas
Los datos estadísticos son representados en tablas estadísticas,
donde es observada toda la información de modo esquemático están preparadas
para cálculos posteriores. Los gráficos
estadísticos nos transmiten esa información de modo más expresivo, nos van a
permitir, con un sólo movimiento visual, entender de que información se nos
esta hablando, observar sus características más importantes, incluso sacar
alguna conclusión sobre el comportamiento de la muestra donde se esta realizando
el estudio.
Los gráficos estadísticos son muy útiles para comparar distintas
tablas de frecuencia, es por ello que a continuación se detallaran las
siguiente graficas:
- Diagramas de barras.
Es un gráfico que se
utiliza para representar datos de variables cualitativas o discretas. Está
formado por barras rectangulares cuya altura es proporcional a la frecuencia de
cada uno de los valores de la variable.
- Histogramas.
Es una representación gráfica estadísticas. El histograma es útil para
la observación visual, ordenada y
comprensión de todos los datos numéricos
estadísticos que pueden ser difíciles de comprender, también es de especial
utilidad y eficacia para las ciencias sociales, ya que, permiten comparar datos
sociales como los resultados de un censo, la cantidad de mujeres y/o hombres en
una comunidad, el nivel de analfabetismo o mortandad infantil, entre otros.
Hay
muchos tipos de histogramas y cada uno se ajusta a diferentes necesidades como
también a diferentes tipos de información.
·
Histogramas
de barras simples son los más comunes y utilizados.
·
Histogramas
de barras compuestas que permiten introducir información sobre dos variables.
Histogramas de
barras agrupadas según información y por último el polígono de frecuencias y la
ojiva porcentual, ambos sistemas utilizados por expertos.
-
Polígonos de frecuencias.
Es aquella
gráfica donde se forman a partir de la unión los distintos puntos
medios de las cimas de las columnas que configuran lo que es un histograma de frecuencia.
- Gráfico de sectores.
Es un gráfico el cual se puede utilizar
para todo tipo de variables, en forma global, haciendo una comparación
inmediata de la frecuencia de cada una de sus categorías, facilitando el
reconocimiento de cada una de ellas al total de la variable.
-
Pictogramas.
Los pictogramas
utilizan símbolos para representar un conjunto de datos. La mayor frecuencia se
identifica por la mayor acumulación de símbolos. Los pictogramas se emplean
sobre ver de manera más entendible los informes estadísticos.
-
Pictogramas.
Los pictogramas utilizan símbolos para representar un conjunto de datos.
La mayor frecuencia se identifica por la mayor acumulación de símbolos. Los
pictogramas se emplean sobre ver de manera más entendible los informes
estadísticos.
-
Cartogramas.
Es un diagrama que muestra datos
cuantitativos asociados a áreas, mediante la modificación de los tamaños de las
unidades de enumeración que comprenden un mapa geográfico, en pocas palabras
son expresiones gráficas a modo de mapa.
- Pirámides de población.
Establece las
clasificaciones de grupos de población por sexo y edad
Existen tres tipos de pirámides de población que son:
·
Pirámide con forma de
pagoda o progresiva.
·
Pirámide con forma de
campana o estable.
·
Pirámide con forma de
bulbo o regresiva.
Tablas
De Estadística
-
Distribución
de frecuencias
La distribución de frecuencias o tabla de frecuencias es u orden en
forma de tabla de los datos estadísticos, para la asignación
de cada dato su frecuencia correspondiente.
-
Distribución
de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se
emplea si lasvariables toman
un número grande de valores o
la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
- Tabla
bidimensional simple.
Está formada por tres
filas o columnas en las que se representan ordenadamente los valores de las
variables y sus frecuencias. Está indicada para casos con pocos datos y pocos
valores o ninguno repetidos.
- Tabla
de doble entrada.
Está
formada por tantas filas y columnas como valores tengamos de cada una de las
variables, más una fila y una columna más para indicar los totales. Está
probada para casos con bastantes datos, en los que para cada valor de una
variable, existen varios valores de la otra.
Estructura y elementos de un gráfico estadístico
Todo gráfico estadístico debe tener un
código o número, título y cuerpo. Así, los elementos de un gráfico estadístico
son:
•Código o número de
gráfico
•Título
• Cuerpo
• Escala o eje de valores
• Leyenda
• Eje de conceptos
• Pie
• Nota
• Llamada
• Fuente
Errores comunes al
momento de elaborar una gráfica.
Al realizar un gráfico se pueden cometer dos tipos de
errores: errores de forma y errores de contenido.
De forma:
· No uso de la identificación.
· Aparecen el título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.
· Gráficos muy cargados y/o sumamente complejos de interpretar.
· Desproporción notable entre las longitudes de los ejes.
· Omisión de los rótulos de los ejes y/o las unidades de medida.
De contenido:
· Uso de gráficos inadecuados dada la naturaleza de lo que se representa.
· Omisión de la leyenda donde de ellas colocan claves o símbolos.
· No respetar alguna de las reglas establecidas para la construcción del
gráfico en particular. Por ejemplo, barras unidas cuando se trabaja con
variable cualitativa o discreta.
Ejemplos de Entidades económicas que utilicen la estadística como herramienta fundamental tomando en cuento si las mismas siguen los pasos correctos para la creacón de los gráficos.
BCV
(Banco Central de Venezuela)
La representación gráfica
del BCV es una Grafica Ojiva o de Líneas. Esta representación grafica es de
suma importancia para el país en materia económica, pues en ella se refleja el
crecimiento del PIB (Producto Interno Bruto) el cual se refiere a la producción
del país. En dicha gráfica se visualiza la siguiente información:
-
“PIB. La producción venezolana creció 0,7% durante el
primer trimestre, lo que demuestra una desaceleración con respecto al mismo
periodo del año pasado (4,8%) y al último trimestre de 2012 (5,5%).”
La grafica del BCV no cumple
con los lineamientos de cómo se debe realizar una grafica, la misma no posee su
propio código de grafico, titulo, y leyenda.
FMI
(Fondo Monetario Internacional)
La representación grafica
del FMI es una Gráfica de Barras y consiste al igual que la del BCV en el PIB
pero de manera contrario. En esta se representa el PIB de forma negativa para
nuestro país, como se puede observar en la imagen.
En dicha gráfica se
visualiza la siguiente información:
-
“El Fondo Monetario Internacional (FMI) estima que la
economía venezolana tendrá dos años de caída económica, según indica su informe
Perspectivas Económicas Mundiales (WEO, en inglés)”.
La grafica del FMI no cumple
con los lineamientos de cómo se debe realizar una grafica, la misma no posee su
propio código de grafico, titulo, leyenda, eje de conceptos y pie.
CEPAL
(Comisión Económica Para América Latina)
Es una grafica circular y de
barras, las mismas podrían ser combinadas de acuerdo a la información.
La representación grafica de
CEPAL consiste en las exportaciones de bienes de toda América latina según sus
series.
Cumple con todos los
parámetros para realizar la grafica.
Tablas De Distribución De Frecuencias
Las tablas de distribución de
frecuencias se utilizan cuando se recolectan datos, con ellas se pueden
representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de
distribución de frecuencias para datos no agrupados y para datos agrupados.
Estas últimas se utiliza cuando se tienen muchos datos.
Para elaborar tablas de distribuciones de frecuencia se debe
tener en cuenta lo siguiente
:
•Cuando
hay muchos datos se agrupan en clases.
• Clase es
cada uno de los grupos en que se dividen los datos.
•Para
determinar cuántas clases crear, se puede utilizar la siguiente fórmula:
(fórmula
de Sturges)
Número de clases = 1 + 3,322 log n donde n es el número total de datos.
Si al aplicar la fórmula se obtiene un
número decimal, se aproxima al siguiente entero.
El intervalo de clase o el ancho de la
clase (tamaño de la clase) es el espacio
que hay entre el límite superior y el
límite inferior de la clase, los cuales corresponden a
los valores extremos de la clase.
Para obtener el ancho de clase se utiliza la
siguiente fórmula:
Ancho de clase = (dato superior – dato
inferior)/ número de clases
La marca de clase es el punto medio de
la clase. Se obtiene dividiendo entre dos la suma de los valores extremos de
cada clase.
El rango es la diferencia entre el
valor mayor y el valor menor en estudio de una distribución de datos.
Ejemplos de una tabla de frecuencias.
A continuación se
plantean algunos ejercicios prácticos para ser resueltos..
1.-) Los siguientes datos
corresponden al número de bibliotecarios en las bibliotecas públicas de las
diferentes provincias españolas:
4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4
3 2 4 4 1 10 2 5 3 2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7 12
(a)
Ordena
los datos de Menor a Mayor,
(b)
Construya
una Tabla de Distribución de Frecuencia
(c)
Obtener
todas las distribuciones estudiadas en
clases
(d)
¿Qué
proporción de provincias tiene más de 7 bibliotecarios?
(e)
¿Que
tipo de Datos son? Explique.
Respuesta (a)
1-1-1-2-2-2-2-2-2-2-3-3-3-3-3-3-3-3-3-4-4-4-4-4-4-4-4-4-4-5-5-5-5-5-5-5-6-6-6-6-7-7-7-7-8-8-10-12-12-15-16
Dato
menor: 1
Dato
mayor: 16
Total
de la muestra: 50
Tabla
de datos no ordenados
Frecuencia
Absoluta
fi
|
Frecuencia
Absoluta
Acumulada
Fi
|
Frecuencia
Relativa
hi
|
Frecuencia
Relativa
Acumulada
Hi
|
3
|
3
|
0,06%
|
0,06
|
7
|
10
|
0,14%
|
0,2
|
9
|
19
|
0,18%
|
0,38
|
10
|
29
|
0,2%
|
0,58
|
6
|
35
|
0,12%
|
0,7
|
4
|
39
|
0,08%
|
0,78
|
4
|
43
|
0,08%
|
0,86
|
2
|
45
|
0,04%
|
0,9
|
1
|
46
|
0,02%
|
0,92
|
2
|
48
|
0,04%
|
0,96
|
1
|
49
|
0,02%
|
0,98
|
1
|
50
|
0,02%
|
1
|
Distribución de bibliotecarios por provincias
Dato menor: 1
Dato mayor: 16
Total de la muestra: n= 50Rango o
recorrido:
R=Valor máximo (16) – Valor mínimo (1
R= 16-1= 15
R= 15
Numero de intervalo (K):
K= 1+3, 3. LOG (n)
K= 1 + 3, 3 * LOG (50) =
6.60
C=15/6= 2,5 aproximación = 3 C=3
TABLA DE DATOS ORDENADOS
I
|
Xi
|
Fi
|
Fi
|
Hi
|
Hi
|
(%) Simple
|
(%) Acumulado
|
(1;4[
|
2,5
|
19
|
19
|
0,38
|
0,38
|
38%
|
38%
|
(4;7[
|
5,5
|
20
|
39
|
0,4
|
0,78
|
40%
|
78%
|
(7;10[
|
8,5
|
6
|
45
|
0,12
|
0,9
|
12%
|
90%
|
(10;13[
|
11,5
|
3
|
48
|
0,06
|
0,96
|
6%
|
96%
|
(13;16[
|
14,5
|
1
|
49
|
0,02
|
0,98
|
2%
|
98%
|
(16;19[
|
17,5
|
1
|
50
|
0,02
|
1
|
2%
|
100%
|
40
|
1
|
100
|
Columna 1 (I):
Intervalo se toma el valor mínimo y se le suma la amplitud
y así sucesivamente
Fila #1:(1+3=4[
|
Fila #:2(4+3=7[
|
Fila #3:(7+3=10[
|
Fila #4:(10+3=13[
|
Fila# 5:(13+3=16[
|
Fila #6:(16+3=19[
|
Columna 2(xi):
Marca o punto medio (X1) se determina con la siguiente
formula
Límite inferior + límite
superior
2
1 + 4= 5/2= 2,5
4+ 7=11/2= 5,5
7+10 = 17/2=8,5
10 + 13= 23/2=11,5
13+ 16= 29/2=14,5
16 + 19= 35/2=17,5
Columna 3 (fi):
Frecuencia absoluta simple (fi): Cantidad de datos que hay
en cada intervalo en los datos ordenados que la suma debe el total de los datos
Columna 4 (Fi):
Frecuencia absoluta acumulada (Fi): la primera es igual al
resultado de la primeraColumna 4 (Fi):
Frecuencia absoluta acumulada (Fi): la primera es igual al
resultado de la primera frecuencia absoluta simple y sucesivamente se va acumulando
Columna 5 (hi):
Frecuencia relativa simple (hi): se determina dividiendo la
frecuencia absoluta simple entre
Fila #1: 19/50=0,38
|
Fila #2: 20/50=0,4
|
Fila #3: 6/50=0,12
|
Fila #4: 3/50=0,06
|
Fila #5: 1/50=0,02
|
Fila #6: 1/50=0,02
|
Columna 6 (hi):
Frecuencia relativa acumulada: va acumulando las
frecuencias relativas simples
Columna 7 (% simple):
Porcentaje simple: Se le saca multiplicando 100 a la
frecuencia relativa simple.
0,38*100=38%
|
0,4*100= 40%
|
0,12*100=12%
|
0,06*100=6%
|
0,02*100=2%
|
0,02*100=2%
|
Columna 8 (% acumulado):
Porcentaje Acumulado: va acumulando el porcentaje simple
d.- ¿Qué proporción de provincias tiene más de 7
bibliotecarios?
La proporción es una razón en
la cual los elementos están incluidos en el denominador, se utiliza como
estimación de la probabilidad. En el rango es de 0 a 1 o de 0 a100%
La fórmula que se utiliza es
la siguiente: p= x/n donde x es el de existos u observaciones
de interés y n es el tamaño de la muestra. La distribución muestra de
proporciones es la adecuada para dar respuesta a este tipo de situaciones
p= x/n
x= 7
n= 50 p= 7 / 50= 0,14
La proporción es 0,14
e.-¿Qué tipo de Datos son? Explique
Se utilizaron variables
cuantitativas ya que se utilizaron variables o datos numéricos que pueden
medirse y a su vez son variables cuantitativas discretas porque nos permitió
determinar el número de provincias que tiene más de 7 bibliotecarios.
2.-) Los datos mostrados a continuación
representan el costo de la energía eléctrica durante julio de 2004 para una
muestra aleatoria de 50 departamentos de una habitación en una gran ciudad,
datos suministrados por EDELCA, región central gran caracas
96
|
171
|
202
|
178
|
147
|
102
|
153
|
197
|
127
|
82
|
157
|
185
|
90
|
116
|
172
|
111
|
148
|
213
|
130
|
165
|
141
|
149
|
206
|
175
|
123
|
128
|
144
|
168
|
109
|
167
|
95
|
163
|
150
|
154
|
130
|
143
|
187
|
166
|
139
|
149
|
108
|
119
|
183
|
151
|
114
|
135
|
191
|
137
|
129
|
158
|
1.) Ordena los datos de menor a mayor
2.) Construye la Tabla de Distribución de
Frecuencia con todas sus partes
3.) ¿Calcula el porcentaje de
apartamentos que pagan menos de 150 Bs?
4.) ¿Cual es la Proporción de
apartamentos que paga más de 90 Bs?
¿Que tipo de Datos son? Explique Ordena los datos de menor a mayor: Método de tallo-hoja
8
2
9
6-0-5-
10
2-9-8 116-1-9-4-
12
7-3-8-9-
13
0-0-9-5-7-
14
7-8-1-9-4-3-9-
15
3-7-0-4-1-8-
16
5-8-7-3-6-
17
1-8-2-5-
18
5-7-3-
19
7-1-
20
2-6-
21
3-
Datos ordenados de
menor a mayor
82-90-95-96-102-108-109-111-114-116-119-23-127-128—129-130-130-135-137-139-141-143-144-147-148-149-150-151-153-154-157-158-163-165-166-167-168-171-172-175-178-183-185-187-191-202-206-213
Dato menor: 82
Dato mayor. 213
Muestra numero: 50
Rango: R= valor Max- Valor
min
R= 213-82= 131 R=131
Numero de intervalo:
K=1+3,3log(n)
K=1+3,3Log (50)= 6,60 aprox 7 K=7
Amplitud: C= R/K
C=131/7= 18,71 aprox19
TABLA
DE FRECUENCIAS DATOS ORDENADOS:
I
|
Xi
|
Fi
|
Fi
|
hi
|
Hi
|
%
simple
|
%
acumulado
|
(82; 101[
|
91,5
|
4
|
4
|
0,08
|
0,08
|
8%
|
8%
|
(101;120[
|
110,5
|
7
|
11
|
0,14
|
0,22
|
14%
|
22%
|
(120,139[
|
129,5
|
8
|
19
|
0,16
|
0,38
|
16%
|
38%
|
(139;158[
|
148,5
|
13
|
32
|
0,26
|
0,64
|
26%
|
64%
|
(158;177[
|
167,5
|
9
|
41
|
0,18
|
0,82
|
18%
|
82%
|
(177;196[
|
186,5
|
5
|
46
|
0,1
|
0,92
|
10%
|
92%
|
(196;215[
|
205,5
|
4
|
50
|
0,08
|
1
|
8%
|
100%
|
50
|
1
|
100%
|
RESOUESTRA
1
El 38% pagan menos de 150 Bs
¿Cuál es la Proporción de apartamentos que paga más de 90
Bs?
p= X/N
X= 90
N=50
P= 90/50= 1,8
¿Qué tipo de Datos son? Explique
Son datos cuantitativos porque están representados en
números y se pueden realizar operaciones con ellos.
Gráfico 2
Medidas De Tendencia Central
Son categorías o puntos dentro del
recorrido de la variable, que nos ayudan a localizar valores centrales en un
conjunto de datos. Los promedios no matemáticos, sucede que cuándo estos
promedios se calculan en una distribución de frecuencia, se denominan medidas
de tendencia central o de posición, debido a su situación en la zona central de
la distribución.
Como medidas de tendencia central tenemos:
Media: Es la suma de un conjunto de cantidades
dividida entre el numero de ellas
.
Mediana: Es el punto
dentro del recorrido de una variable que supera a no
mas de la mitad de los datos y es superado por no mas de la
otra mitad.
Moda: Es el dato
de variable que aparece Mas veces en
una distribución.
Ejemplos:
1) Se selecciona
“Una (1)” muestra no ordenada de un texto bibliográfico de estadística, luego
construye lo siguiente: (que sean ejercicios no resulto por el autor y no deben ser ejercicios ya planteados en
las clases pasadas).
1.1-
La tabla de
distribución con todas sus partes, es decir con lo antes visto en el primer
corte y las clases de este corte.
1.2-
Realiza la representación grafica (Una Ojiva,
un polígono y histograma).
1.3-
Calcula las medidas de
Tendencia Central y No Central.
1.4-
Explica que significa
cada valor obtenido dentro del cálculo de las medidas de tendencia central y no
central en tu ejemplo.
v Un
fabricante de cosméticos adquirió una máquina para llenar botellas de perfume
de 3 onzas para probar la precisión del volumen depositado en cada botella hizo
una corrida de prueba con 18 recipientes, los volúmenes resaltantes (en onzas)
de la prueba fueron los siguientes.
3.02-2.89-2.92-2.84-2.90-2.97-2.95-2.94-2.93-3.01-2.97-2.95-2.90-2.94-2.96-2.99-2.97-2.99.
Datos de menor a mayor
2.84-2.89-2.90-2.92-2.93-2.94-2.95-2.96-2.97-2.99-3.01-3.02
Tipo de variable:
Tamaño
de la muestra:
N=18
Rango:
valor min – valor max
R=2.84-3.02=0,18
Moda (Mo): Numero mayor correspondiente a la columna de la frecuencia
absoluta es 3 que corresponde a un total de onzas de 2.97.
Media
aritmética: Sumatoria de fi/n
fi=1+1+2+1+1+2+2+1+3+2+1+1/18= 1
El promedio de botellas de perfumes
es de 1
Mediana
(Me): es el punto medio de la muestra: n/2= 18/2=9
Un número
mayor o igual a 9 en la columna de la frecuencia absoluta acumulada (Fi) seria
10
Fi
|
hi
|
Fi
|
Hi
|
%
|
|
2.84
|
1
|
0,05
|
1
|
0,05
|
5
|
2.89
|
1
|
0,05
|
2
|
0,1
|
5
|
2.90
|
2
|
0,11
|
4
|
0,21
|
11
|
2.92
|
1
|
0,05
|
5
|
0,26
|
5
|
2.93
|
1
|
0,05
|
6
|
0,31
|
5
|
2.94
|
2
|
0,11
|
8
|
0,42
|
11
|
2.95
|
2
|
0,11
|
10
|
0,53
|
11
|
2.96
|
1
|
0,05
|
11
|
0,58
|
5
|
2.97
|
3
|
0,16
|
14
|
0,74
|
16
|
2.99
|
2
|
0,11
|
16
|
0,85
|
11
|
3.01
|
1
|
0,05
|
17
|
0,9
|
5
|
3.02
|
1
|
0,05
|
18
|
0,95
|
5
|
18
|
95%
|
2.
- Selecciona Dos (2) muestras ordenadas de un texto
bibliográfico de estadística (no resueltos por el autor) y solo calcula las
medidas de tendencia central y no central.
2.1-
Un bibliotecario
encuesto a 20 personas al salir de la biblioteca y les pregunto cuántos libros
habían sacado. Las respuestas fueron las siguientes.
1-0-2-2-3-4-2-1-2-0-2-2-3-1-0-7-3-5-4-2
Datos ordenados
0,0,0-1,1,1-2,2,2,2,2,2,2-3,3,3-4,4-5-7
Tamaño de la muestra
N=20
Moda (Mo):
Se toma el
mayor número de la columna de la frecuencia absoluta (fi) el cual es 7 siendo
su categoría xi el 2 eso quiere decir que dos personas sacaron 7 libros.
Media
aritmética: fi/n
fi =
3+3+7+3+2+1+1/20=1
El promedio de libros sacados son de
1.
Mediana
(Me): es el punto medio de la muestra
N/2=
20/2= 10
Se busca un
número en la columna de la frecuencia absoluta acumulada que sea mayor o
igual a 10 el cual seria 13 con
un xi de 2
xi
|
fi
|
hi
|
Fi
|
Hi
|
%
|
0
|
3
|
0,15
|
3
|
0,5
|
15
|
1
|
3
|
0,15
|
6
|
0,3
|
15
|
2
|
7
|
0,35
|
13
|
0,65
|
35
|
3
|
3
|
0,15
|
16
|
0,8
|
15
|
4
|
2
|
0,1
|
18
|
0,9
|
10
|
5
|
1
|
0,05
|
19
|
0,95
|
5
|
7
|
1
|
0,05
|
20
|
1
|
5
|
20
|
100%
|
2.2-
Las
edades de una muestra de estudiantes que asisten a sandhills community college
este semestre son:
19-17-15-20-23-41-33-21-18-20-18-33-32-29-24-19-18-20-17-22-55-19-22-25-28-30-44-19-20-39
Ordenar datos
15-17,17-18,18,18-19,19,19,19-20,20,20,20-21-22,22-23-24-25-28-29-30-32-33,33-39-41-44-55.
Tamaño de la muestra:
N=30
xi
|
fi
|
hi
|
Fi
|
Hi
|
%
|
15
|
1
|
0,03
|
1
|
0,03
|
3
|
17
|
2
|
0,06
|
3
|
0,09
|
6
|
18
|
3
|
0,1
|
6
|
0,19
|
10
|
19
|
4
|
0,13
|
10
|
0,32
|
13
|
20
|
4
|
0,13
|
14
|
0,45
|
13
|
21
|
1
|
0,03
|
15
|
0,48
|
3
|
22
|
2
|
0,06
|
17
|
0,54
|
6
|
23
|
1
|
0,03
|
18
|
0,57
|
3
|
24
|
1
|
0,03
|
19
|
0,6
|
3
|
25
|
1
|
0,03
|
20
|
0,63
|
3
|
28
|
1
|
0,03
|
21
|
0,66
|
3
|
29
|
1
|
0,03
|
22
|
0,69
|
3
|
30
|
1
|
0,03
|
23
|
0,72
|
3
|
32
|
1
|
0,03
|
24
|
0,75
|
3
|
33
|
2
|
0,06
|
26
|
0,81
|
6
|
39
|
1
|
0,03
|
27
|
0,84
|
3
|
41
|
1
|
0,03
|
28
|
0,87
|
3
|
44
|
1
|
0,03
|
29
|
0,9
|
3
|
55
|
1
|
0,03
|
30
|
0,93
|
3
|
30
|
93%
|
Moda (Mo):
Se toma el
mayor número de la columna de la frecuencia absoluta (fi) el cual es 4 siendo
su categoría xi el 20 eso quiere decir que hay 4 estudiantes de 20 años de
edad.
Media
aritmética: fi/n
fi =
1+2+3+4+4+1+2+1+1+1+1+1+1+1+2+1+1+1+1/19=1,57
El promedio de número de estudiantes
es de 1,57.
Mediana
(Me): es el punto medio de la muestra
N/2=
30/2= 15
Se busca un
número en la columna de la frecuencia absoluta acumulada que sea mayor o
igual a 15 el cual seria 15 con
un xi de 21.
Medidas De Dispersión
Las medidas de tendencia central tienen como
objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos
dicen hasta que punto estas medidas de tendencia central son representativas
como síntesis de la información.
Las medidas de dispersión cuantifican
la separación, la dispersión, la variabilidad de los valores de la distribución
respecto al valor central.
Varianza: La varianza es la media aritmética del
cuadrado de las desviaciones respecto a la media de una distribución
estadística. Se representa por S².
Desviación
: Es sin duda la medida de dispersión más
importante, ya que además sirve como medida previa al cálculo de otros valores
estadísticos.
La
desviación típica se define como la raíz cuadrada de la media de los cuadrados
de las desviaciones con respecto a la media de la distribución, es decir, la
raíz cuadrada de la varianza
Coeficiente De Variación
: Cuando se quiere comparar el grado de
dispersión de dos distribuciones que no vienen dadas en las mismas unidades o
que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se
define como el cociente entre la desviación típica y el valor absoluto de la
media aritmética, representa el numero de veces que la desviación típica
contiene la media aritmética y por lo tanto cuanto mayor es el coeficiente de
variación mayor es mayor es la dispersión y menor la representatividad de la
media.
Ejemplos:
Ejercicios medidas de dispersión
1) Calcular todas las medidas de dispersión para la
siguiente distribución
Xi
|
5
|
10
|
15
|
20
|
25
|
ni
|
3
|
7
|
5
|
3
|
2
|
Tamaño
de la muestra
N =5
Rango:
valor max – valor min
R= 25-5=
20 20
Media
aritmética
X = Xi / N
X=
5+10+15+20+25 / 5 = 15
v
Varianza
S2=
(Xi- X)2 *n
N
S2=
(5-15)2 x3+(10-15)2 x7+(15-15)2 x5+(20-15)2 x3+(25-15)2 x2
20
S2= 300+175+0+75+200
20
S2=750 =
37.5
20
v
Desviación
estándar
S
= raíz de varianza
S=
(37,5)= 6,12
v
Coeficiente
de variación
Cv=
s/ x
Cv=
6,12/ 15= 0,408 x 100 = 40,8%
1.1) Los
siguientes datos de muestras se han obtenido para el número de clientes diarios
de la florería “El Tulipán negro”: 25, 38, 20, 48, 29, 32, 24, 50. Calcula la
varianza, la desviación estándar y el rango.
v Tamaño
de la muestra
N =8
v Rango:
valor max – valor min
R=50-20=30
R= 30
v Media aritmética
X = Xi / N
X=
25+38+20+48+29+32+24+50/ 8= 33,25
v Varianza
S2 = (Xi – X)2 (cuadrado) / dividido entre
n
S2=(25-33,25)2+(38-33,25)2+(20-33,25)2+(48-33,25)2+(29-33,25)2+(32-33,25)2+(24-33,25)2+(50-33,25)2
/ 8 = 108,687
v Desviación
estándar
S=
raíz cuadrada de S2 (varianza)
(108,685)= 10,42
1.2) Dada
la siguiente muestra de 20 medidas
15
|
9
|
19
|
7
|
2
|
9
|
6
|
1
|
11
|
9
|
3
|
4
|
0
|
8
|
4
|
21
|
1
|
-7
|
8
|
7
|
a)
Construye un
diagrama de puntos
b) Encuentra la media, la mediana, la varianza y
la desviación estándar
-7;0;1,1;2;3;4,4;6;7,7;8,8;9,9,9;11;15;19;21
N=20
Rango: valor max – valor min
21-(-7)=28
Numero de intervalo
K=1+3,3log(20)=5
Amplitud
28/5=5,6=6
Xi
|
Fi
|
Xi-Fi
|
Xi2-Fi
|
|
-7:-1
|
-4
|
1
|
-4
|
16
|
-1:5
|
2
|
7
|
21
|
42
|
5:11
|
8
|
8
|
64
|
512
|
5:17
|
14
|
2
|
28
|
392
|
17:23
|
20
|
2
|
40
|
800
|
20
|
149
|
1042
|
v
La media
Es la sumatoria de Xi / n
X= -4+2+8+14+20/ dividido entre 20
= 2
v La mediana
20/2=10
v La varianza
S2 = (Xi – X)2 (cuadrado)*ni / dividido
entre n
S2=
(-4-2)2*1+(2-2)2*7+(8-2)2*8+(14-2)2*2+(20-2)2*2
20
S2= 63
v Desviación estándar
S= raíz cuadrada de S2
S= (63)= 7,93
2) Utiliza los ejercicios resueltos en la segunda
asignación y aplicar las medidas de dispersión a cada uno. Explica cada caso?
Ejercicio N°1 (Asignación 2)
Los siguientes datos corresponden
al número de bibliotecarios en las bibliotecas públicas de las diferentes
provincias españolas:
4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4
3 2 4 4 1 10 2 5 3 2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7 12
Ordenados de menor a mayor
v
1-1-1-2-2-2-2-2-2-2-3-3-3-3-3-3-3-3-3-4-4-4-4-4-4-4-4-4-4-5-5-5-5-5-5-6-6-6-6-7-7-7-7-8-8-10-12-12-15-16
N= 50
R=15
K=6
C=3
Xi
|
Fi
|
Xi-Fi
|
Xi2-Fi
|
|
1-4
|
2,5
|
19
|
47,5
|
118,75
|
4-7
|
5,5
|
20
|
110
|
605
|
7-10
|
8,5
|
6
|
51
|
433,5
|
10-13
|
11,5
|
3
|
34,5
|
396,75
|
13-16
|
14,5
|
1
|
14,5
|
210,25
|
16-19
|
17,5
|
1
|
17,5
|
306,25
|
50
|
275
|
2070,5
|
Media
aritmética: es la sumatoria de Xi / n
X=
2,5+5,5+8,5+11,5+14,5+17,5 / 50 = 1,2
Desviación media:
Xi – X / n
Dm=
2,5-1,2+5,5-1,2+8,5-1,2+11,5-1,2+14.5-1,2+17,5-1,2 / 50
Dm= 1,056
Varianza:
S2 = (Xi – X)2 (cuadrado)*ni / dividido
entre N (tamaño de la muestra)
S2=(2,5-1,2)2*19+(5,5-1,2)2*20+(8,5-1,2)2*6+(11,5-1,2)2*3+(14,5-1,2)2*1+(17,5-1,2)2*1
50
S2= 29,62
Desviación
Estándar:
S= raíz cuadrada de S2
S= (29,62)= 54,42
Coeficiente
de variación:
CV= S/X(media aritmética)
El rango de bibliotecarios en las
bibliotecas públicas de las diferentes provincias españolas es
15, La media
aritmética es 1,2 la deviación media 1,056, la
Varianza 29,62, La Desviación Estándar es 54,42 y finalmente el coeficiente de
variación es de 45,35.
Ejercicio N°2 (Asignación 2)
Xi
|
Fi
|
Xi-Fi
|
Xi2-Fi
|
|
80-101
|
91,5
|
4
|
366
|
33489
|
101-120
|
110,5
|
7
|
773,5
|
85471,75
|
120-139
|
129,5
|
9
|
1165,5
|
150932,25
|
139-158
|
148,5
|
13
|
1930,5
|
286679,25
|
158-177
|
167,5
|
8
|
1340
|
224450
|
177-196
|
186,5
|
5
|
932,5
|
173911,25
|
196-215
|
205,5
|
4
|
822
|
168921
|
50
|
7330
|
1123854,5
|
Media aritmética:
X=
91,5+110,5+129,5+148,5+167,5+186,5 +205,5/ dividido entre 50= 20,79
Desviación media:
Dm=91,5-20,79+110,5-20,79+129,5-20,79+148,5-20,79+167,5-20,79+186,5-20,79+205,5-20,79
/ 50
Dm= 17,8794
Varianza:
S2=(91,5-20,79)2*4+(110,5-20,79)2*7+(129,5-20,79)2*9+(148,5-20,79)2*13+(167,5-20,79)2*8+(186,5-20,79)2*5+(205,5-20,79)2*4
/ 50
S2= 16813,6861
Desviación Estándar:
S= raíz cuadrada de S2
S= (16813,6861)2
S=12966,7598
Coeficiente de variación:
CV=
12966,7598/ 20,79
CV=
623,701
El rango de la energía eléctrica para julio de 2004 es
de 131, La media aritmética es 20,79 la deviación media es 17,8794 la Varianza es
16813,6861, La Desviación Estándar es 12966,7598 y finalmente el coeficiente de
variación es de 623,701.
3) De los ejercicios encontrados por ti en la
tercera asignación aplícale las medidas de dispersión y explica que sucede en
cada caso.
Ejercicio N°1 (Asignación
3)
v
Tamaño de
la muestra
N= 18
v
Rango
valor min – valor Max
R= 2.84 – 3.02=0,18
v
Media
aritmética = 1
v
Varianza
S2=(1-1)2+(1-1)2+(2-1)2+(1-1)2+(1-1)2+(2-1)2+(2-1)2+(1-1)2+(3-1)2+(2-1)2+(1-1)2+(1-1)2
/ 18= 0,44
v
Desviación
media
DM=1-1+1-1+2-1+1-1+1-1+2-1+2-1+1-1+3-1+2-1+1-1+1-1
/ 18= 0,33
v
Desviación
estándar
Raíz cuadrada de
s2 = (0,44)2= 0,66
v
Coeficiente
de variación
CV= S/X (media
aritmética)
Cv=0,66/1= 0,66
El rango de botellas de perfume de 3 onzas es de 0,18,
La media aritmética es de 1 la deviación media es de 0,33 la Varianza es de
0,44, La Desviación Estándar es de 0,66 y finalmente el coeficiente de
variación es de 0,66.
Ejercicio N°2
(asignación 3)
v
Tamaño de
la muestra
N= 20
v
Rango valor
min – valor max
R= 0-7=7
v
Media
aritmética = 1
v
Varianza
S2= (3-1)2+(3-1)2+(7-1)2+(3-1)2+(2-1)2+(1-1)2+(1-1)2
/ 20= 2,45
v
Desviación
media
DM= (3-1)+(3-1)+(7-1)+(3-1)+(2-1)+(1-1)+(1-1)
/ 20= 0,65
v
Desviación
estándar
Raíz cuadrada de s
S= (2,45)2= 1,56
v
Coeficiente
de variación
CV= S/X (media aritmética)
CV =1,56 /1
CV=1,56
El promedio de
libros sacados en la bibliotecas rango es de 7, La media aritmética es 1 la
deviación media es 0,65 la Varianza es
2,45, La Desviación Estándar es 1,56 y finalmente el coeficiente de variación
es de 1,56.
Ejercicio N°3
(asignación 3)
v
Tamaño de
la muestra
N=30
v
Rango
Valor Min- Valor Max
R=15-55=40
v
Media
aritmética
X=1
v
Varianza
S2=25
v
Desviación
media
Dm=11
v
Desviación
estándar raíz cuadrada de s2
S= (25)2 = 5
v
Coeficiente
de variación
CV= S/X
CV= 5/1= 5
El promedio de
edades de una muestra de estudiantes de un semestre, el rango es de 40, La
media aritmética es de 1 la deviación media es de 11 la Varianza es de 25, La Desviación Estándar
es de 5 y finalmente el coeficiente de variación es de 5.
CONCLUSIÓN
El primer paso para elaborar
una estadística es conseguir todos los datos a través de la obtención de
una colección de los mismos, que no han sido ordenados. Existen dos tipos de
variables: discreta 8numeros enteros) y continua (números decimales)
Rango o recorrido: es la
diferencia entre el mayor y el menor valor que toma la variable
Existe una distribución de
frecuencia absoluta para datos no agrupados la cual está compuesta por los
valores de variable y por las frecuencias (absolutas)
Así mismo también existe una
distribución de frecuencia para datos agrupados que es utilizada cuando el
número de datos de una muestra es muy grande y se agrupan en los que
menciono los siguientes:
·
Intervalos de clase: corresponde tanto el límite superior como el límite
inferior.
·
Amplitud de un intervalo: es la diferencia entre el límite superior y el límite
inferior
·
Marca de clase o punto medio: es el punto medio del intervalo.
Las medidas de tendencia
central: son las medidas que reúnen en un solo valor, las características de
las distribuciones entre la cuales se pueden mencionar: media, moda
mediana.
La media es el valor que
tendría la muestra si estuviese formada por un solo elemento (sumatoria de las
clases entre el número de la
muestra)
·
Mediana: es el valor que divide a la muestra
·
Mediana: es el valor que divide a la muestra
·
Moda: es el valor que se presenta con la mayor frecuencia ósea el valor más
común.
Las medidas de dispersión
pueden ser absolutas o relativas
·
El Rango que es limite dentro del cual se encuentran todos los valores.
·
Desviación media: variación esperada con respecto de la media aritmética, es
decir que tan cerca o lejos están los puntos de la media.
·
Desviación estándar: es la variación de los datos respecto a la media.
·
Varianza: Esta medida nos permite identificar la diferencia promedio que hay
entre cada uno de los valores respecto a su punto centra..
Para conocer un poco mas sobre en que consiste la Estadística Descriptiva, visualizar las formulas de una maejor manera ingresas a los siguientes link:
http://youtu.be/eqbHjl2vPCw
http://youtu.be/-TGCaLLuEIE
http://youtu.be/8WU0Tz8ueaQ
http://youtu.be/TvyuaUILy78
http://youtu.be/6JUIRzs6P9Y
http://youtu.be/rcsQjIcnGZ4
http://youtu.be/qKZJdk88Pkk
http://youtu.be/DRSJxpKpL30
http://youtu.be/bkLWzRSa7qw
http://youtu.be/kJbt2iB0cGo
http://youtu.be/_gkmXlgUUkg
http://youtu.be/3JRoegqw9v0
http://youtu.be/RomXI3RN6KU
http://youtu.be/ZcxjURk69IA
http://youtu.be/-ZnUSLlUj9A
http://youtu.be/Ravjyy8yQvg
http://youtu.be/S0sVP_rUt9s
http://youtu.be/S0sVP_rUt9s
http://youtu.be/Ravjyy8yQvg
http://youtu.be/dB-QwndRdDc
http://youtu.be/HA80-ywd4EQ
http://youtu.be/eqbHjl2vPCw
http://youtu.be/-TGCaLLuEIE
http://youtu.be/8WU0Tz8ueaQ
http://youtu.be/TvyuaUILy78
http://youtu.be/6JUIRzs6P9Y
http://youtu.be/rcsQjIcnGZ4
http://youtu.be/qKZJdk88Pkk
http://youtu.be/DRSJxpKpL30
http://youtu.be/bkLWzRSa7qw
http://youtu.be/kJbt2iB0cGo
http://youtu.be/_gkmXlgUUkg
http://youtu.be/3JRoegqw9v0
http://youtu.be/RomXI3RN6KU
http://youtu.be/ZcxjURk69IA
http://youtu.be/-ZnUSLlUj9A
http://youtu.be/Ravjyy8yQvg
http://youtu.be/S0sVP_rUt9s
http://youtu.be/S0sVP_rUt9s
http://youtu.be/Ravjyy8yQvg
http://youtu.be/dB-QwndRdDc
http://youtu.be/HA80-ywd4EQ