Publicaciones de Estudiantes
Autor: Princess Elizabeth Osorio De Texeira
Titulo: General Statistics
Area:
Pais:
Perfil:
Programa:
Disponible para descarga: Yes
Ver Más Publicaciones Estudiantiles Clic aquí
Diseminar información, ideas innovadoras y conocimientos académicos es una función importante para Atlantic Internacional University. Publicaremos noticias, artículos, comentarios y otras publicaciones de nuestros estudiantes y otros colaboradores. Si desea contactar al autor por motivos profesionales favor enviar su petición por este medio.
Para conocer más de la iniciativa de Acceso Abierto de AIU haga Clic aquí.
INTRODUCCIÓN
Podemos mencionar lo que realmente pasa por nuestra mente cuando
pensamos o escuchamos hablar de estadística ; creo que la primera
reacción es
ubicar números en nuestra cabeza, grupos de personas , grupo de
objetos, etc.
Mas parece ser que existe mucho mas que una simple ubicación numere-
ral dentro de la estadística, pues el análisis de la misma es
conjunto variado de
métodos cuya finalidad es analizar simultáneamente conjuntos de
datos
multivariantes en el sentido de que hay varias medidas para cada
individuo u
objeto estudiado.
podemos mencionar que la razón de la estadística radica en un mejor
entendimiento del fenómeno objeto de estudio obteniendo información
que los
simples métodos numéricos son incapaces de conseguir.
Lo que personalmente pretendo en esta materia es dar una breve
visión general
de dicho conjunto de técnicos exponiendo brevemente , cual es su
finalidad
,ilustrando con ejemplos posibles .Presentando como objetivo de mi
lección lo
siguiente :
Pretendo definir que es el análisis multivariante y cuales son sus
objetivos ,
pretender clasificar las distintas técnicas multivariantes
,distinguiendo entre
métodos de dependencia , interdependencia y estructurales e
indicando , de forma
resumida los objetivos de las diversas técnicas multivariantes
presentadas en la
presente materia .
De la misma forma e encontrado importante indicar y por supuesto
estudiar
cuales son las etapas a seguir en la resolución de un problema de
análisis
multivariante.
4
ANALISIS MULTIVARIANTE
Presentaremos el análisis multivariante como el conjunto de métodos
estadísticos
cuya finalidad consiste en la analizacion simultáneamente de
conjunto y datos
multivariantes en el sentido que hay variables medidas para cada
individuo u
objeto a ser estudiado.
Los objetivos del análisis multivariantes pueden sintetizarse en dos
puntos
importantes:
1) Proporcionar métodos cuya finalidad es el conjunto de datos
multivariantes que el análisis estadístico uní y bidimensional es
capaz de conseguir.
2) Ayudar al analista o investigador a tomar decisiones optimas en
el
contexto en el que se encuentre teniendo en cuenta la información
disponible por
el conjunto de datos analizados .
Diremos pues que los tipos de técnicas multivariantes son:
1) Métodos de dependencia.
2) Método de interdependencia.
3) Métodos estructurales.
Presentaremos los tres puntos anteriores.
Comenzaremos por el Método de dependencia:
Suponen que las variables analizadas están divididas en dos grupos
los cuales son
a) variables dependientes
b) variables independientes.
5
El objetivo de esta consiste en determinar si el
conjunto de variables
independientes afectan las variables dependientes , sino también
como están
relacionadas las variables de los dos grupos entre si.
METODOS DE DEPENDENCIA:
Los métodos de dependencia los clasificaremos en dos grandes
subgrupos :
a) cuantitativas.
b) cualitativas.
Presentaremos las variables cuantitativas y sus técnica a se aplicar
de las
siguientes forma :
VARIABLE
CUANTITATIVA.
ANALISIS DE
ANALISIS DE
ANALISIS DE
CORRELACION
REGRESION.
SUPERVIVENCIA
VARIANZA
CANONICA.
Análisis de regresión:
Esta variable consistirá en una técnica adecuada si en el análisis
hay una o
varias variables dependientes métricas cuyo valor depende de una o
varias
variables independientes métricas, son muy útiles por ejemplo cuando
se intenta
predecir el gasto anual en cine de una persona a partir de su nivel
de ingresos,
6
niveles educativos también puede ser útil , para
la presentación de sexo y edad en
grupos de personas o trabajadores, etc.
Análisis de supervivencia:
Esta variable consistirá en una técnica adecuada o similar de
regresión pero
con la diferencia de que la variable independiente es el tiempo de
supervivencia
de un individuo o objeto.
Podremos usar como ejemplo en el estudio de este análisis cuando
queramos
predecir el tiempo de permanencia en el desempleo de un individuo a
partir de
su nivel de estudios y de su edad.
Análisis de la varianza:
Esta variable consistirá y será utilizada cuando las situaciones en
las que las
muestras total esta dividida en varios grupos basados en una o
varias variables
independientes no métricas y las variables dependientes analizadas
son métricas y su
objetivo es averiguar si hay diferencias significativas entre dichos
grupos en
cuanto a las variables dependientes se refiere.
en el aspecto de la salud podemos hacer uso de este análisis , como
por
ejemplo cuando se quiere o mejor dicho se busca respuesta a las
siguientes
preguntas:
¿Hay diferencia en el nivel de colesterol por sexo?
¿Afecta también el tipo de ocupación?
Correlación Canónica
En esta variable consistirá en el objetivo relacionado
simultáneamente varias
variables métricas dependientes e independientes calculando
combinaciones line-
ales de cada conjunto de variables
También podríamos mencionar como buen ejemplo:
al desear analizar como están relacionadas el tempo dedicado de
trabajo y el
ocio de una persona con:
7
- su nivel de ingreso
- su edad
- su nivel de educación.
nota: información adquirida de
: www.estadistica.es/libro/node6.htm
VARIABLE DEPENDIENTE CUALITATIVA.
Anteriormente estudiamos la variable cuantitativa, a continuación
presentare-
mos la variable cualitativa de la siguiente forma:
Variable
Cualitativa.
Análisis
Modelos de
Análisis
Discriminante
Regresión logística
Conjoint
INTERPRETACION DE CUADRO ANTERIOR:
Análisis discriminante:
Esta variante se refiere a la técnica que proporciona reglas de
clasificación
optimas de nuevas observaciones de las que se desconoce su grupo de
procedencia basándose en la información proporcionada los valores
que en ella
toman las variables independientes .
8
Como por ejemplo:
Determinar los ratios financieros que mejor permiten discriminar
entre empresas
Rentables y poco rentables.
Métodos de regresión logística.
Esta variable se refiere a los modelos de regresión en los que la
variable
dependiente es no métrica . Se utilizan como una alternativa al
análisis
discriminante cuando no hay normalidad.
Análisis Conjoint.
Es una técnica que analiza el efecto de variables independientes no
métricas
sobre variables métricas o no métricas. Con la diferencia con el
análisis de la
Varianza radica en dos hechos:
* La variable dependiente puede ser no métrica y
* Los valores de las variables independientes o métricas fijadas por
un
analista
nota: en otras disciplinas se conoce con el nombre de Diseño de
Experimentos.
Usaremos el siguiente ejemplo:
" una empresa quiere dise ar un nuevo producto y para ello necesita
especificar la forma del envase , su precio , el contenido por
envase y su
composición química.
Presenta diversas composiciones de estos cuatro factores. 100
clientes
proporcionan un ranking de las combinaciones que se le presentan .Se
quiere
determinar los valores ptimos de estos cuatro factores"
METODO DE INTERDEPENDENCIA
Se pueden clasificar en dos grandes grupos según que el tipo de
datos que
analicen sean métricos o no métricos .
9
Datos métricos se podrán usar las siguientes
técnicas.
1- Análisis factoriales y análisis de componentes principales.
2-Escala multidimencionales.
3-Análisis Cluster.
Descripción de los puntos anteriores:
1-Análisis factorial y análisis de componentes principales:
Se utiliza para analizar interrelaciones entre el numero elevado de
variables
métricas explicando dichas interrelaciones en términos de un numero
menor de
variables denominadas factores o componentes principales ,en este
punto es
necesario citar el siguiente detalle :
* Las variables denominadas factores = si son inobservables.
* Las variables o componentes principales = si son observables.
Diremos por ejemplo:
Si un analista financiero quiere determinar la cual es el estado de
la salud
financiera de una empresa a partir del conocimiento de un numero de
ratios
construyendo varios índices numéricos que definan su situación , el
problema se
resolvería mediante un análisis de componentes principales.
En el caso de un test de inteligencia usado por un psicólogo para
determinar los factores que le caracterizan su inteligencia como
individuo ,
utilizaría para resolver este problema un análisis factorial.
2- Escalas multidimencionales :
Su objetivo es transformar juicios de semejanza o preferencia en
distintas
representadas en un espacio multidimencional .Como consecuencia se
construye un
mapa en el que se dibujan las pocisiones de los objetivos comparados
de forma
que aquellos percibidos como distintos .
Como por ejemplo:
10
Al decidir analizar , en el mercado de
refrescos, las percepciones que un grupo
de consumidores tiene acerca de una lista de refrescos y marcas con
el fin de
estudiar que factores subjetivos utilizan un consumidor a la hora de
clasificar
dichos productos .
3- Análisis cluster:
Su objetivo es clasificar una muestra de entidades ( individuos o
variables )
en un numero pequeño de grupos de forma que las observaciones
pertene-
cientes a un grupo sean muy similares entre si y muy disimilares del
resto
a diferencia del análisis discriminante se desconoce el numero y la
compo-
cision de dicho grupo.
Usaremos como ejemplo:
Clasificar grupos de alimentos:
-pescadores.
-carnes
- vegetales
- leche. etc.
En función de sus valores nutritivos. Si los daos no son métricos se
pueden
utilizar , además de las escalas multidimencionales y el análisis
cluster , las
Siguientes técnicas.
Análisis
De
Corresponcia
Modelos
Log-lineales
Métodos
estructurales
11
Definición del organizador anterior
Análisis de correspondencia:
Se aplica a la tabla de contingencia multidimencionales y persigue
un objetivo
similar al de las escalas multidimencionales pero representando
simultanea-
mente las y columnas de las tablas contingencia.
Podemos usar el ejemplo de un paro dentro de una empresa textil ,
tomando
en cuenta el área de vivienda de cada trabajador ,para detectar mas
o menos el
gasto de transporte necesario por cada empleado ,sexo , edad y el
nivel de
estudios de cada trabajador parado.
Modelos Log-lineales.
Se aplica a tabla de contingencia multidimencionales y modelizan
relaciones
de dependencia multidimencional de las variables observables
denominadas que
buscan explicar las frecuencias observadas.
Métodos estructurales:
Analizan las relaciones existentes entre un grupo de variables
representadas por
sistemas de ecuaciones simultaneas en las que se suponen que algunas
de ellas
se miden con error a partir de otras variables observables
denominadas indica-
dores .
Diremos pues que los métodos utilizados constan en dos partes:
1- un modelo estructural que especifica las relaciones e dependencia
existencia
entre las constructor latentes.
2- un modelo de medida que especifica como los indicadores se
relacionan
con sus correspondientes constructor.
Para analizar como se relacionan los niveles de utilización de los
servicios de una
empresa con las percepciones que sus clientes tienen de ella.
12
ANALISIS MULTIVARIANTE:
Las etapas de un análisis multivariante pueden sintetizarse en seis:
1- objetivos de análisis
.
2- diseño de análisis
3- hipótesis del análisis
4- realización del análisis
5- interpretación de los resultados
6- validación del análisis
Explicación de los puntos anteriores:
1-Se define el problema especificando los objetivos y las técnicas
Multivariantes que se van a utilizar. El investigador debe
establecer el
problema en términos conceptuales definiendo los conceptos y las
relaciones
de dependencia o de interdependencia .Con todo esto se determina las
va-
riables a observar.
2-Diseño de análisis
Se determina el tamaño muestra , las ecuaciones a estimar , las
distancias a
calcular y las técnicas de estimación a emplear .Una ves determinado
todo esto
se proceden a observar los datos.
3-Hipótesis del análisis.
Se evalúan las hipótesis subyacentes a la técnica multivariante.
Dichas hipótesis
puede de normalidad, linealidad , independencia ,mocedasticidad,
etc.
También se debe decir hacer con los datos perdidos.
4- Realización del análisis.
13
Se estima el modelo evalúa el ajuste a los datos .En este paso
pueden aparecer
Observaciones atípicas o influyentes cuya influencia sobre
estimaciones y la
bondad de ajuste se debe analizar.
5-Interpretación de los resultados:
Dichas interpretaciones pueden llevar a reespecificciones
adicionales de las va-
riables o del modelo con lo cual se puede volver de nuevo a los
pasos
anteriores mencionados en el ejemplo 3 y 4.
6-Validación del análisis.
Consiste en establecer la validez de los resultados obtenidos
analizando si
los resultados obtenidos con la muestra se generalizan a la
población de la que
procede. Para ello se puede dividir la muestra en varias partes en
las que el
modelo se vuelve a estimar y se comparan los resultados . Otras
técnicas que
se pueden utilizar aquí son las técnicas de remuestreo
A continuación concretaremos en que consistirán dichas etapas para
un análisis de
Regresión múltiple:
Análisis de regresión múltiple
Los puntos a considerar en este análisis son los siguientes:
1- Objetivo el análisis.
2- Diseño del análisis.
3- Hipótesis del análisis.
4- Realización del análisis.
5- Interpretación de los resultados.
6- Validación del análisis.
Explicaremos a continuación:
14
1-paso:
Se define el problema especificando los objetivos y las técnicas
multivariantes que se van a utilizar .
El investigador debe establecer el problema en términos conceptuales
definiendo los conceptos y las relaciones fundamentales que se van a
investigar.
Siendo los objetivos del análisis en este caso, como por ejemplo ,
predecir el
gasto de una persona a partir de su nivel de ingreso , nivel
educativo, sexo y
edad.
Lo cual nos permitirá entender mejor cuales son las pautas de
comportamiento
De la población.
La variable dependiente seria el gasto en el cine
La variable independiente seria el resto.
2-Paso:
En este paso , diseño del análisis se decidirá como elegir la
muestra , el tamaño
de la misma y como medir las variables implicadas en el análisis
*El gasto en cine podría medirse como el gasto anual en cine medido
en
la pesos ( moneda filipina).
*El nivel de ingreso podría medirse con una variable ordinal , dadas
las
informaciones precisas sobre este tipo de variable
*El nivel educativo seria una variable ordinal; el sexo una variable
binaria
Y la edad una variable cuantitativa medida en anos.
Asi como por ejemplo:
Un tamaño muestras se elegirá en función de la potencia que se
quiera dar a la
regresión múltiple.
15
Con un tamaño muestral de 100 observaciones se podrían detectar en
una región
múltiple lineal , las relaciones con un coeficiente de correlación
múltiple de
aproximadamente igual a 0.3 con una potencia de 0.8% utilizando un
nivel de
significación igual a 0.01 .
Conviene , además , que el numero de observaciones al numero de
parámetros a estimar sea lo suficiente amplio para estimar los
parámetro para
estimar los Parámetros del modelo con el menor error posible.
3 -Paso.
En este paso, Hipótesis de análisis, consiste en comprobar la
linealidad de la
relación , la normalidad y la homocedasticidad . No hay datos
perdidos y se deben
estudiar la posible existencia oulieres en cada una de las
variables.
4- -paso.
En este paso , realización del análisis , se puede utilizar el
estimador de mínimos
cuadrados del que se conoce su distribución muestras bajo hipótesis
de normali-
dad .Dicho estimador coincide con el máximo verosímil y es eficiente
.
Se puede también utilizar el método de regresión paso a paso para
determinar las
variables independientes a incluir en la regresión .
5- Paso.
En este paso, Interpretación de los resultados , se interpretaría el
valor de los
coeficientes obtenidos a su como su signo teniendo cuidado con la
posible
existencia de multicolinealidad
6- Paso.
En este paso , validación de análisis , se divide la submuestra de
tamaño 50 y se
Vuelve a estimar la ecuación en cada submuestra comparando los
resultados.
nota: información adquirida de
: www.ftp.medprev.estadistica.uma.es
16
RESUMEN:
Resumiendo este tema podemos comprender, que la Estadística
seriamente
puede ser estudiada , ubicada, presentada como una materia amplia
con capacidad de
abordar muchas y diversas áreas en nuestra educación , no solo
enfocarla y ence-
rrarla a números como es la idea que muchos nos hacemos cundo
escuchamos la
palabra : estadística.
Podemos mencionar ,como ya lo hemos hecho anteriormente , que el
análisis
Multivariante es el conjunto de métodos estadísticos cuya finalidad
es analizar
simultáneamente conjuntos de datos multivariables , en el sentido
que hay varias
Variables medidas para cada individuo u objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno
considerado
como un objeto de estudio obteniendo información que los métodos
estadísticos
Univariantes y bivariantes son incapaces de conseguir.
El método estadístico univariante y bivariante ; puede dividirse en
tres
grandes grupos según el papel que juegan en el análisis las
variables consideradas:
1- Método de dependencia
2- Método de interdependencia
3- Métodos estructurales.
Concluimos también que para llevar a cabo un análisis de este tipo
se deben
utilizar o seguir los siguientes pasos :
1- Establecer los objetivos del análisis.
2- Diseñar el análisis
3- Evaluar las hipótesis subyacentes a la técnica a utilizar.
4- Realizar el análisis.
5- Interpretar los resultados obtenidos
6- Validar dichos resultados.
De esta forma podemos concluir esta primera parte de nuestra materia
, usando
como bese teórica lo mencionado en estas primeras paginas.
17
REPRESENTACION:
Análisis de regresión
Análisis de Superviven-
cia.
Correlación canónica
Métodos de
Dependencia
Dependiente Análisis discriminante
Regresión logística
No métrica
Análisis Conjoint
A. Comp. Principales
Métodos de
Análisis factorial
TEGNICAS
Escalas Multidimen-
MULTIVARIANTES
interdependencia
cionales.
Análisis Cluster
Datos no Análisis de
Métricos
Correspondencias.
Modelos Log-lineales.
Escalas Multidimen-
cionales.
Análisis Cluster.
Métodos estructurales.
18
Como mencionamos anteriormente , existe una idea o mejor ducho un
concepto
popular que acompaña al concepto de estadística , decíamos que es
aquel que se rela-
ciona con datos numéricos presentada de forma ordenada y
sistemática.
Esta idea esta cada vez mas extendida debido a la influencia de
nuestro entor-
no y que cada vez esta más extendida debido a la influencia de
nuestro entorno
ya que hoy en día es casi imposible que cualquier medio de difusión
, periódico,
Radio, televisión, etc, no nos aborde con cualquier tipo de
información estadística
sobre accidentes de trafico , índice de crecimiento de población ,
turismo , tendencias
políticas, etc.
Es decir que en la actualidad de este siglo XXI , con la ayuda de
esta asigna-
tura podemos detectar y conocer mas que números , podremos detectar
por ejemplo:
- Se puede predecir el gasto en consumir de un cliente a partir de
su nivel
de ingreso , su nivel educativo , su edad y su estilo de vida .
- Cuales son los factores que determinan que un individuo encuentre
trabajo
antes que otro.
- Se puede analizar si existe discriminación de sexo en una empresa.
- Cuales son los atributos o característica de un producto que mas
influyen en
la decisión de compra de un conjunto de consumidores.
- Es muy útil en el momento de predecir si una empresa va a quebrar
en fun-
ción de un conjunto de indicadores financieros.
-Es posible la clasificación de un grupo de alimentos en función de
sus valores
nutritivos .
- Cuales son los atributos que un consumidor utiliza para distinguir
las
distintas marcas y modelos de coches deportivos.
En realidad depuse de pensar en todas esta posibilidades que
poseemos
adentrándonos en el mundo mas especifico como en el campo de la
investigación
de las ciencias sociales : Medicina, Biología, Psicología,
etc,empezamos a entender
que la Estadística no solo es algo mas , sino que se convierte en la
única
herramienta que hoy por hoy, permite dar luz y obtener resultados ,
y por tanto
beneficios , en cualquier tipo de estudio ,cuyos movimientos y
relaciones , por su
variabilidad intrínseca , no pueden ser abordadas desde la
perspectiva de las leyes
deterministas.
19
La opinión de la Universidad de Málaga , España, en relación al
concepto de
Estadística , Métodos y Aplicaciones es la siguiente:
"Podríamos definir el concepto de Estadística desde el punto mas
amplio como
la ciencia que estudia como debe emplearse la información y como dar
una
guía de acción en situaciones practicas que entrañan incertidumbre .
La estadística se ocupa de los métodos y procedimientos para:
-recoger datos.
- clasificar datos.
- resumir datos.
- hallar datos.
- hallar regularidades y analizar los datos.
Estos puntos anteriores son clave cuando la variedad e incertidumbre
sea una
causa intrínseca de los mismos ; asi como de realizar inferencias a
partir de ellos ,
con la finalidad de ayudar a la toma de decisiones y en su caso
formular
predicciones .
También podríamos clasificar la estadística como: descriptiva.
Se podrá clasificar como Estadística descriptiva cuando los
resultados del análisis
no pretenden ir mas allá del conjunto de datos, e inferencias a
partir de ellos , con
la finalidad de ayudar a la toma de decisiones y si es necesario
formular
predicciones.
Por tanto clasificaremos la estadística como descriptiva cuando los
resultados del
análisis no pretende ir mas allá del conjunto de datos , e
inferencia cuando el
objetivo del estudio es derivar las conclusiones obtenidas a un
conjunto de datos
mas amplio.
Estadística descriptiva: Describe , analiza y presenta un grupo de
datos utilizando
métodos numéricos y gráficos que resumen y presentan la información
contenida
en ellos.
Estadística inferencial: Apoyándose en el calculo de probabilidades
y a partir de
datos muéstrales, efectúa estimaciones, decisiones , predicciones u
otras generaliza-
ciones sobre un conjunto mayor de datos.
nota; información obtenida de
: www.bioestadística.unmalaga.com
20
VARIABLES ESTADISTICAS:
Cuando hablemos de variables haremos referencia a un símbolo , que
pueda tomar
cualquier modalidad de un conjunto determinado , que llamaremos
:conjunto de la
variable o rango .
Variables (X, Y, A, B,....)
Modalidades Valor
En función del tipo de dominio , las variables las clasificamos del
siguiente modo:
Variable cualitativa.
Variable cuasicuantitativa
VARIABLES
Variable cuantitativa
discreta.
Variable cuantitativa
continua.
21
VARIABLES CUALITATIVAS:
Cuando las modalidades posibles son de tipo nominal . Por ejemplo
una variable de
color:
A = {"rojo," "azul,", "amarillo"}
VARIABLES CUASICUANTITSTIVAS:
Son las que ,aunque sus modalidades son de tipo nominal , es posible
establecer un
orden entre ellas . Por ejemplo, si estudiamos la llegada a la meta
de un corredor
en una competición de 20 participantes, su clasificación C es tal
que:
c= { 1º, 2º
,3º,.......20º}
Otro ejemplo de variable cuasicuantitativa es como ejemplo , el
dolor , D , que
sufre un paciente ante un tratamiento clínico:
D= {"Inexistente", "poco intenso", "moderado", "fuerte"}
VARIABLES CUANTITATIVAS:
Son las que tienen por modalidades cantidades numéricas con las que
podamos
hacer operaciones aritméticas. Dentro de este tipo de variables
podemos distinguir
dos grupos:
1- Variables discretas.
2- Variables continuas.
22
Variables discretas:
Cuando no admiten siempre una modalidad interinada entre dos
cualesquiera
de sus modalidades .Un ejemplo es el numero de caras
X ,
obtenido en el lanza-
miento repetido de una moneda .Es obvio que cada valor de la
variable es un
numero natural:
X = N.
Variables Continuas:
Cuando admiten una modalidad intermedia entre dos cualesquiera de
sus
modalidades , el peso
X de un niño al nacer . En este caso
los valores de las
variables son números reales , es decir :
X = R
Ocurre a veces que una variable cuantitativa continua por
naturaleza, aparece
como discreta. Este es el caso e que hay limitaciones en lo que
concierne a la
precisión del aparato de medida de esa variable , si medimos la
altura en metros
de personas con una regla que ofrece dos decimales de precisión ,
podemos
obtener .
X= {.........1.50, 1.51, 1.52, 1.53,......}
En realidad lo que ocurre es que con cada una de esas mediciones
expresamos
que el verdadero valor de la misma se encuentra en un intervalo de
radio 5.10.
Por tanto cada una de las observaciones de X representa más bien un
intervalo
que un valor concreto.
Tal como hemos citado anteriormente , las modalidades son las
diferentes situacio-
nes posibles que puede presentar la variable.
23
LAS TABLAS ESTADISTICAS.
Consideramos las tablas estadísticas de
N individuos ,
descrita según un carácter o
variable
C cuyas modalidades han sido agrupadas en un numero
K de clases ,
que denotados mediante C1, C2, .......Ck.....
Para cada una de las clases C
i , i = 1 , ......, k ,
introducimos las siguientes
magnitudes:
1- Frecuencias absolutas.
2- Frecuencias relativas.
Presentaremos las frecuencias absolutas de la clase C
i es el
numero n
i , de
observaciones que presentan una modalidad perteneciente a esa clase.
Presentaremos las frecuencias relativas de la clase C
i es el
conciente
f i entre
las frecuencias absolutas de dicha clase y el numero total de
observaciones es
decir :
fi =n
i
n
Diremos pues que
f i es el tanto por uno de las observaciones
que están
en la clase C
i multiplicado por 100% representa el porcentaje
de la población
que comprende esa clase.
Frecuencia absoluta acumulada.
n
i se calcula sobre variables cuantitativas o casi
cuasicuantitativas, el numero
de elementos de la población cuya modalidad es inferior o
equivalente a la moda-
lidad C
i.
n
i = n1 + n 2+....+ n
i = i nj
j =1
24
Frecuencias relativas acumuladas:
F
i se calcula sobre variables cuantitativas o
cuasicuantitativas, siendo el tanto por
uno de los elementos de la población que están en alguna de las
clases y que
presentan una modalidad inferior o igual a la c
i ,es decir :
i
F
i = n
i = n
i+....+ n i = f
i + ....+ f
1+.....+
f i = nj
n n j=1
Como todas las modalidades son exhaustivas e incompatibles ha de
ocurrir que :
k
= n
i = n1 + n 2 + .....n
k = n
i=1
Resumiendo presentaremos los anteriores datos de la siguiente forma:
Frecuencia Absoluta (n
i ): Numero de elementos que presentan
la clase
xi
Frecuencia relativa:
fi = n
i /N.
i
Frecuencia absoluta acumulada: N
i = nj.
j=1
Frecuencia relativa acumulada: F
i = N
i / N = fj
j=
i
De esta forma llamaremos distribución de frecuencia al conjunto de
clases junto
a las frecuencias correspondientes a cada una de ellas .
nota: información obtenida de
www.mty.itesm.mx.htm
25
TABLA ESTADISTICA.
Una tabla estadística sirve para presentar de forma ordenada las
distribuciones
de frecuencias. Su forma general es la siguiente:
Frecuencia
Frecuencia
Modalidad
Frecuencia abs. Frecuencia Rel. Abs.
Rel.
Acumulada
Acumulada
C
f i
n
i
N
i
F
i
C
f1 = n1
N1 = n1
n1
n
n1
f j = nj
Nj = n1+... n j
Fj =n =
f1+...
f j
C
n j
n
f k =nk
Nk = n
F k = 1
C
n
k
n
n
1
26
CALCULO DE DATOS EN UNA TABLA.
Calcularemos los siguientes datos que faltan en la siguiente tabla:
I I
i-1---
i
f i
N
i
n
i
0--- 10
60
f1
60
10--- 20
n2
0,4
N2
f 3
20 -- 30
30
170
30---100
n
0,1
N4
100 ---- 200
f 5
200
n
De esta forma sabemos que la ultima frecuencia acumulada es igual a
total de
observaciones , luego :
n = 200.
Como N3 = 170 y n 3 = 30, entonces
N2 =N3 - n 3 = 170 30 = 40
Además al ser n1 = 60, tenemos que
N2 =N2 n1 = 140 60 = 80.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos
la frecuencia
relativa correspondiente.
n4
f 4 = n n4 =
f4 . n = 0,1 × 200 = 20
27
ASI:
N4 = n 4 + N3 = 20 + 170 = 190.
Este último cálculo nos permite obtener
n 5 = N 5 N 4 = 200 - 190 = 10.
Al haber calculado todas las frecuencias absolutas , es necesario
obtener las
relativas :
f1 = n1 = 60 = 0,3
n 200
f3 = n3 = 30 = 0,15
n 200
f5 = n5 = 10 = 0,05
n 200
Escribamos entonces la tabla completa:
l --- l
i-1
i
n
i
f i
N
i
0 ----- 10
60
0, 3
60
10 ----20
80
0,4
140
20 ---- 30
30
0,15
170
30 ---- 100
20
0,1
190
100 --- 200
10
0,05
200
200
Información obtenida
:
www.e-biometria.com
28
CRÍTICAS Y CONTROVERSIAS.
En los campos en los que se desarrollan o se toma en cuenta los
datos estadísticos
existen algunas controversias como por ejemplo en los campos de
psicología y en
los campos de la medicina , especialmente con respecto a la
aprobación de nuevas
Medicamentos, según las investigaciones obtenidas e
n
www.es.wikipedia.org
Las criticas de la aproximación de prueba de hipótesis se han
incremen-
tado en los anos recientes . Una respuesta ha sido un gran énfasis
en el p- valor
en vez de simplemente reportar si la hipótesis fue rechazada al
nivel de
significancía a dado. De nuevo , sin embargo , este resumen la
evidencia para un
efecto pero no el tamaño del efecto.
Una posibilidad es reportar intervalos de confianza , puestos que
estos
indican el tamaño del efecto y la incertidumbre .Esto ayuda a
interpretar los
resultados , como el intervalo de confianza para un a dado indicando
simultánea-
mente la significancía estadística y el efecto de tamaño.
El valor " p" mencionado anteriormente y los intervalos de confianza
son
basados en los mismos cálculos fundamentales como aquellos para las
correspon-
dientes pruebas de hipótesis . Los resultados son presentados en un
formato más
detallado, en lugar del si - o - no de las pruebas de hipótesis y
con la misma
Metodologías estadísticas.
Hay una percepción general de que el conocimiento estadístico es
demasiada-
mente y con mucha frecuencia intencional y mal usado ,encontrando
formas de
interpretar los datos que sean favorables al presentador .
Sin embargo , las criticas mas fuertes vienen del hecho que la
aproximación
de pruebas de hipótesis ampliamente usadas en muchos casos
requeridos por ley
o reglamentación , obligan una hipótesis a ser favorecida , y puede
también
exagerar la importancia de pequeñas diferencias en estudios grandes.
Una diferen-
cia que es altamente significativa puede ser de ninguna
significancia practica.
29
COMPUTACION ESTADISTICA.
El rápido y sostenido incremento en el poder del calculo de la
computación
desde la segunda del siglo XX ha tenido un sustancial impacto en la
practica
de la ciencia estadística .Viejos modelos estadísticos fueron casi
siempre de la
clase de los modelos lineales. Ahora, complejos computadores junto
con apropia-
dos algoritmos numéricos , han causado un renacer del interés en
modelos no
lineales y de creación de nuevos tipos tales como modelos lineales
generali-
zados y modelos multinivel.
El incremento en el poder computacional también ha llevado al
crecimi-
ento en popularidad de métodos intensivos computacionalmente basados
en
remuestreo , tales como teste de permutación y de bootstrap ,
mientras técnicas
como el muestreo de Gibas han hecho los métodos bayesianos mas
accesibles .
La revolución en computadores tiene implicaciones en el presente
como en el
futuro de la estadística " experimentales " y " Empíricas " . Un
gran numero
de paquetes estadísticos están ahora disponibles para los
investigadores.
Los sistemas dinámicos y teoría del caos , desde hace una década
empezó
a interesar en la comunidad hispana , pues en la anglosajona de
Estados Unidos
estaba ya establecida la conducta caótica en sistemas dinámicos no
lineales con
350 libros para 1997 y empezaban algunos trabajos en los campos de
las
ciencias sociales y en aplicaciones de la física.
Es muy difícil olvidar que en este siglo es muy importante
considerar las
novedades y los factores modernos que determinan el mundo de la
información
el poder de compra , venta , negocios , habitantes, enfermedades,
avances en el
comercio , en la salud etc.. que es lo que rige nuestras vidas y el
ritmo de
nuestra sociedad , en base a esos puntos podemos realmente mencionar
que la
intervención y colaboración de la computación estadística no deja
ser una
enormes ventajas del siglo presente , para quien frecuentemente
necesita usar este
método informativo tiene sus ventajas para quien esta dentro de las
actualidades
informativas , podrá también presentar dificultad para aquellos que
carecen de la
debida información y se resisten a los conceptos y medios modernos.
nota: información adquirida de
www.es.wikipedia.org
30
LA INFERENCIA ESTADISTICA:
Es el proceso de extraer conclusiones sobre la población basándose
en la información de una muestra extraída de esa población .
Población:
Será llamada población al conjunto total de objetos o individuos que
pre-
sentan características comunes observables, definidas en un cierto
tiempo y lugar.
puede ser:
1- finita.
2- Infinita.
Se le llamara Unidad al estudio de toda la población y cada elemento
.
- Al numero de elementos que conforman la población lo
simbolizaremos :
con una N.
-A la medida descriptiva que se calcula a partir de todas las
unidades de la
población se la denomina : Parámetro.
Muestra:
Parte representativa de la población que se selecciona para ser
estudiada ya
que la población es demasiado grande como analizarla en su
totalidad.
Puede ser:
Representativa: los elementos que la integran se encuentran en la
misma
proporción que en la población .
Aleatoria:
Es cuando cada elemento de la población tiene la misma probabilidad
de ser
seleccionado.
Al numero de elementos que conforman a la muestra se los simboliza
con : N.
31
Denominaremos Estadística:
A la medida descriptiva que se calcula usando todas las unidades de
la
muestra de la población y será variable por que depende de muestras
.
HIPOTESIS ESTADISTICA.
Hipótesis nula: es la afirmación de que nada esta sucediendo , no
existe
diferencia ni discrepancia con lo que se afirma . ( H o )
Hipótesis alternativa: es la afirmación que el investigador espera
que sea
cierta .Es lo contrario a la hipótesis nula. (H 1)
La hipótesis que se investiga por lo común es la que se expresa como
H 1 y se llega a la conclusión de que la hipótesis investigada es
verdadera
Se dirá que: Una hipótesis será rechazada si se puede demostrar
estadistica-
camente que los datos observados son muy poco probables de ocurrir
si la
Teoría fuera cierta. Aquí se dice que los datos observados son
estadísticamente
Significativos.
ERRORES POSIBLES:
Tipo 1:
Es el error que se comete cuando se rechaza H o , siendo ella
cierta. (e 1
)
Tipo 2:
Es el error que se comete cuando no se rechaza la H o y siendo ella
falsa,
consecuentemente H 1 cierta . ( e 2 )
Se debe aceptar que en todo momento se existe la posibilidad de
cometer errores
cuando se pretende o desea obtener alguna información , cual quiera
que esta sea
de el tipo que este se refiera.
32
Para evitar cometer errores cometer errores se debería minimizar P e
1
( probabilidad de cometer un e 1 ) y P e 2 ( probabilidad de cometer
e 2 ) a la
vez hasta llevarlos a 0 , esto es imposible .Pero se han
desarrollado dos técnicas
de minimizar las probabilidades lo mas posible .
TECNICAS:
1- Se elige un numero alfa (nivel de significancía ) entre 0 y 1 ( 0
a 1 ).
con el nivel de significación se determina la región de rechazo o
regla de
decisión . Y debe cumplirse que Pe 1 < a
2- P Valué: es la probabilidad asociada a la información .La regla
de decisión
es rechazada H o si P- Valué a . Cuando mayor sea P- valué mayor es
la
evidencia a favor de H o.
ENSAYO DE HIPOTESIS:
CLASIFICACION:
-Unilaterales: (>, <)
* Por derecha (>)
*Por izquierda (<)
-Bilaterales (#)
Inferencia Estadística:
Es el proceso de extraer conclusiones sobre la población basándose
en la
información de una muestra extraída de esa población.
Población: Conjunto total de objetos o individuos que presentan
características
comunes observables, definidas en un cierto tiempo y lugar.
33
Puede ser Finita o Infinita:
Cuando estudio toda la población a cada elemento de la misma se lo
denomina
unidad .'
Al número de elemento que conforman la población se los simboliza
con N.
A la medida descriptiva que se calcula a partir de todas las
unidades de la
población se le denomina : Parámetro . y es fijo ( por que se
analizaban a todos
los elementos )
Muestra:
Parte representativa de la población que se selecciona para ser
estudiada ya
que la población es demasiado grande como analizarla en su
totalidad.
Puede ser:
Representativa: Los elementos que se integran se encuentran en la
misma
proporción que en la población.
Aleatoria: Es cuando cada elemento de la población tiene la misma
probabilidad
de ser seleccionado.
Al numero de elementos que conforman a la muestra de la población se
le
denomina : Estadística .
Razones por la cual se recurre al rastreo.
* Analizar a la población resulta muy costoso por la relación costo
/ beneficio.
* Analizar a la población completa lleva mucho tiempo.
*Analizar el objetivo de estudio se lo destruye, pero lo cual si
analizamos a toda
la población nos quedamos sin unidades.
* La población a analizar es infinita , por lo cual es imposible
analizarla en su
totalidad.
*La población a analizar es inaccesible.
34
PROBABILIDAD:
Es la interpretación de la frecuencia relativa, aplicada en las
condiciones
exactamente repetibles.
" Es la proporci n de veces que ocurrirá el evento si el proceso se
repetirá
muchas veces bajo las mismas condiciones " esto implica la
frecuencia relativa
del largo plazo del resultado.
Proporción de veces que ocurre en el largo plazo un suceso , o sea
la
frecuencia relativa con la que ocurre el evento .
Es una medida de la posibilidad que tiene un suceso de presentarse
ante la
repetición de un suceso aleatorio .La probabilidad debe estar entre
0 y 1.
Existen tres enfoques de probabilidad:
Clásica o a priori: Su método se apoya por en-
tero en el razonamiento abstracto, no efectúa ex
pedimentos reales porque la lógica se considera
suficiente para todas las respuestas.
P (A) : Nº de resultados favorables de que ocurra
el suceso posible.
Frecuencia o posteriori: su método se apoya en el
en calculo de la probabilidad basado en los re-
Objetiva
sultados brindados por el experimento aleatorio,
Probabilidad
es decir debe ser llevado a cabo.
P (A): Nº de veces que se presenta el resultado favo-
rable.
Nº de veces que se repite el experimento.
SUBJETIVA: Se aplica a casos aislados y se basa en la creencia
de la persona sobre un hecho presento o no .
Para dicha afirmación la persona se basa en sus co-
Nocimientos previos.
35
PROCESO O EXPERIMENTO ALEATORIO:
Es un proceso repetitible del que se conoce el conjunto de
resultados posi-
bles, pero no puede predecirse con seguridad un resultado exacto.
Hay un patrón de comportamiento predecible a largo plazo, (que la
frecuencia
relativa de un resultado se acerque a un valor constante).
Simulación: Es la imitación comportamiento del azar usando
artificios como ge-
negadores de numerosos aleatorios , tablas de números al azar, etc.,
a través de la
cual se puede estimar la probabilidad de un evento.
PASOS BASICOS PARA CALCULAR UNA PROBABILIDAD:
1- Especificar un modelo para los sucesos elementales y fenómenos
aleatorios
Subjetivos.
2- Delinear como simular un suceso elemental y como representar una
repetición del proceso aleatorio .
3- Simular muchas repeticiones y estimar la probabilidad de un
evento con
la frecuencia relativa.
Los elementos necesarios para hablar de probabilidad son:
- Espacio muestra : Es una lista de todos los posibles resultados de
un
experimento aleatorio cuyo suceso gobierna todos los resultados
aleatorios de un
experimento.
-Evento: Subconjunto del espacio muestras y se denota con imprentas
mayúsculas: A , B , C ...
Se dice que ha ocurrido un evento. A si al repetirse una ves el
proceso alea-
torio ocurre cualquiera de los resultados de A.
Unión de los eventos:
A o B o en ambos. "amenos uno de los 2 ha ocurrido"
nota: información obtenida de
www.cran.r-proyect.org
36
GRAFICACION DE CUALITATIVAS.
Cuando se trata de variables cualitativas el calculo de frecuencias
acumuladas no
tiene sentido .
Los gráficos mas comunes para variables cualitativas son los
gráficos de
sectores y el grafico de barras o pictogramas. También se puede
graficar por
medio del diagrama de pareto para el cual se debe calcular las
frecuencias
acumuladas.
Diagrama de pareto:
Proporciona mas información visual que los diagramas de barras y de
sectores
circulares cuando la variable categórica tiene muchas categorías.
Es un tipo especial del grafico de barras horizontales donde las
respuestas
catego-rizadas se grafican en orden descendente de frecuencia y se
combinan
con un polígono acumulado en la misma escala .
El eje vertical de la izquierda contiene la frecuencias o % .
El eje vertical derecho las categorías del interés.
Y el de la izquierda los % acumulados de 0 a 100
y las barras separadas uniformemente son del mismo ancho.
Lo importante al ver este diagrama se buscan las magnitudes de las
distintas
en las alturas de la barras que corresponden a la s categorías
adyacentes decreci-
entes y los % acumulados de las mismas .
Graficas de barras:
Muestra el % de ítems que salen en cada categoría. Muestra una barra
para
cada categoría , el ancho de las barra no tiene importancia pero
debería ser
uniforme
Las barras pueden ser verticales u horizontales.
Pueden ser utilizados para representar 2 categorías cuantitativas al
mismo
tiempo lo que se llama grafico de barras compuesto.
37
PICTOGRAMAS:
Las barras son remplazadas por diagramas relacionadas con algún
tópico ejemplo
Casas, personas.
Graficación de variables cuantitativas:
Cuando se encuentran una distribución de frecuencias de variables
cuantitativas
Comúnmente se les grafica por medio de:
1-Grafico de frecuencia
2-Grafico de tallo y hoja.
Graficación de variables cuantitativas
3-Histograma.
4- Grafico de cajas o
Bigotes.
A continuación explicáremos detenidamente cada uno de los cuatro
puntos
mencionados y clasificados anteriormente:
38
GRAFICOS DE FRECUENCIA:
Es una manera rápida de mostrar la distribución de los datos sobre
una recta .
cada punto o valor de la variable esta representada por una X sobre
la escala
Adecuada.
Puede ser horizontal o vertical. La frecuencia o numero de valores
que se re-
presentan en otra escala.
Pasos para su construcción:
1- Dibujar una recta.
2- Marcar los valores máx. y min. sobre un eje real.
3- Completar la escala p/ los n. con incrementos igualmente
espaciados.
4- Mascar cada valor observado con una x sobre la escala adecuada
5- Si hay 2 o mas ítems c/ el mismo valor debemos apilarlos
verticalmente.
Si una o más observaciones están alejadas del resto ,estas se
denominan valores
Externos.
Un conjunto de datos separados del resto de los datos forman una
concentra-
ción conglomerado o racimo.
2-DIAGRAMA DE TALLO Y HOJA:
Es una forma rápida de mostrar la distribución de un conjunto de
datos con un
n. relativamente pequeño de unidades .
Ventajas: retiene los valores reales de la variable.
HOJA: Ultimo digito
TALLO: Lo que esta antes de la hoja.
No se usa cuando se tiene muchos datos , las hojas se ordenan de
menor a
mayor. Y si comparamos 2 procesos de menor a mayor en espejo lo que
sirve
Para comparar las disimetrías.
39
3- HISTOGRAMA:
Opción para mostrar la distribución de una variable cuantitativa
cuando la
cantidad de datos es grande , no mantiene los valores numéricos
actuales
.Muestra la distribución de una variable a través de la frecuencia o
porcentaje
del total de valores que hay en todo el rango de la variación.
Pasos de su variación:
1- Identificar el min. y el máx. Color observado de la variable,
calcular el rango
(Xn - Xi).
2-Dividir el rango en clases o intervalos de igual amplitud( las
clases deben cubrir
el total del rango de los valores, sin superponerse)
3-contar la n de observaciones que caen cada clase = frecuencia
absoluta
4-dibujar el eje horizontal y marcar las clases sobre el.
5- en el eje vertical se puede representar la frecuencia absoluta ,
la proporción o %
6- dibujar un rectángulo ( barra vertical ) sobre cada clase con la
altura igual a la
frecuencias , proporción o %.
4 -Grafico de serie o tiempo.
Grafica las observaciones contra el tiempo o en el orden n el que se
obtuvieron.
Los puntos consecutivos se conectan con líneas para ayudarnos a
apreciar si la
distribución es pareja o parece cambiar con el tiempo.
TENDENCIA:
Creciente o decreciente, cambios en la ubicación del centro, cambios
en la
Variación o dispersión.
COMPONENTE ESTACIONAL O CICLO: Patrones del comportamiento que se
repiten con regularidad.
40
RECOMENDACIONES:
En el desarrollo de estas paginas con contendido estadístico ,
números y letras que
aparentemente son palabras sin sonido . Es decir , que en algunas
circunstancias
podremos pensar que lo que vemos es muy distante a lo que
pretendemos ,
cuando buscamos datos que nos informen de cualquier realidad .
Creo que si se pretende en alguna medida hacer uso de la estadística
se
necesita mucha atención y dedicación al comienzo de la búsqueda de
lo descono-
cido y también, por que no decirlo , el coraje de aceptar cualquier
de los datos
obtenidos en nuestra investigación ESTADISTICA .
Lo referido anteriormente lo relaciono con el hecho de existir
circunstancias en
las que empresas o entidades privadas prefieren en desconocer cual
es la realidad
de sus empresas o cual será el futuro de ellas según los datos
recolectados y
obtenidos en el momento que se decide hacer uso de la estadística.
El aceptar el resultado de cualquier hipótesis sea negativa o
positiva nunca debe
ser un motivo de desaliento , en el caso de obtener detalles
negativos , por la
razón que el objetivo de la estadística es solo el de revelar cual
es la condición
de aquel que desee saberla , para aportar la mejor luz posible hacia
una
respuesta o actitud y decisión que sea necesaria tomar .
El animo de la estadística es informativo , nunca será el desanimar
o desclasificar
de esta forma es necesario el uso frecuente de ella para el
bienestar de todos y
de todas las identidades necesitadas de un poco de claridad e
información para lo
que ellos emprenden.
" Quien pone atenci n a los consejos siempre estará mucho mas seguro
" ...Este
pensamiento muy personal me hace meditar en la estadística como la
consejera
numeraria . El buscar un poco de consejos numerales siempre trae sus
ventajas
para aquellos que quieren caminar en sus empresas o vidas laborales
de una
forma mas real mas cerca de su "verdad" .
Personalmente ubicaría la estadística como un eje o un pilar que no
debe de
faltar peralte la verdad y como una guía de soporte funcional .Podrá
ser para
muchos de nosotros una verdadera señalización que nos indicara
cuando y donde
parar o avanzar o estar precavidos . Siempre y cuando los valores de
información
Sean totalmente verídicos.
41
Ejemplo practico:
Hemos estudiado que la es estadística generalmente es definida como
la rama de
la matemática que se ocupa de reunir, organizar y analizar datos
numéricos y a
su ves a resolver problemas como el diseño de experimento y la toma
de dedici-
ones .
Pero en realidad lo que se busca con este trabajo , no es
simplemente un tema
mas de los exigidos ,sino hacer a su vez que nuestros conocimientos
se arraiguen
las definiciones básicas de la estadística y que no simplemente
quede ahí , en
la teoría , si no que aprendamos a aprovecharlo en nuestra vida
cotidiana , ya que
seguramente lo necesitaremos , siempre es bueno tener nociones de
estadística.
Peralte esta conclusión anterior mencionada , presentare de una
forma , breve y
usando objetivamente de la sencillez que la estadística en algún
caso ofrece . Un
medio llamado figuras y barras estadísticas para la representación
de población
filipina que vive dentro de el centro de rehabilitación remar.
El problema a representar es el siguiente:
El centro de Rehabilitación Remar , se encuentra en 54 países al
rededor del
mundo , con 25 anos de existencia , su origen es Español mas después
de sus
primeros 6 anos de éxito y crecimiento fue extendiéndose hacia otros
continentes
como Asia, filipinas.
En el país de Filipinas , dicho centro de rehabilitación , fue
iniciado con un grupo
de 5 extranjeros en el ano de 1998 , el problema a ser representado
de forma
estadística es cuantas personas han sido ayudadas en dicho centro de
acogida
desde 1993 hasta el resiente ano: 2007 , deseamos saber cual a sido
su ritmo , si
en alguna medida se a crecido positivamente o si se pude representar
el ano en el
cual hubieron menos o ningunos ingresos de personas , a pedir ayuda.
Representaremos de forma grafica, usando como ejemplo un mes y ano
especifico. Para muestra.
Representaremos de forma grafica , cual ha sido el tipo de personas
mas
favorecidas , niños , adultos mujeres o hombres .
42
REPRESENTACION GRAFICA:
Se trata de representar , mediante un circulo, la totalidad o el
100% de los datos de
la muestra y , en el mismo , mediante sectores circulares ,se
representara los valores
circulares ,se representaran los valores parciales.
Ejemplo:
Elabore un grafico circular , y los datos serán los referentes a los
componentes
de la totalidad de los activos de la fundación Remar filipinas.
Estos datos fueron obtenidos de una entrevista a la administración
central de
dicho centro quien nos proporcionó la información de el ano 2006.
Activo circular: $ 300.000,00 = 25.00%
Fondos especiales: 60.000,00 = 5.00%
Inversiones: 120.000,00 = 10.00%
Activo fijo tangible: 15.000,00
Intangibles 90.000,00 = 7.50%
Cargos diferidos: 24.000,00 =2,00%
Otros activos 1.2000.000, 00= 100.00%
A continuación trataremos de demostrar estos datos adquiridos
de forma grafica circular , la cual fue entregada a la dirección
Central de dicho organización, por motivos de ser información
contabilidad interna.
43
GRAFICO CORRESPONDIENTE AL ANO 2006 DE CENTRO
DE REHABILITACION EN FILIPINAS
1%
7% 5% 2%
10%
25% 49.25%
49.25 % = ACTIVO FIJO
25 % = CIRCULANT
10% = INVERSION
7 % =INTANGIBLE
5% = FONDOS ESPECIALES
2 % = DIFERIDO
1% =OTROS.
44
GRAFICO O HISTOGRAMA:
Para dibujar un grafico histograma , se medirán los intervalos de la
clase de las
ábsidas de un plano cartesiano , y las frecuencias de sobre el eje
de las
ordenadas , en forma de barras.
Ejemplo:
Datos mensuales del ano 1999.
total
Enero ........................................... 379 personas
ingresadas
Febrero.......................................... 270 personas
incesadas
Marzo ..........................................382 personas
ingresadas
Abril .............................................72 personas
ingresadas
Mayo ............................................22 personas
ingresadas
junio ............................................. 4 personas
ingresadas
julio ..............................................15 personas
ingresadas
agosto ............................................144 personas
ingresadas
septiembre .......................................129 personas
ingresadas
octubre ........................................... 43 personas
ingresadas
noviembre ........................................ 28 personas
ingresadas
Diciembre ........................................ 2 personas
ingresadas
Esta información corresponde a los ingresos obtenidos en Filipinas
en un centro de acogida , ayuda a marginados y personas con diversos
problemas.
Objetivo es recoger información del mes que mas ingresos a ocurrido
a
dicho centro.
45
PERSONAS
370
382
270
144
129
72
43
28
22
15
4
2
En. Feb. Mar. Ab. May. Jun. Jul. Agost. SEP. Oct. Nov. Dic.
Meses.
46
CONCLUCION:
Se ha mencionado que la estadística es la ciencia que facilita el
estudio
de datos masivos , pasa de esa maneta a sacar conclusiones valederas
y
efectuando razonablemente su representación.
La estadística tiene el arte de presentar visualmente sus contenidos
des-
de formas completas, complejas hasta la mas sencilla representación
de un
grafico del cuál de una visión de conjunto clara y de mas fácil
apreciación
asi como para describirlo y compararlos.
Personalmente creo que una de sus importancias es el empleo de los
procesos
Estadísticos se hace posible el ordenamiento, clasificación,
presentación, y el
estudio claro de datos en ocurrencias masivas , las cuales en alguna
medida pre-
sentan una apariencia confusa , cambiante , afectado por
interacciones diversas y
variaciones aparentes ; que de otra forma no se podrían apreciar.
En el transcurso de esta materia he comprendido que en principio de
la esta-
distica solo era aplicada al estudio y valuación numérica de
manifestaciones in-
herentes al que le interesase, mas en realidad cuando coloquialmente
se habla de
estadística , se puede pensar en una relación de datos numéricos
presentada de
forma ordenada y sistemática consecuencia del concepto popular que
existe sobre
el termino y que he podido notar que cada ves esta mas extendido
,debido a la
influencia e nuestro entorno.
Personalmente como estudiante me parece la estadística no como un
todo; es
decir que comprendo que es una materia de la cual se puede estudiar
y aplicar
junto con otras materias porque solo cuando nos adentramos en un
mundo mas
especifico como es el campo de la investigación de las ciencias
sociales :
Medicina , Biología , personalmente he comprendido que la
estadística no solo
es algo mas , sino que se convierte en una herramienta que , hoy en
días ;permite
dar resultados , y por tanto beneficios , en cualquier tipo de
estudio , cuyo movimi-
entos y relaciones por su variabilidad no pueda ser perspectiva de
leyes
determinantes.
En conclusión personal: Es la ciencia que estudia con su información
y da una guía
de acción en situaciones practicas que entrañan incertidumbre.
47
Cuestionario
1-¿En que consiste un análisis multivariante?
El análisis multivariante consiste en el conjunto de métodos
estadísticos , que
poseen sus respectivas finalidad de análisis.
2 - ¿Mencione cual es la finalidad del análisis multivariante?
La finalidad de análisis multivariante consiste en analizar
simultáneamente conjunto
de datos multivariantes, en el sentido que hay variables medidas
para cada indivi-
duo u objeto a ser estudiado.
3- ¿ Haga mención de tres tipo de técnicas multivariantes?
1- Modelo de dependencia
2- Modelo de independencia
3- Modelo estructural.
4- ¿En que consiste el objetivo de análisis en una multivariante ?
Se define el problema especificando los objetivos y las técnicas,
multivariantes
se van a utilizar.
5- ¿ Cual es el papel del investigador en el análisis de una
Multivariante?
El investigador debe establecer el problema en términos conceptuales
definiendo los conceptos y las relaciones de dependencia o
interdepen-
dencia.
48
6--¿Que es un Espacio muestra?
Es una lista de todos los documentos , posibles resultados , de un
experimento
Aleatorio cuyo suceso gobierna todos los resultados.
7 -¿ En que consiste un diagrama de pareto?
Proporciona mas información visual que los gráficos de barras y de
sectores
circulares cuando las variables categorías tienen muchas categorías.
8- ¿En que consiste un grafico de barras?
El grafico de barras muestra el % que salen en cada categoría
.Muestra una
barra para cada categoría ,el ancho de la barra no tiene importancia
pero debería
ser uniforme.
9-¿Por que medio de variables cuantitativas comunes se encuentra una
distribución?
1- grafico de frecuencia
2 grafico de tallo y grafico de hoja
3-Histograma.
4-De caja de bigotes.
10-: ¿En que consisten los métodos estructurales?
Consiste en el análisis existente entre un grupo de variables
representadas
por sistemas de ecuaciones simultaneas en las que se supone que
alguna de
ellas se miden con error a partir de otras variables observables
denominadas
Indicadores.
49
BIBLIOGRAFIA:
www.aiu.edu
www.bioestadistica.unmalaga.com
www.cran.r-proyecto.org
www.e-biometria.com
www.es.wikipedia.com
www.etsu.edu.com
www.medprev.estadistica.uma.es
www.mty.itesm.mx.htm
www.sas.com/offices/europe.com
50
x. yo tengo una Pág. de cobertura similar al ejemplo 89 o90 del
suplemento
x. yo incluí una tabla de contenidos con la Pág. correspondiente
para cada componente.
x. yo seguí el contorno propuesto en la Pág. 91 o 97 del suplemento
con todos los títulos
x. yo use referencias a través de todo el documento según el
requisito de la Pág.92 sup.
x. mis referencias están en orden alfabético al final según el
requisito de la Pág. 92 sup.
x. Cada referencia que mencione en el texto se encuentra en mi lista
o viceversa.
x. yo utilice una ilustración clara y con detalles para defender mi
punto de vista.
x .yo utilice al final apéndices con gráficos y otros tipos de
documentos de soporte
x. yo utilice varias tablas de estadística para aclarar mis ideas
mas científicamente
x. yo tengo por lo menos mas de 50 Pág. de texto.
x. Cada sección de mi doc. Sigue una secuencia lóg. (1, 2,3.......)
x.Yo no utilice caracteres extravagantes, dibujos o decoraciones.
x. yo utilice un lenguaje sencillo y claro para todos.
x. yo utilicé Microsoft Word/u otro programa similar para chequear y
eliminar errores de
gramática.
X .yo no viole ninguna ley de propiedad literaria al copiar
materiales que pertenecen a
otra gente.
x.yo afirmo por este medio que lo que estoy sometiendo es totalmente
mi obra propia.
Princess Elizabeth 02/ septiembre de 2007
firma del estudiante
fecha de entrega de materia.
51