Tabulación de Datos
Partes de una tabla en general
TITULO
Que debe ser preciso y conciso
CONTENIDO,
Con la fila de encabezamiento o cabecera (títulos de las columnas)
ademas de columna matriz, con las modalidades o clases de la variable columnas de parámetros
NOTAS EXPLICATIVAS (opcional)
Información como fuente de los datos, abreviaturas, etc.
Forma de tabular:
VARIABLES CUALITATIVAS
Frecuencia absoluta (símbolo : f ó n), que es el nº de veces que aparece cada modalidad
(resultado del recuento). La frecuencia total, de todas las modalidades juntas, se
representa por N.
Frecuencia relativa ( fr) o proporción se obtiene dividiendo la frecuencia de cada
modalidad entre el total de datos. fr = f / N . Los valores posibles oscilan entre 0 y 1.
Suele expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 ó un número
muy cercano al 1, si ha habido redondeos.
Porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100
ó % = (f*100)/N . Suele expresarse con 3 dígitos. La suma de todos los porcentajes
debe dar 100 o un número muy próximo, si ha habido redondeos.
Importante
Frecuencia acumuladas (S f ó Sn ) que se obtienen sumando la frecuencia de cada
modalidad a las frecuencias ya acumuladas anteriormente. En la primera modalidad no
hay nada acumulado de antes y por tanto su frecuencia acumulada será su misma frecuencia.
La última modalidad tiene que dar una frecuencia acumulada igual a N.
Ejemplo
Ejemplo
Variables Cuantitativas
Los datos se agrupan según la frecuencia de los valores. Es lo que se denomina Distribución
de frecuencias. La forma de tabular depende del nº de datos.
Si son pocos (la mayoría de autores pone el tope en 30) , se hace una tabla simple de
forma similar a lo visto para las variables CL. Cada dato equivale a una modalidad. Al final
nos quedaremos con la f de cada número y si se prefiere también con el %. Los números
se ordenan de menor a mayor o de mayor a menor. La tabla puede hacerse en sentido
vertical u horizontal.
excluyentes y que todos los datos puedan se asignados a una clase. Ahora bien, la experiencia
ha ido introduciendo una serie de normas, que permiten hacer esta agrupación de la forma
más racional posible.
Pasos:
1) calcular el RANGO ( R )
R = (límite real superior del dato mayor – límite real inferior del dato menor)2) calcular el Nº DE CLASES
Es función de N (tamaño de la muestra) y no hay reglas fijas.
En general: “entre 4 y 20” .
Ayudas Formula: NC = 1+ 3,32*logN ó 1+1,44*lnN
3) calcular la AMPLITUD (i)
i = R / NC
así queden englobados todos los datos
Como probamos con 2 ó 3 opciones, conviene elegir una i que sea impar, pues así el
punto medio de la clase (pm ó c) tendrá una cifra menos.
En principio todas las clases deben tener la misma amplitud.
4) Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible
entre ambos extremos de la distribución fijando así los límites definitivos de la tabla.
5) Construir el esquema de la tabla, poniendo columnas de
CLASES ó LIMITES TABULADOS
LIMITES REALES
PUNTO MEDIO (pm ó c)
FRECUENCIA ( f ó n)
FRECUENCIA RELATIVA ( fr)
PORCENTAJE (P o %)
FRECUENCIAS ACUMULADAS ( f ó n)
FRECUENCIAS RELATIVAS ACUMULADAS ( fr)
PORCENTAJES ACUMULADOS ( %)
6) Hacer el RECUENTO de datos y rellenar las casillas correspondientes
7) Escribir la TABLA DEFINITIVA.
Son obligadas las clases y la frecuencia absoluta, pudiendo añadir otros parámetros, si se considera que mejoran la información. Una tabla excesivamente prolija resulta más difícil de leer. Por tanto la norma es: poner todo lo necesario,pero no más de lo necesario.
Importante
Los límites de las clases son los valores inferior y superior de cada clase. (Límite inferior y
límite superior). Hay que distinguir entre los límites tabulados (LT) y los límites reales (LR).
Los límites tabulados son los datos originales que abren y cierran una clase. Los límites reales
son el límite real inferior del primer valor (LRI) y el límite real superior del último (LRS).
El punto medio o centro de la clase (pm ó c) representa a la clase cuando se hacen operaciones
matemáticas. Es la media de los límites. Da lo mismo tomar los límites reales que los tabulados,
ya que ambos dan el mismo resultado.
En una distribución con todas las clases de la misma amplitud las diferencias entre los puntos
medios, los límites inferiores y los límites superiores de dos clases consecutivas valen lo
mismo y son igual a la amplitud de la clase (i). Esto facilita la construcción de la tabla.
Ejemplo
Tabular los 70 valores siguientes:
40 55 19 51 62 15 20 44 60 60 45 15 21 31 13 44 41 43 51 35 50 33 25 16 61
14 14 59 59 59 20 23 25 29 29 59 58 54 50 49 39 27 37 23 24 58 27 28 57 32
32 34 57 56 35 35 54 36 43 46 52 50 49 42 43 46 40 39 31 48
-dato mayor: 62, cuyo LRS es 62,5
-dato menor: 13, cuyo LRI es 12,5
-recorrido (R): 62,5-12,5 = 50 ó (62-13)+1 = 50
-nº de clases (NC): 7 u 8
-amplitud (i):
-si NC = 7 , i = 50/7 = 7,1 ® 8 (par)
-si NC = 8 , i = 50/8 = 6,2 ® 7 (impar)
-nos quedamos pues con NC = 8 de amplitud 7, que es impar
-sobras: (8*7) – 50 = 6 , que repartimos así: 3 abajo y 3 arriba
la 1ª clase empezará en 10 (13-3)
la última terminará con el 65 (62+3)
Ya se puede construir el esquema de la tabla (clases, LR y punto medio) y proceder al recuento
de los datos que corresponden a cada clase, para completar las otras columnas


0 comentarios:
Publicar un comentario