Tratamiento de datos

Conceptos básicos

Example

Población de dispositivos de almacenamiento:
Variable de interés: X: capacidad real del dispositivo (GB)
Valor de una variable de una unidad: Uno de los dispositivos analizados presentó una capacidad real de 31,7Gb --> x=31,7Gb

Análisis descriptivo

Representaciones (Distribuciones de frecuencia y gráficos)

Variables cualitativas

Variables cuantitativas discretas

Variables cuantitativas continuas

Medidas características de una muestra

Medidas de posición

Medidas de dispersión

Son valores que representan cuánto se alejan del valor central las medidas en general

Regla empírica

Si la distribución es simétrica y campanular, se establece que la mayoría de los datos de un conjunto se encuentran dentro de ciertos intervalos al rededor de la media.
Estos intervalos se construyen sumando y restando un múltiplo de la SD a la media

  • 68% -> 1x SD respecto a la media
  • 95% -> 2x SD respecto a la media
  • 99.8% -> 3x SD respecto a la media

Pasted image 20240530192431.png

Outliers (valores anómalos)

Podemos pensar, a partir de la regla empírica, que un valor es anormalmente extremo (muy grande o muy chico) si su desviación de la media es 3 veces mayor que la SD.

  • $ xx>3sx es outlier

Boxplot

{vm=Q11.5 RIvM=Q3+1.5 RI