Home
Topics ▾
- Algebra
  - Equations & Systems
  - Polynomials & Factoring
  - Functions & Graphs
- Geometry
- Calculus
- Trigonometry
- Statistics & Probability
  - Descriptive Statistics
  - Probability & Distributions
  - Statistical Inference
- Linear Algebra
- Number Theory
  - Primes & Divisibility
  - Modular Arithmetic
  - Cryptography
- Differential Equations
  xBZqdZD2quD3xeN27aSbnHANOMJZAts7qdW360GRcfoxc/i/Cjs2CRxj44aIov6nwqoaW777+ruPz0zSaz+k0vSvLcWvwMj/kJFuVGfV3IwNiVoX9a2hOlG01sePCrHjVEJbTZA3fV8MMjH26BFHWwfQ+N7rC7XitHUyxWHzYHaK5Z0b4hEDBjIr81AzKH8gOFelBThOUE684+rno6t4Mf/yPGLC/YH+/jpP4W1trY3sB1i3iaVs+7HLoPgqqivVdiVIwLwDH51q6nR3mx4Rsq0/ji44ruHgJ7Fug9EqEMrKDwWQVKSYX0OkK/hM8s6RsNkuxE+YMzC4wkscro+QaEL5gKefi0OQ223eAtoW6wwn3t1QSe8fINX6FJ5NktfNNilI+L5cwHq/qq2numAV7ymASi3aGxd0AqN3Gsg09oDj02A7TdhRIBALKcKpG8Z1FbelEUkCqxOvtnCWoJP+T8dfgDUoOt1k2r/SP7BDcIm2Rvdec66++7Fj732Ay1e0H7fJwP1T+CcW8KanVE/m+z2S5s1XhLmKq3KY6hOFSys/fa34WVI9hsDl0JqI7TSUyZ7W4hhJP4AiMk9sysJo1SZ7lxC/Fr3ov5bkDcRBWcPHojCaALbmnfqx6EWtDz27KpN00cvj/1V96CYGbxQR4Nsp91J9ichBeSXviLAOG/MfFJ72lUc+kdq7k88VSFON3bcDacZ7/Jck1wL7aWAow87fUifAZZeo0V3BZrWcdE9eJ3HYPHVWHDgmSrks/mQCRNleP40YMHNDqko90eALGf+YLpPBPXI4+cL13p3/muvPw0DnQLnob84NaXaPHJLZc18qLk8jHcbqBFPGOTyoLqjw7RFGHvEBpliJeo5cVnELBhxGnCT/5gQ6YUjxJnXGDkI1IfWDscT72EKD4xu5HyqWy8
Formulas
Resources
About

Descriptive Statistics

Summarize, visualize, and understand data before diving into inference.

Measures of Center

qizLtahggS7LBWp3GJnVL51duQsxYbppGZqUQGoSQr1Rb6TOmXZdYoUMhx7VTc+5NrM4n9GOql2fd47mysYtYRWXNqR8eNIGnXBWZ2fqBzds0P9fvWOUYE+EfiP4rEX5Eir1jOxhZjgbI055lOWLlbxQGQeVhZX865T9IPMnXs8tQK5+IzeDNSz/LrkgsqtpMpq3gu54rplr6euXInsTC/V9uWIWl1zjqKz7Gy3EOi7a0tCUpnU30BzU/f+am2SFNmkSOxIorF71DAt4S3l7ZNEtKTc7OgGjiJ41Lg5moqYGp0xVDN9vcKt4doZXR5XpFg+I5XjrqInCavXp42RRaOSzVSI4MjI/qfHPifcGlXMMgAnL6BWyV/AbNnPYkaoiibfSVITeEy3orEYwBFS+XuxpCdrf49MxmXg371yLojKKSaaV2wcH4DHn1oE7dhd2VJkg2h9m/3WNk62N0uRBLb45nvHAiu9xK/nlXFtF72ilmfHA9u+JWWS55i/2grnWu2e7R9ExkIPhIEc4WKYX044HzrZy/9DaFE0C15yvKa29thtttcAGxBpMk9tTqQIf+xyHTflVpfj6ah0RPaWJ5QoFmyoXugf1f5Uh3/azw1wg6eVdkm3g80DwWBYETWnblvnwRZJ0wg4QdkAzXradn1nQfAPJSckWKCRJNCPCZydEsAWLZXdb8OwWOnh851uQlQPwhOpFuHBErERBRP9iz1Bsc2AUTf9hU42xJkgDCJQPZzt3xWSZuYRYG6EGYXpBrpAbNXADeFjlGc86yo1PVGCltUfqnobg2v4IY2wHkr4KFqnECVkPoe34m7Kl5ZvRcdBC7HbG5/Q8pbwD+RHhDHP2MHdHVLjXiqScaMlaGSB5FveUCbPU9VZF6Zc+W4CmdkYWLjaVpJv0svuznUxO1RHxX

Mean: x̄ = (Σxᵢ)/n
Median: middle value when sorted
Mode: most frequent value

The mean uses algebraic operations; it's sensitive to outliers. The median is more robust. For symmetric distributions, mean ≈ median ≈ mode.

h+ke6cSUfROCI0+e9oRnzS/27hgTv6G7a0OEg+olyAu6NX00cCtzuQ1fbJ/W3WT6vPUsPH08EucN0RibeepLO/MMhV78hkQqXYpD55/kWWb9wl8V3lgZeMcuBotoPTp029TTIeXAcw1WYUXBjoONGffKnmO/rxT9J4gNIPjYOd+mHVdTwurGGAjhztp4nMwvCuLFcoy+J41IU7oXolxJMHJKX6j9wEgx3hzwGSkg/i/fkIfKPdPCf5rKwgv5hvXe+/1Vynr7wuQXtsjyIarAne7ivJNvSA3PO7IrxF+bX9ym8hh/yLxKAScMJsCtX1d6OJVWzeq8EXs+mT64E6A4/MV/WJgA53DVMT1F4iZ/uKqxDSsUDBexQXMt31GenIIgjXb003ISUg+yxS84fXlJir916zFgInmo0ijycpLqMs26rWeBANJjihlvegABWD75zNzThNeNT3OQPXjffY2AwMxMs6N7/+gHqKUY6/lu96QJEC+4Tic8HHJmNT8Z5ewVuGGjv1PerFJEKqGVL/g4RSuCQ6cBJ457h/ZZMnTpGQ5ekig7c1SSDbZZCtUQ3/p0JsNRpRZVd7HqGRbsSFgiJht0gSTCqZu1fj1mZnyTsxY4ysH8SAtmrLO07FuDcGP4H1fng9PRb7UOCmm3DRTO9TYY+6i3aUo69Fx3mDefOkmWkERyS6ViPnjR31Ce8Y5xjGRdJGzHy377GhuUSRVY+sxbBSjmicAk7adWyWNXjyVebu7IrvFaiPx3qHZRyYdZkl1r9AFrtFeVJ3EyLvIj2gNvCsfRWZzcj+dcwIbADojU9M5//YmnyTqddLlsv5gCyYqQONV5WdK6Oi8ckib3wyR2wRdl1YIk+AIztigMnG2xaFgbSOhoTj6d+wCSMB9Mbsk2rsrW5hwp9ouXY09mCre+s4

Measures of Spread

Variance: σ² = Σ(xᵢ − x̄)²/n
Standard deviation: σ = √(σ²)
Range: max − min
IQR: Q3 − Q1

Variance measures average squared deviation from the mean. Standard deviation has the same units as the data — it's the most widely used spread measure. These connect to the normal distribution via the 68-95-99.7 rule.

Example: Data: 4, 7, 8, 10, 11

Mean = 40/5 = 8

Deviations: −4, −1, 0, 2, 3. Squared: 16, 1, 0, 4, 9

QQFEyMQoR0d/smAMfw6IEuw62aWTEdx43EHmDaMRyjg04xLbOG0vgiiVe72On6uuIUk+gu/hJ4J9ZhMgJC1QGCAilugOcZMqaqheqG2pf887wBggmVDMzJ+r1ifRIlrIsenY3a9pmYY4PFWAfCfctyG1Se0iZqWWtOgpHHA5pgb+8cQwM711OdtG/Z1rwjI/why35XymFrsrDi5545jpG8NtMQpItmhw+I9I1MdJRMjglQvbjkfWQnGcZf+dUSij9G89CiF+ehgrSBHUa/Y/Tre/KvebZ+H4d68x2QtRUKQl7m1oou9qbt39kwWAHgEbyXX2HM0uFA1pz4y2wBQXVIe2bKkCPKm16acWF5SWD94YNoHhI5jMSARzemCEEUCottDSxRO+TOSqW5t99vvsnxhoLpQLGhYbQ/xjjshBlw2qexKv/OKriqPNuKLVPzuw0GyfD/3nvG4DW7+HGWjKj/SLyjAxfiKw5RrZUoAuP8Gz+/3jeeuLTafT0funvU6bhjwTO9oyXa9AjEDMh9bDiL2vWnKsC5HcN7pw4Dqx1OV8uBV1c+mwN2G3JY6ZYpYUHI5xOqYwAbgP/5q9+Quk8AXgLUxydcZ2NduGXKp/fVa8F4JjQ0MvNk8m1ktdnxVj8d7XvfL9CZtjepxq+7gTVYnmtQfAj3wCFFVKMq0QErFNiRlHQnxLNZqnDRZqByBldULBCt98ByZj6gd1x8kAlXat42134ScoDSasVjEEfVzeGSd0onUp4Vv4HJECyRxc1UFFGPXNU74h5UL63U6phQb+EXd2wpcXZJD7EIuIUqH1q1YvFufesl7xYVJYt6B+EVFHDQoKkWqvjm8Ly8r4Lkn/x1A0XdtyTIrQmBBDD++lR/YMPkcXs3owaQrPn/6L0cvFaO8xk+YqfL27ht6lsCQY=

Variance = 30/5 = 6. SD = √6 ≈ 2.45

Data Visualization

Histograms: Show distribution shape and frequency (area under the curve connects to integration)
Box plots: Display median, quartiles, and outliers
Scatter plots: Show relationships between two variables → regression
Bar/pie charts: Compare categorical data

Distribution Shape

Skewness describes asymmetry: right-skewed (mean > median, long right tail), left-skewed (mean < median). Kurtosis describes tail heaviness. The normal distribution has skewness 0 and kurtosis 3 (by convention, "excess kurtosis" = 0).

Descriptive statistics is the first step of any data analysis. Before fitting regression models or running hypothesis tests, always visualize and summarize your data. As the saying goes: "Plot your data."

← Back toStatistics Overview Next Lesson →Probability & Distributions