在统计学中,极大似然估计(Maximum Likelihood Estimation, MLE)是一种常用的参数估计方法。它基于概率模型,通过寻找使观测数据出现可能性最大的参数值来实现对未知参数的估计。为了帮助学习者更好地掌握这一概念,下面提供一些关于极大似然估计的典型练习题,并附有详细解答过程。
一、基础题型
题目1:
设总体 $ X $ 服从参数为 $ \lambda $ 的泊松分布,即 $ X \sim \text{Poisson}(\lambda) $,样本观测值为 $ x_1, x_2, \dots, x_n $。试求 $ \lambda $ 的极大似然估计量。
解法:
泊松分布的概率质量函数为:
$$
P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}
$$
给定样本 $ x_1, x_2, \dots, x_n $,似然函数为:
$$
L(\lambda) = \prod_{i=1}^{n} \frac{e^{-\lambda} \lambda^{x_i}}{x_i!}
= e^{-n\lambda} \lambda^{\sum_{i=1}^{n} x_i} \cdot \prod_{i=1}^{n} \frac{1}{x_i!}
$$
取对数似然函数:
$$
\ln L(\lambda) = -n\lambda + \left( \sum_{i=1}^{n} x_i \right) \ln \lambda - \sum_{i=1}^{n} \ln x_i!
$$
对 $ \lambda $ 求导并令其为零:
$$
\frac{d}{d\lambda} \ln L(\lambda) = -n + \frac{1}{\lambda} \sum_{i=1}^{n} x_i = 0
$$
解得:
$$
\hat{\lambda} = \frac{1}{n} \sum_{i=1}^{n} x_i
$$
结论:
$ \lambda $ 的极大似然估计量为样本均值。
二、进阶题型
题目2:
设总体 $ X $ 服从参数为 $ \theta $ 的指数分布,即 $ X \sim \text{Exp}(\theta) $,其概率密度函数为:
$$
f(x; \theta) = \frac{1}{\theta} e^{-x/\theta}, \quad x > 0
$$
现从该总体中抽取一个简单随机样本 $ x_1, x_2, \dots, x_n $,试求 $ \theta $ 的极大似然估计量。
解法:
似然函数为:
$$
L(\theta) = \prod_{i=1}^{n} \frac{1}{\theta} e^{-x_i / \theta}
= \frac{1}{\theta^n} e^{-\frac{1}{\theta} \sum_{i=1}^{n} x_i}
$$
取对数似然函数:
$$
\ln L(\theta) = -n \ln \theta - \frac{1}{\theta} \sum_{i=1}^{n} x_i
$$
对 $ \theta $ 求导并令其为零:
$$
\frac{d}{d\theta} \ln L(\theta) = -\frac{n}{\theta} + \frac{1}{\theta^2} \sum_{i=1}^{n} x_i = 0
$$
解得:
$$
\hat{\theta} = \frac{1}{n} \sum_{i=1}^{n} x_i
$$
结论:
$ \theta $ 的极大似然估计量同样为样本均值。
三、综合应用题
题目3:
设总体 $ X $ 服从两点分布,即 $ X \sim \text{Bernoulli}(p) $,其中 $ p \in (0, 1) $。从该总体中抽取一个容量为 $ n $ 的样本 $ x_1, x_2, \dots, x_n $,其中 $ x_i \in \{0, 1\} $。试求 $ p $ 的极大似然估计量。
解法:
两点分布的概率质量函数为:
$$
P(X = x) = p^x (1 - p)^{1 - x}
$$
似然函数为:
$$
L(p) = \prod_{i=1}^{n} p^{x_i} (1 - p)^{1 - x_i}
= p^{\sum_{i=1}^{n} x_i} (1 - p)^{n - \sum_{i=1}^{n} x_i}
$$
取对数似然函数:
$$
\ln L(p) = \left( \sum_{i=1}^{n} x_i \right) \ln p + \left( n - \sum_{i=1}^{n} x_i \right) \ln (1 - p)
$$
对 $ p $ 求导并令其为零:
$$
\frac{d}{dp} \ln L(p) = \frac{1}{p} \sum_{i=1}^{n} x_i - \frac{1}{1 - p} \left( n - \sum_{i=1}^{n} x_i \right) = 0
$$
解得:
$$
\hat{p} = \frac{1}{n} \sum_{i=1}^{n} x_i
$$
结论:
$ p $ 的极大似然估计量为样本频率。
四、拓展思考
在实际问题中,极大似然估计虽然具有良好的渐近性质(如一致性、渐近正态性等),但也存在一些局限性,例如:
- 当样本量较小时,估计结果可能不够准确;
- 对于复杂模型,求解似然方程可能非常困难;
- 若模型假设不成立,MLE 可能产生偏误。
因此,在使用极大似然估计时,应结合实际背景和数据特点进行判断和修正。
总结
极大似然估计是一种基于概率模型的参数估计方法,其核心思想是“最可能产生当前观测数据的参数值”。通过上述练习题可以看出,不同分布下的 MLE 形式虽有差异,但基本步骤一致:构造似然函数 → 取对数 → 求导 → 解方程。熟练掌握这些步骤,有助于提升统计建模与数据分析的能力。