你的预报有多准?

在新语丝上关于天气预报的概率计算讨论得非常热烈,起因是在一篇科普文章里,作者就天气预报准确率为80%发表评论,说如果预报有雨,在降雨概率低的地方,你大可不必带伞。这里涉及到有关统计推断的几个重要概念:
 
1 什么是预报准确率?如果80%准确率指十次下雨天里气象预报有八次提前预报有雨,那么我只要天天预报有雨,准确率岂不是100%?如果80%指十天里有八天气象预报正确,那么我们仍关心其中有多少比例是雨天预报有雨,晴天报晴正确。假设两者都是准确率为80%,这是否说明气象预报比随机瞎猜更有效呢?这个问题成了新语丝上讨论的焦点之一。
 
2 先验概率是否影响对预报准确率的评价?如果一天为晴或雨的概率各50%,且每天的气象预报均统计独立,那么80%的晴天报晴雨天报雨准确率自然比随机瞎猜要强。可是,如果该地的降雨概率只有10%,那么一直报晴的错误率只有10%,尽管这对雨天的预报来说错误率为100%。现在我们知道,单看预报准确率无法区分两类错误:晴天报雨和雨天报晴。你可以要求在雨天报雨准确率不低于80%的条件下尽可能增大晴天报晴的概率,但是总体预测准确率不能保证仍是80%。
 
3 如果按照P(准确率)=P(晴天报晴)P(晴天)+P(雨天报雨)P(雨天)来评价天气预报水平是否有意义?我们以某地降雨概率为10%来评价以下预报机制:一直报晴的准确率为90%,而80%的晴天报晴雨天报雨其总体准确率也只有80%!实际上,我们更关心相对于晴天和雨天的先验概率分布,预报能够带给我们多少新的信息。一直报晴并不增加任何新的信息,所以该预报没有价值。
 
4 预报有雨且已知该预报80%晴天报晴雨天报雨准确率的情况下需要带伞吗?如果不麻烦,干嘛不?根据预报信息,降雨从先验概率0.1增长到后验概率0.31,似乎雨和晴仍是三七开,晴的可能性大,预报并不影响带伞与否的决策。如果你考虑先验晴雨比为9:1而后验晴雨比为9:4,这变化完全归功于80%的预报准确率。即使90%的预报准确率也不过让后验雨和晴的比率变为五五开罢了。换句话说,气象预报提供的信息不足以改变你对天气的先验判断。
 
5 统计推断一定基于频率意义上的概率分布吗?如果你是贝叶斯学派的,那么你会说先验概率分布完全是人为假定的一种对不确定性的刻划,和频率无关,我们并不关心每天的气象预测是否对应相同条件下的独立实验,而是人为假定基于已有知识(除了天气预报),未来某一天的晴雨比为9:1。天气预报所提供的信息必须以给定晴天或雨天后,预报结果的似然函数形式给出。似然函数不必服从概率分布。在某些特定情况下,先验分布也可以不服从常规的概率分布。
 
6 目前的争论对预报准确性的理解有帮助吗?对熟悉贝叶斯理论的人来说,以上结果没什么好惊讶的,但是对靠直觉草率判断的人来说,还是要记住:写清所有假设然后再开始做推断。举个例子:两个人在犯罪现场留下他们的血迹,根据化验结果,一为O型(在当地人群中约占60%),一为AB型(在当地人群中约占1%)。疑犯甲血型为O,与罪案现场血型之一相符。请问:此一证据是否增加该疑犯甲在罪案现场的指控?
This entry was posted in science and engineering. Bookmark the permalink.

1 Response to 你的预报有多准?

  1. Pingback: 谈方韩之争中引发的统计推断问题 | Huimin Chen's Cyberhome

Leave a comment