数学概率基础

1. 正态分布

样子:一口扣在地上的钟,想象一口钟,或者是《小王子》里那条像帽子的蛇。

  • 中间高: 代表大部分数值都集中在中间的平均值附近。
  • 两边低: 代表极端的数值非常少,且左右对称。

假设我们要统计全中国成年男性的身高:

  • 中间最高点: 绝大多数人的身高都在 170cm 左右(假设这是平均值),这一块人数最多。
  • 两边滑坡: 身高 160cm 的人和 180cm 的人也有不少,但比 170cm 的少。
  • 极端的两边: 身高 2 米 2(姚明)和身高 1 米 4 的人都属于 “ 凤毛麟角 “,概率极低,所以在曲线这一块几乎贴近地面。

为什么叫 “ 正态 “ (Normal)?因为这在自然界中太 “ 正常 “ 了。

2. 积分和概率面积

想象你手头有一根形状很不规则的香肠。我们要算它的体积(概率): 直接算很难。积分的做法: 把香肠切成无数个极薄的薄片。虽然香肠是弯的,但每一个极薄的切片可以近似看作一个标准的圆柱体/长方体。把你切出来的这无数个薄片加在一起,就是积分。

  • 定积分
    • 不定积分: 只是给你一个切片的公式。定积分: 是给你指定了范围。
    • 场景: 比如正态分布的钟形曲线。你想知道 “ 身高在 170cm 到 175cm 之间的人占多少比例?”
    • 操作: 你需要在横坐标 170 和 175 之间,把曲线下面围成的面积给算出来。
    • 这个算出面积的过程,就是定积分。
    • 一句话总结:在概率论里,定积分就是用来算 “ 某段范围内的概率大小 “ 的工具。
  • 微分
    • 不用像积分用得那么多。
    • 它是研究变化的快慢(斜率)。它也是积分的逆运算。

概率 = 面积(积分)

有一趟公交车,它非常不准时。它可能在 0 分钟到 10 分钟内的任意一个时刻到达。而且,在这个时间段内,它在每一秒到达的可能性都是均等的(这叫 “ 均匀分布 “)。

我们将这个问题变成一张图:

  • 横轴(X 轴): 时间(0 到 10 分钟)。
  • 纵轴(Y 轴): 概率密度(代表到达的可能性大小)。

问题 1:公交车正好在第 5 分钟 00.0000… 秒到达的概率是多少?

  • 答案是 0。
  • 为什么? 因为时间是可以无限分割的!它可以是 5.001 秒,5.0000001 秒……在无限个时刻中正好 “ 撞 “ 中那一个极小的点,概率就如同大海捞针,数学上视为 0。
  • 结论: 在连续概率里,问 “ 某一个点 “ 的概率是没有意义的。

问题 2:公交车在前 5 分钟内(0 到 5 分)到达的概率是多少?

  • 直觉告诉我们: 既然是 0-10 分钟均匀分布,那前一半时间到达的概率肯定是 50% (0.5) 对吧?
  • 我们用图形(面积)来看:
    • 为了让 “ 总概率 = 1”(100%),我们画一个矩形。
    • 矩形底边宽是 10(分钟)。
    • 因为 $面积 = 底 \times 高 = 1$,所以高(概率密度)必须是 0.1。
    • 计算: 你想算 0 到 5 分钟的概率,就是算底边为 0-5 的这一块矩形面积。
    • $面积 = 宽度(5) \times 高度(0.1) = 0.5$。

这就是积分的本质!

  • 刚才那个 $5 \times 0.1$ 的计算过程,就是一次最简单的定积分。
  • 积分无非就是帮你算这种面积的工具。
    如果公交车到达的规律不是 “ 平顶 “ 的矩形,而是一座 “ 山峰 “(正态分布),此时你不能用 “ 长乘宽 “ 算面积了,这就必须用到微积分公式来算曲线下面的面积。

3. 数学符号

$\sum$ (Sigma / 西格玛)

  • 含义: 代表离散求和 (Summation)。
  • 怎么理解: 想象这像是在数台阶。你把一系列的具体数字(比如第 1 个、第 2 个、第 3 个……)一个个加起来。
  • 例子: $\sum_{i=1}^{3} i$ 意思就是 $1 + 2 + 3 = 6$。
  • “ 离散 “ 这个词在数学里,意思是分散的、个体的、断开的。
    • 核心特征:有间隙,可数。
    • 教室里有 30 个人。不可能有 30.5 个人。
    • 你上楼必须踩在一个具体的台阶上,不能悬浮在第 1 级和第 2 级台阶之间。

$\int$ (Integral / 积分)

  • 含义: 代表连续求和 (Integration)。
  • 怎么理解: 这个符号其实是一个拉长了的 “S” (Sum)。想象这像是一个光滑的坡道,或者是切苹果。它是把无数个无限小的部分加在一起,通常用来计算曲线下方的面积、体积或者物理中的累积量。
  • 关系: 当 $\sum$ 中加的每一项变得无限小、数量变得无限多时,它就变成了 $\int$。

区别:

  • $\sum$ (离散求和):堆砖块,像是在数数。
  • $\int$ (连续求和 / 积分):刷油漆,积分就像是用一个无限细的刷子,从左到右扫过去,把所有扫过的 “ 无限细 “ 的线条面积加起来。像是在流淌。