読書『データ分析のための数理モデル入門』 - 確率密度関数
教養なさすぎて出てくる単語がいちいちわからないので、調べたメモ。確率密度関数について。書籍内で説明されている内容のまとめではなく、前提知識すぎて説明されていないことを調べたものです。
確率密度関数
変数が連続的な値をとる場合、ある特定の値が出る確率はゼロです。たとえば、身長が0.0000000000000000000001cmのズレもなく170cmぴったりの人が存在する確率はほぼゼロ(無限小)なわけで。とはいえ、身長170cmくらいの人が存在する確率と、200cmくらいの人が存在する確率を考えると、明らかに前者のほうが高いはず。こういう場合、変数がある特定の値をとる「確率」を考えることは意味をなさないので、代わりに考えるのが確率の密度。
身長はおおむね下図のように分布しており、この図形の全体が値がとりうる可能性のすべてということで、面積が1となる。この図におけるy軸を確率密度といい、この曲線を描く関数が確率密度関数。
たとえば、無作為に選んだある人が身長180cm以上である確率は、図の青く色付けされた部分の面積となる。

