توزیعهای آماری به ما کمک میکنند شناخت بهتری از دادهها داشته باشیم و در مورد احتمال وقوع پیشامدها با منطق بهتری نظر بدهیم. بنابراین فهم درست تعاریف، تفاوتها و کاربردشان بسیار مهم است.
جزوهی بیست صفحهای Probability Distributions Cheat Sheet شامل همهی توزیعهای احتمالاتی مشهور برای مرور کاربردها و تفاوتهای آنها است.
Probability Distributions Cheat Sheet
جمعبندی و نکات تکمیلی
در ادامه جمعبندی فایل فوق به همراه برخی نکات تکمیلی و مفید آمده است.
[برگرد بالا]توزیع احتمال نشان میدهد که احتمال وقوع هر مقدار ممکن برای یک متغیر تصادفی چقدر است. این توزیعها در آمار و علم داده برای مدلسازی عدم قطعیت استفاده میشوند.
[برگرد بالا]در توزیع گسسته، متغیر تصادفی فقط مقادیر مشخص و شمارشپذیر میگیرد (مثل تعداد پرتاب سکههای شیر)، اما در توزیع پیوسته، متغیر میتواند هر مقدار در یک بازه عددی باشد (مثل زمان یا دما).
[برگرد بالا]توزیع برنولی سادهترین نوع توزیع است که فقط دو نتیجه دارد: موفقیت یا شکست، معمولا با مقادیر 0 و 1 نشان داده میشود.
[برگرد بالا]زمانی که چند آزمایش مستقل داریم و هر کدام فقط دو نتیجه دارند، از توزیع دوجملهای برای شمارش تعداد موفقیتها استفاده میشود.
[برگرد بالا]این توزیع نشان میدهد چند بار شکست رخ میدهد تا اولین موفقیت اتفاق بیفتد؛ مثلاً چند بار باید سکه پرتاب کنیم تا اولین شیر بیاید.
[برگرد بالا]توزیع پواسن برای شمارش تعداد وقوع رویدادهای نادر در یک بازه زمانی یا مکانی ثابت به کار میرود؛ مثلاً تعداد تماسهای دریافتی در یک ساعت.
[برگرد بالا]در این توزیع، همه نتایج ممکن شانس برابری دارند. مثلاً در پرتاب تاس، احتمال آمدن هر عدد از ۱ تا ۶ برابر است.
[برگرد بالا]زمانی استفاده میشود که احتمال همه مقادیر در یک بازه مشخص برابر باشد. مانند احتمال انتخاب عددی بین 0 تا 10 بهصورت تصادفی.
[برگرد بالا]این توزیع برای مدلسازی زمان انتظار تا وقوع اولین رویداد (مثلاً زمان تا خرابی یک دستگاه) استفاده میشود.
[برگرد بالا]برای مدلسازی زمان لازم برای وقوع چندین رویداد از نوع پواسن به کار میرود و تعمیمیافتهی توزیع نمایی است.
[برگرد بالا]این توزیع برای متغیرهایی به کار میرود که بین صفر و یک قرار دارند و معمولا در تحلیل احتمالات بیزی استفاده میشود.
[برگرد بالا]این توزیع یکی از پرکاربردترینهاست که بیشتر پدیدههای طبیعی (مثل قد، وزن یا نمرات) را مدلسازی میکند و شکل زنگولهای دارد.
[برگرد بالا]توزیعی است که برای آزمونهای آماری مثل آزمون نیکویی برازش و بررسی واریانس استفاده میشود.
[برگرد بالا]زمانی استفاده میشود که حجم نمونه کوچک است و واریانس جامعه مشخص نیست.
[برگرد بالا]این توزیع برای مقایسه واریانسها در تحلیل واریانس (ANOVA) کاربرد دارد.
[برگرد بالا]تعمیمی از توزیع دوجملهای است که بیش از دو نتیجه ممکن دارد، مثل پرتاب تاس چندوجهی.
[برگرد بالا]این توزیع برای مدلسازی انتخاب یک گزینه از چند گزینه ممکن با احتمالهای متفاوت استفاده میشود.
[برگرد بالا]یک توزیع پیوسته چندمتغیره است که معمولا برای مدلسازی احتمالهای چندگانه در یادگیری ماشین استفاده میشود.
[برگرد بالا]نسخه چندبعدی توزیع نرمال است که در آن چند متغیر پیوسته بهصورت همزمان با هم تغییر میکنند.