Xác suất thống kê là nền tảng đặc trưng của các mô hình học máy và phân tích dữ liệu. Bài viết này là ghi chép của tôi về những kiến thức, tư tưởng cơ bản nhất về xác suất thống kê, từ bỏ đó hoàn toàn có thể giúp tín đồ đọc tiếp cận cùng xem lại các kiến thức cho cỗ môn này.

Bạn đang xem: Xác suất thống kê đại học

Xác suất, tỷ lệ có điều kiện, bí quyết Bayes

1. Phép thử, sự kiện, không khí mẫu

Khái niệm

Phép demo ngẫu nhiên là một trong những chuỗi những phương thức triển khai và quan ngay cạnh một thể nghiệm nào đó cho chúng ta kết quả cơ mà ta ko thể dự đoán trước được.

Sự khiếu nại sơ cấp là tác dụng quan gần kề được đơn giản nhất quan trọng tách nhỏ hơn của một phép thử.

Không gian mẫu ($S$) là tập hợp tất cả các sự khiếu nại sơ cung cấp của một phép thử với xung khắc với nhau, ký kết hiệu S.

Tập con bất kỳ của không gian mẫu được hotline là sự kiện.

Tính chất

Không gian chủng loại $Omega$ là một trong những tập hợp, sự kiện là tập nhỏ của $Omega$ nên những mỗi quan hệ (tập con, tương đương) và các phép toán (hợp, giao, phần bù, trừ) cũng giống như như cam kết thuyết tập hợp.

Tính xung khắc: $ A_1, dots , A_n $ được điện thoại tư vấn là xung khắc trường hợp $ A_i cap A_j = emptyset, forall i e j$.

Tính đầy đủ: $ A_1, dots , A_n $ được gọi là không thiếu nếu $ A_i cup dots cup A_n = S $.

Không gian những sự kiện: $ A_1, dots , A_n $ được hotline là một không khí các dự kiện nếu nó vừa xung khắc, vừa đầy đủ.

2. Xác suất

Khái niệm, tính chất

Xác suất của một phép thử là 1 ánh xạ $ P(.) $ từ không khí mẫu vào tập số thực thoả mãn:

Với phần đa sự khiếu nại $A$ thì $P(A) geq 0$.$P(Omega) = 1$.Cho $ A_1, A_2,dots $ xung tương khắc thì:

$$P(A_1 cup A_2 dots) = P(A_1) + P(A_2) + dots$$

Từ 3 tiên đề trên, ta có các tính chất:

$P(emptyset) = 0$$A, B$ xung tự khắc thì $P(A cup B) = P(A) + P(B)$.$A, B$ bất kỳ $P(A cup B) = P(A) + P(B) - P(A cap B) $.Định nghĩa tỷ lệ cổ điển

Xác suất cổ điển được thiết kế trên các không gian mẫu hữu hạn và đồng khả năng $Omega = w_1, w_2, dots, w_n$.

Vì các sự kiện gồm đồng năng lực xảy ra buộc phải $P(w_1) = P(w_2) = dots = P(w_n)$.

Do $1 = P(Omega) = P(w_1) + P(w_2) + dots + P(w_n) = nP(w_1)$ phải $P(w_i) = frac1n, forall i = overline1,n$.

A là 1 trong sự kiện thì $P(A) = frac#A#Omega$.

Xác suất có điều kiện

Một phép thử trường hợp biết sự khiếu nại $B, P(P) e 0$ đã xẩy ra thì xác suất sự khiếu nại A xẩy ra là tỷ lệ có đk $P(A|B)$ được xác định bởi công thức:

$$P(A|B) = fracP(A cap B)P(B)$$

Công thức nhân:

$$P(A cap B) = P(B).P(A|B) = P(A).P(B|A)$$

Hai sự khiếu nại được điện thoại tư vấn là độc lập nếu và chỉ còn nếu:

$$P(A cap B) = P(A).P(B)$$

3. Phương pháp Bayes

Xác suất toàn phần

$$sum_i=1^n(P(A_i.P(B|A_i)))$$

Công thức Bayes

Công thức Bayes đến 2 sự khiếu nại $A$, $B$

Cho nhị sự kiện $A, B$ với $P(A), P(B)$ là hai tỷ lệ được quan sát chủ quyền với nhau.

$P(A)$ được hotline là phần trăm tiên nghiệm (Prior).$P(B)$ được điện thoại tư vấn là tỷ lệ hậu nghiệm (Evidence).$P(B) = P(B|A) imes P(A) + P(B|arA) imes P(arA)$.$P(A|B)$ được gọi là tỷ lệ hậu nghiệm (Posterior).$P(B|A)$ được gọi là xác suất hoàn toàn có thể đúng (Likelihood).

Ta gồm công thức Bayes đến 2 sự khiếu nại $A$ cùng $B$

$$P(A|B) = fracP(A).P(BP(B)$$

$$Posterior = Likelihood imes Prior / Evidence$$

Công thức Bayes tổng quát:

Cho không gian các sự khiếu nại $A_1, dots, A_n$. B là một trong sự khiếu nại nào đó.

Ta tất cả công thức tỷ lệ toàn phần:

$$P(B) = sum_i=1^nP(A_i).P(B|A_i)$$

Công thức Bayes bao quát cho những sự kiện:

$$P(A_i|B) = fracP(A_i cap B)P(B) = frac(P(A_i cap B))A_j))$$

Biến đột nhiên và bày bán xác suất

1. đổi mới ngẫu nhiên

Khái niệm

Biến tự nhiên (random variables) là các biến nhận 1 cực hiếm ngẫu nhiên thay mặt đại diện cho công dụng của phép thử. Mỗi giá bán trị nhận thấy $x$ của biến bỗng dưng $X$ được gọi là 1 thể hiện nay của $X$, đó cũng là kết quả của phép thử xuất xắc còn được hiểu là một trong những sự kiện.

Biến ngẫu nhiên có 2 dạng:

Liên tục (continous): tập cực hiếm là liên tục tức là lấp đầy 1 khoảng chừng trục số, ko đếm được.Ví dụ

Khi gieo 2 nhỏ xúc sắc, điện thoại tư vấn X, Y theo lần lượt là số chấm xuất hiện thêm trên mặt của con trước tiên và thứ 2 thì X, Y là nhị biến bỗng dưng vì gồm cùng công dụng kiểu số. Các hàm số như $X + Y, 2XY, sin(XY)$ cũng là những biến ngẫu nhiên.

2. Phân phối xác suất

Hàm trọng số (Probability mass function - PMF)

Xét biến tình cờ rời rộc rạc $X$ gồm miền giá bán trị rất có thể nhận $(x_1, x_2, dots, x_n$. Hàm trọng số của một biến hốt nhiên rời rạc ký kết hiệu là:

$$P_X(x) = P(X = x), forall x in mathbbR$$

Ý nghĩa: Hàm trọng số thể hiện kĩ năng xảy ra tại một điểm $x$.

Bảng trưng bày xác suất

$X = x$$x_1$$dots$$x_n$
$P_X(x)$P_X(x_1)$dots$$P_X(x_n)$

Tính chất

$P_X(x) geq 0, forall x in mathbbR$$sum_i=1^nP_X(x_i) = 1$Hàm phân phối tỷ lệ (Cumulative distribution function - CDF)

Hàm phân phối tỷ lệ của biến tự dưng $X$ là hàm được khẳng định bởi công thức:

$$F_X(x) = P(X le x), forall x in mathbbR$$

Ý nghĩa: Hàm phân phối tỷ lệ là tỷ lệ của sự khiếu nại "biến bất chợt $X$ nhận quý giá nằm trong vòng từ $−infty$ tới $x$". Khi bao gồm hàm phân phối ta triển khai với hàm giảitích thay bởi làm với những phép toán với việc kiện.

Tính chất

$F_x(-infty) = 0; F_X(+infty) = 1$$P(X leq a) = F_X(a); P(X > a) = 1 - F_X(a)$$P(a

$X$ là biến tự dưng rời rộc rạc thì $F_X(x) = sum x_i Ví dụ mang lại hàm trọng số với hàm triển lẵm xác suất

Gieo một con xúc sắc. $X$ là số chấm xuất hiện. Những giá trị X rất có thể nhận là $S = 1, 2, 3, 4, 5, 6$

Hàm trọng số

$$P_X(x) =egincases1/6; và x in Omega \0; & x otin Omegaendcases$$

Hàm phân phối tỷ lệ $F_X(x) =egincases0; & x

Giả lập thể nghiệm gieo xúc sắc

Mô phỏng tung một nhỏ xúc sắc cân đối đồng hóa học 5000 lần.

Xem thêm: Tổng Đài Tư Vấn Địa Chỉ Đại Học Fpt Hồ Chí Minh, Trường Đại Học Fpt

Dựa vào các giá trị tế bào phỏng, in ra bảng triển lẵm xác suất.Vẽ đồ vật thị hàm trọng số cùng hàm phân phối xác suất.Tính xác suất số điểm trên mặt xúc sắc lớn hơn 2 cùng không vượt thừa 4.