Mở đầu

Bài tienkiemkyduyen.mobi này sẽ phân tích và lý giải cách tính khoảng tin yêu (confidence interval) đến trung bình. Bài bác đề cập đến những khái niệm phân phối chuẩn chỉnh và khoảng tin tưởng cho xác suất trong hai bài bác tienkiemkyduyen.mobi trước. Các chúng ta cũng có thể đọc sinh sống đây:

Công thức

Công thức tính khoảng tin cẩn cho trung bình thực hiện độ lệch chuẩn của tổ hợp

Công thức tính khoảng tin tưởng cho vừa phải là như sau:

*
Để tính khoảng tin tưởng của trung bình cho 1 tập dữ liệu trước tiên ta sẽ lấy một mẫu dữ liệu trước. Trường đoản cú mẫu dữ liệu đó ta vẫn lấy trung bình cộng của chủng loại dữ liệu.Sau kia ta và tính z-score nhờ vào mức tin cậy. Ví dụ như hình dưới đây với mức tin yêu là 95% trong trưng bày mẫu của mức độ vừa phải mẫu, sẽ được thể hiện bởi diện tích red color giữa hai gạch ốp đỏ.
*
Với đa số dữ liệu, nếu ta tập hòa hợp thật các mẫu, tính trung bình của các mẫu rồi vẽ triển lẵm của trung bình, ta đã vẽ được một trưng bày như trong hình. Về lý thuyết, mức độ vừa phải của trưng bày mẫu sẽ bởi trung bình của tổ hợp. Mức tin cậy là năng lực trung bình của tập hợp nằm trong lòng hai quý giá trong phân phối của vừa phải mẫu. Hai quý giá này, được biểu lộ bằng hai tuyến đường gạch red color cắt với trục X, tất cả cùng khoảng cách với trung bình. Mức tin yêu bằng 95% có nghĩa là ta đề xuất tìm hai tuyến đường gạch đỏ (đối xứng tại trung bình) ra sao để khả năng trung bình của tập hợp nằm giữa hai quý hiếm là 95% (diện tích dưới con đường cong).Ví dụ tìm kiếm z-score với mức tin cậy là 95%. Cách thứ nhất ta có thể dùng cơ chế 68, 95, với 99.7 (có thể xem bên trên wiki). Vì diện tích dưới con đường cong chính giữa là 95%, z-score là gần bởi -2 bên trái và hai bên phải.Một phương pháp khác, ta hoàn toàn có thể tìm diện tích s dưới đường cong mặt tay trái triển lẵm (diện tích greed color bên trái hình). Diện tích đó đang là: (100% - 95%)/2 = 2.5% = 0.025. Thực hiện z-table với z-score của diện tích s bên trái đã cho tác dụng -1.96, có tác dụng tròn thành -2. Z-score bên nên sẽ là giá chỉ trị hoàn hảo và tuyệt vời nhất của -2 bằng 2. Cách sử dụng z-table rất có thể thấy như hình mặt dưới.
*
*
Cuối cùng ta sẽ tính độ lệch chuẩn của mức độ vừa phải trong phân phối mẫu bằng độ lệch của tổ hợp dữ liệu phân chia cho căn bậc nhị của số tài liệu trong mẫu mã dữ liệu. Sau khi tính được các giá trị bên trên các chúng ta cũng có thể cộng trừ nhân chia như phương pháp trên để tính khoảng tin cậy trong trường vừa lòng ta biết độ lệch chuẩn của tổ hợp dữ liệu.

Công thức tính khoảng tin cậy cho trung bình áp dụng độ lệch chuẩn chỉnh của mẫu

Điểm cần xem xét là cực kỳ ít ngôi trường hợp họ biết được độ lệch chuẩn của tổ hợp dữ liệu. Nên bình thường ta sẽ thực hiện độ lệch chuẩn của mẫu mã thay bởi độ lệch chuẩn của tổ hợp để đưa ra kết quả tương tự.Công thức tính độ lệch chuẩn cho bày bán của mức độ vừa phải mẫu thực hiện độ lệch chuẩn của mẫu:

*
Tuy nhiên các nhà toán học qua thử nghiệm thống kê thấy, nếu áp dụng độ lệch chuẩn của chủng loại để tính độ lệch chuẩn chỉnh cho vừa đủ như ngơi nghỉ trên, sẽ đưa ra khoảng tin cẩn không thiết yếu xác. Bọn họ thấy nếu sử dụng độ lệch chuẩn của chủng loại thay bởi độ lệch chuẩn chỉnh của tổ hợp, thì thực hiện t-score sẽ đúng mực hơn so với z-score.Ta sẽ sở hữu công thức ước lượng khoảng tin yêu sử dụng độ lệch chuẩn chỉnh của tài liệu mẫu:
*
Để ghi nhớ lại. Z-score và T-score làm cùng nhiệm vụ: tìm khoảng cách từ một giá trị bất kỳ đến vừa phải trong một phân phối. Điểm không giống nhau là z-score thực hiện cho triển lẵm Z. T-score áp dụng cho trưng bày T, là phân phối có đuôi phình hơn cung cấp Z.
*
Một điểm cần chú ý nữa. Để sử dụng t-score ta phải ghi nhận bậc tự do thoải mái (degrees of freedom). Bậc thoải mái = số tài liệu mẫu - 1. Lấy ví dụ trong mẫu của bọn họ có 10 dữ liệu và ta mong muốn tìm t-score với mức tin yêu là 95%. Bậc tự do sẽ là 10 -1 = 9, diện tích dưới đường cong ở phía bên trái sẽ là (100% - 95%)/2 = 2.5% = 0.025. Chúng ta có thể sử dụng trức tiếp mức tin yêu là 95% gắng bằng diện tích dưới mặt đường cong phía trái (0.025). Sử dụng t-table như dưới ta sẽ tìm được t-score là 2.262.
*

Vậy lúc tính giới hạn lỗi mang đến trung bình, ta rất có thể sử dụng z-score cùng với dộ lệch chuẩn chỉnh của tổ hợp, cùng t-score cùng với độ lệch chuẩn của mẫu.

Bài toán

Sử dụng bí quyết ở trên, ta vẫn giải một bài toán về khoảng tin cậy sử dụng python.

Một nhà chuyên viên dinh dưỡng phân tích về số ca-lo trong bánh mỳ kẹp giết của chuỗi nhà hàng nổi tiếng. Nhà chuyên gia lấy một chủng loại ngẫu nhiên bao gồm 14 bánh mì kẹp thịt cùng đo số ca-lo. Mẫu dữ liệu có phân bố gần đối xứng, cực hiếm trung bình là 700 ca-lo với độ lệch chuẩn là 50 ca-lo. Hỏi cùng với mẫu tài liệu này, với khoảng độ tin cậy là 95%, khoảng cách tin cậy mang lại trung bình số ca-lo của bánh mỳ kẹp làm thịt này là bao nhiêu?

Tập thích hợp lại những thông tin từ bài toán

sample_mean = 700 sample_stddev = 50 n_size = 14 confidence_level = 0.95Tính những giá trị để tính t-value: bậc giá trị và diện tích đường cong mặt tay trái

# Tính bậc tự do thoải mái degrees_of_freedom = n_size - 1 # Tính xác xuất giá trị nằm bền trái t-value trong phân phối t (t-distribution) one_tailed_prob = (1 - 0.95)/2 one_tailed_prob # 0.025Sau đó họ tính t-value.

from math import sqrt sampling_dist_mean_stddev = sample_stddev/sqrt(n_size) sampling_dist_mean_stddev # 13.363062095621219Tính khoảng chừng tin cậy

Phân tích kết quảVới mức tin yêu là 95%, khoảng tin cậy cho trung bình họ tìm được là (671, 729). Điều này có nghĩa là ta rất có thể tự tin 95% là trung bình năng lượng trong toàn cục bánh mì kẹp giết mổ của siêu thị này sẽ nằm trong tầm từ 671 cùng 729 calo

Kết luận

Hi vọng với bài bác tienkiemkyduyen.mobi này các bạn hiểu được cách tính và so sánh khoảng tin yêu cho trung bình. Chúc chúng ta may mắn vào việc vận dụng vào dự án.