Chào mừng bạn đến với bài học về lý thuyết Các số đặc trưng đo độ phân tán trong chương trình Toán 10 Kết nối tri thức. Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản và quan trọng nhất về cách đo lường mức độ phân tán của một tập dữ liệu.
Chúng ta sẽ cùng nhau tìm hiểu về các khái niệm như khoảng biến thiên, phương sai, độ lệch chuẩn và hệ số biến thiên. Hiểu rõ những khái niệm này sẽ giúp bạn phân tích và so sánh các tập dữ liệu một cách hiệu quả.
1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ 2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN 3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP
1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ
a. Khoảng biến thiên
Khoảng biến thiên (hay biên độ) = Giá trị lớn nhất – Giá trị nhỏ nhất.
Ý nghĩa: Dùng để đo độ phân tán của mẫu số liệu: Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán (càng không đồng đều)
Nhận xét: Đơn giản, dễ tính toán nhưng bỏ qua thông tin từ các giá trị khác và bị ảnh hưởng bởi các giá trị bất thường.
b. Khoảng tứ phân vị
Khoảng tứ phân vị (hay độ trải giữa): \({\Delta _Q} = {Q_3} - {Q_1}\)
Ý nghĩa: Dùng để đo độ phân tán của mẫu số liệu: Khoảng tứ phân vị càng lớn thì mẫu số liệu càng phân tán (càng không đồng đều)
Nhận xét: Chỉ sử dụng thông tin của 50% số liệu chính giữa nhưng không bị ảnh hưởng bởi các giá trị bất thường.
2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
Có một vài số đặc trưng khác đo độ phân tán sử dụng thông tin của tất cả các giá trị trong mẫu. Hai trong số đó là phương sai và độ lệch chuẩn.
Cho mẫu số liệu \({x_1},{x_2},{x_3},...,{x_n}\), số trung bình là \(\overline x \)
Độ lệch của mỗi giá trị: \({x_i} - \overline x \)
Phương sai: \({s^2} = \frac{{{{({x_1} - \overline x )}^2} + {{({x_2} - \overline x )}^2} + ... + {{({x_n} - \overline x )}^2}}}{n}\)
Độ lệch chuẩn: \(s = \sqrt {{s^2}} \)
Ý nghĩa: Nếu số liệu càng phân tán thì phương sai và độ lệch chuẩn càng lớn
Chú ý: Phương sai của mẫu số liệu cho dạng bảng tần số:
\({s^2} = \frac{{{m_1}{{({x_1} - \overline x )}^2} + {m_2}{{({x_2} - \overline x )}^2} + ... + {m_k}{{({x_k} - \overline x )}^2}}}{n}\)
Với \({m_i}\) là tần số của giá trị \({x_i}\) và \(n = {m_1} + {m_2} + ... + {m_k}\)
3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP
+) Giá trị bất thường: là những giá trị quá lớn hoặc quá nhỏ so với đa số các giá trị khác.
+) Biểu đồ hộp
\( \Rightarrow x\) là giá trị bất thường nếu \(\left[ \begin{array}{l}x < {Q_1} - 1,5.{\Delta _Q}\\x > {Q_3} + 1,5.{\Delta _Q}\end{array} \right.\)
Trong thống kê, việc hiểu rõ mức độ phân tán của một tập dữ liệu là vô cùng quan trọng. Các số đặc trưng đo độ phân tán giúp chúng ta đánh giá xem các giá trị trong tập dữ liệu có xu hướng tập trung gần giá trị trung bình hay trải rộng ra xa. Bài viết này sẽ trình bày chi tiết về các số đặc trưng đo độ phân tán được học trong SGK Toán 10 Kết nối tri thức.
Độ phân tán của một tập dữ liệu thể hiện mức độ khác biệt giữa các giá trị trong tập dữ liệu đó. Một tập dữ liệu có độ phân tán lớn cho thấy các giá trị phân tán rộng, trong khi một tập dữ liệu có độ phân tán nhỏ cho thấy các giá trị tập trung gần nhau.
Khoảng biến thiên là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong một tập dữ liệu. Công thức tính khoảng biến thiên (R) như sau:
R = Xmax - Xmin
Khoảng biến thiên là một số đặc trưng đo độ phân tán đơn giản, dễ tính toán, nhưng nó lại nhạy cảm với các giá trị ngoại lệ.
Phương sai đo lường mức độ phân tán của các giá trị trong một tập dữ liệu so với giá trị trung bình. Phương sai được ký hiệu là σ2 (cho tổng thể) hoặc s2 (cho mẫu). Công thức tính phương sai như sau:
σ2 = ∑(Xi - μ)2 / N (cho tổng thể)
s2 = ∑(Xi - x̄)2 / (n-1) (cho mẫu)
Trong đó:
Phương sai luôn là một số không âm. Phương sai càng lớn, độ phân tán của dữ liệu càng lớn.
Độ lệch chuẩn là căn bậc hai của phương sai. Độ lệch chuẩn được ký hiệu là σ (cho tổng thể) hoặc s (cho mẫu). Công thức tính độ lệch chuẩn như sau:
σ = √σ2
s = √s2
Độ lệch chuẩn có cùng đơn vị với dữ liệu gốc, do đó nó dễ dàng diễn giải hơn phương sai. Độ lệch chuẩn càng lớn, độ phân tán của dữ liệu càng lớn.
Hệ số biến thiên là tỷ lệ giữa độ lệch chuẩn và giá trị trung bình. Hệ số biến thiên được ký hiệu là V. Công thức tính hệ số biến thiên như sau:
V = (σ / μ) * 100% (cho tổng thể)
V = (s / x̄) * 100% (cho mẫu)
Hệ số biến thiên được sử dụng để so sánh độ phân tán của các tập dữ liệu có giá trị trung bình khác nhau. Hệ số biến thiên càng lớn, độ phân tán tương đối của dữ liệu càng lớn.
Xét hai tập dữ liệu sau:
Giá trị trung bình của tập dữ liệu A là 15, và độ lệch chuẩn là 3.67.
Giá trị trung bình của tập dữ liệu B là 15, và độ lệch chuẩn là 7.91.
Mặc dù cả hai tập dữ liệu đều có giá trị trung bình bằng nhau, nhưng tập dữ liệu B có độ lệch chuẩn lớn hơn, cho thấy các giá trị trong tập dữ liệu B phân tán rộng hơn so với tập dữ liệu A.
Các số đặc trưng đo độ phân tán được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, bao gồm:
Hi vọng bài viết này đã cung cấp cho bạn những kiến thức cơ bản và hữu ích về lý thuyết Các số đặc trưng đo độ phân tán - SGK Toán 10 Kết nối tri thức. Việc nắm vững những kiến thức này sẽ giúp bạn giải quyết các bài toán thống kê một cách hiệu quả và chính xác.