Bài học này cung cấp kiến thức nền tảng về khoảng biến thiên và khoảng tứ phân vị, những khái niệm quan trọng trong thống kê toán học. Chúng ta sẽ cùng tìm hiểu cách tính toán và ứng dụng các khái niệm này vào việc phân tích dữ liệu mẫu số liệu ghép nhóm.
Nội dung bài học được trình bày một cách dễ hiểu, có ví dụ minh họa cụ thể, giúp học sinh nắm vững lý thuyết và rèn luyện kỹ năng giải bài tập.
Bài 1. Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm 1. Khoảng biến thiên
1. Khoảng biến thiên
a) Định nghĩa
Khoảng biến thiên, kí hiệu R, của mẫu số liệu ghép nhóm là hiệu số giữa đầu mút phải của nhóm cuối cùng và đầu mút trái của nhóm đầu tiên có chứa dữ liệu của mẫu số liệu. \(R = {u_{k + 1}} - {u_1}\) |
b) Ý nghĩa
- Khoảng biến thiên của mẫu số liệu ghép nhóm xấp xỉ cho khoảng biến thiên của mẫu số liệu gốc và có thể dùng để đo mức độ phân tán của mẫu số liệu
- Khoảng biến thiên chưa phản ánh đầy đủ mức độ phân tán của phần lớn các số liệu. Hơn nữa giá trị của R thường tăng vọt khi xuất hiện giá trị ngoại lệ trong mẫu số liệu. Do đó, để phản ánh mức độ phân tán của số liệu, người ta còn dùng các số đặc trưng khác
2. Khoảng tứ phân vị
a) Định nghĩa
Khoảng tứ phân vị của mẫu số liệu ghép nhóm, kí hiệu \({\Delta _Q}\), là hiệu giữa tứ phân vị thứ ba \({Q_3}\) và tứ phân vị thứ nhất \({Q_1}\) của mẫu số liệu ghép nhóm đó, tức là: \({\Delta _Q} = {Q_3} - {Q_1}\) |
b) Ý nghĩa
b) Ý nghĩa
- Khoảng tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ khoảng tứ phân vị của mẫu số liệu gốc và là một đại lượng cho biết mức độ phân tán của nửa giữa mẫu số liệu.
- Khoảng tứ phân vị của mẫu số liệu ghép nhóm càng nhỏ thì dữ liệu càng tập trung xung quanh trung vị.
- Khoảng tứ phân vị được dùng để xác định giá trị ngoại lệ trong mẫu số liệu. Giá trị x trong mẫu số liệu là giá trị ngoại lệ nếu \(x > {Q_3} + 1,5\Delta Q\) hoặc \(x < {Q_1} - 1,5\Delta Q\).
- Khoảng tứ phân vị của mẫu số liệu ghép nhóm không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ trong mẫu số liệu.
Trong chương trình Toán 12, phần thống kê và xác suất đóng vai trò quan trọng trong việc giúp học sinh hiểu và phân tích dữ liệu. Một trong những nội dung cốt lõi của phần này là lý thuyết về khoảng biến thiên và khoảng tứ phân vị, đặc biệt khi làm việc với mẫu số liệu ghép nhóm. Bài viết này sẽ trình bày chi tiết về lý thuyết này, cùng với các ví dụ minh họa để giúp bạn nắm vững kiến thức.
Mẫu số liệu ghép nhóm là một cách trình bày dữ liệu, trong đó các giá trị được chia thành các khoảng (nhóm) và chỉ số lượng các giá trị trong mỗi khoảng được ghi lại. Ví dụ, một bảng tần số thể hiện số lượng học sinh đạt điểm trong các khoảng điểm khác nhau là một ví dụ về mẫu số liệu ghép nhóm.
Khoảng biến thiên (Range) của một mẫu số liệu là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong mẫu. Đối với mẫu số liệu ghép nhóm, ta thường sử dụng các cận của khoảng chứa giá trị lớn nhất và giá trị nhỏ nhất để ước lượng khoảng biến thiên.
Công thức tính khoảng biến thiên (R) cho mẫu số liệu ghép nhóm:
R = xmax - xmin
Trong đó:
Khoảng tứ phân vị (Interquartile Range - IQR) là hiệu giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1). Khoảng tứ phân vị đo lường mức độ phân tán của 50% dữ liệu trung tâm của mẫu.
Để tính khoảng tứ phân vị cho mẫu số liệu ghép nhóm, ta cần tìm Q1 và Q3.
Q1 là giá trị phân chia mẫu thành hai phần, sao cho 25% dữ liệu nhỏ hơn hoặc bằng Q1. Q3 là giá trị phân chia mẫu thành hai phần, sao cho 75% dữ liệu nhỏ hơn hoặc bằng Q3.
Công thức tính Q1 và Q3 cho mẫu số liệu ghép nhóm:
Q1 = xi + [(Q1/n - Fi-1)/fi] * Δx
Q3 = xj + [(Q3/n - Fj-1)/fj] * Δx
Trong đó:
Giả sử ta có bảng tần số sau:
Khoảng | Tần số (f) | Tần số tích lũy (F) |
---|---|---|
[0, 10) | 5 | 5 |
[10, 20) | 10 | 15 |
[20, 30) | 15 | 30 |
[30, 40) | 8 | 38 |
[40, 50) | 2 | 40 |
Tổng số quan sát (n) = 40. Để tìm Q1 (tứ phân vị thứ nhất), ta cần tìm khoảng chứa giá trị thứ (40 * 0.25) = 10. Giá trị thứ 10 nằm trong khoảng [10, 20). Áp dụng công thức, ta có:
Q1 = 10 + [(10/40 - 5/40)/10] * 10 = 10 + (5/400) * 10 = 10 + 0.125 = 10.125
Tương tự, để tìm Q3 (tứ phân vị thứ ba), ta cần tìm khoảng chứa giá trị thứ (40 * 0.75) = 30. Giá trị thứ 30 nằm trong khoảng [20, 30). Áp dụng công thức, ta có:
Q3 = 20 + [(30/40 - 15/40)/15] * 10 = 20 + (15/600) * 10 = 20 + 0.25 = 20.25
Vậy, khoảng tứ phân vị (IQR) = Q3 - Q1 = 20.25 - 10.125 = 10.125
Khoảng biến thiên và khoảng tứ phân vị là những công cụ hữu ích để:
Hi vọng bài viết này đã cung cấp cho bạn những kiến thức cơ bản và hữu ích về lý thuyết khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm Toán 12 Chân trời sáng tạo. Hãy luyện tập thêm với các bài tập để nắm vững kiến thức này nhé!