Thống kê xử lý thông tin

2. Thống kê xử lý thông tin

Chúng ta sẽ tập trung vào một số khái niệm của thống kê để phân tích kết quả TNSP. Giả sử ta có 2 lớp: một lớp thực nghiệm (lớp A) và một lớp đối chứng (B). Lớp A có 101 học sinh, lớp B có 96 học sinh. Sau một đợt thực nghiệm, ta cho một bài kiểm tra, chấm điểm theo thang 10. Các điểm số của hai lớp được nhập vào trong phần mềm SPSS. Với các chức năng của phần mềm này có thể xuất ra các bảng biểu, đồ thị theo mong muốn của người nghiên cứu.

a) Bảng phân phối

Lớp A: n = 101 (số học sinh - số phân tử)

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-04.jpg

Lớp B: n = 96 (số học sinh - số phần tử)

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-05.jpg

Hai bảng trên gọi là bảng phân phối điểm số của hai lớp.

xi: điểm số (giá trị quan sát thứ i).

nxi: số học sinh đạt điểm số xi (số phần tử ứng với xi), còn gọi là tần s

fi(%):tần suất ứng với xi.

Có thể lập bảng theo loại: kém, trung bình, khá, giỏi.

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-06.jpg

Dựa vào các bảng phân phối trên ta cũng có thể phần nào so sánh kết quả của hai lớp A và B.

  • Lớp A có tỉ lệ điểm trung bình và khá nhiều hơn lớp B.
  • Lớp A có tỉ lệ điểm kém ít hơn lớp B.
  • Lớp B có tỉ lệ giỏi nhiều hơn A.

Tuy nhiên nếu dựa vào trên, khó có thể nói điều gì cho chắc chắn về kết quả của phương pháp mới sau thực nghiệm sư phạm.

b) Giá trị trung bình cộng

Lấy giá trị trung bình là việc xử lý đầu tiên khi có bảng phân phối điểm. Nếu có sự chênh lệch lớn giữa hai lớp thì có thể kết luận kết quả thực nghiệm tương đối tốt (hoặc thành công, hoặc thất bại). Công thức tính:

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-07.jpg

Theo đó có thể tính cho hai lớp A và B:

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-08.jpg

Ở trường hợp cụ thể này xB>xA, có thể kết luận rằng phương pháp mà ta đem thực nghiệm không thành công?! Tuy nhiên sự chênh lệch không lớn, vì vậy có thể xét đến một số đại lượng khác để có thể tìm thấy một ưu việt nào đó của phương pháp mới.

Chú ý: Trường hợp không có tần số (mỗi xi ứng với 1 phần tử) thì:

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-09.jpg

c) Số trung vị

Nếu xếp dãy phần tử nxi, trong đó xi lấy từ thấp đến cao thì ta sẽ có:

Lớp A: 22222233334...5...6...7...8...999 (n = 101)

Lớp B: 122223...4...5...6...7...8889...10 10 (n = 96)

Số trung vị của dãy số liệu (dãy điểm) là điểm của học sinh đứng giữa của dãy

số:

  • Nếu n là lẽ thì số trung vị là (điểm của học sinh thứ H) H= (n+1)/2 (Lớp A: điểm của học sinh đứng thứ 51 - điểm 6 là số trung vị)
  • Nếu n là chẵn thì số trung vị là điểm trung bình của học sinh đứng thứ H = n/2 và H + 1(Lớp B: điểm trung bình công của học sinh thứ 38 và 39 - điểm 6, số trung vị là 6)

Số trung vị không phụ thuộc số đầu và số cuối của dãy số liệu. Dựa vào số này, có thể nhìn thấy số trung vị càng cao thì kết quả càng cao. Trong trường hợp hai lớp A và B như trên, số trung vị không so sánh được kết quả của chúng.

d) Số yếu vị (số mod)

Số yếu vị là số liệu (điểm số) có tần suất lớn nhất trong dãy. Trường hợp trên: Lớp A có số yếu vị là 6 (f6=29, 8%) và lớp B cũng có số yếu vị là 6 (f6=41, 6%). Ở đây, cả hai lớp có số yếu vị giống nhau. Số yếu vị cũng cho ta thấy phần nào kết quả của hai lớp, ở đây, chúng tương đương.

e) Khoảng biến thiên

Khoảng biến thiên được tính:

R=xmax - xmin

Ở ví dụ trên:

RA = 9 - 2 = 7RB = 10 - 1 = 9

Rõ ràng độ tập trung của khoảng biến thiên lớp A là lớn hơn lớp B. Khi R nhỏ ta có thể nói dãy số liệu đạt độ ổn định cao. Ngược lại, dãy số liệu bị phân tán nhiều.

f) Ðộ phân tán

Dùng khái niệm khoảng biến thiên ch biết được độ phân tán của toàn bộ dãy số liệu. Tuy nhiên, dãy số liệu có thể có nhiều điểm tập trung, nếu điểm tập trung nhiều ở trị trung bình của dãy số liệu thì dãy đó có thể coi là tốt. Bản thân trị trung bình sẽ không đại diện cho cả dãy số liệu nếu như các biến xichênh lệch quá nhiều (ví dụ: điểm số của lớp có quá nhiều điểm 2 và quá nhiều điểm 9). Vì vậy các đại lượng độ phân tán sẽ cho nhà nghiên cứu nhận định chính xác hơn.

  • Phương sai của mẫu (Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-10.jpg):

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-11.jpg

Phương sai là bình phương số đo mức độ phân tán của các số liệu xung quanh giá trị trung bình. Phương sai càng lớn thì các giá trị càng phân tán (xa giá trị trung bình) và ngược lại. Phương sai là bình phương độ lệch trung bình (độ lệch chuẩn). Thông thường người ta dùng Phương sai của mẫu có hiệu chỉnh (s2):

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-12.jpg

  • Độ lệch chuẩn (s):

Độ lệch chuẩn cũng có ý nghĩa như phương sai.

Ví dụ: Ta lấy lại ví dụ lớp A và lớp B ở trên. Áp dụng công thức (1) tính phương sai, ta được

Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-13.jpg

Lớp A: Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-14.jpg; từ công thức (3): s=1, 63

Lớp B: Kipkis.com-Phuong-phap-nghien-cuu-khoa-hoc-giao-duc-15.jpg; s=1, 9.

Từ đó cho thấy độ tập trung kết quả vào lớn ở lớp A và nhỏ ở lớp B.

Tác phẩm, tác giả, nguồn

  • Tác phẩm: Tài liệu bài giảng Phương pháp nghiên cứu khoa học giáo dục, 2007
  • Tác giả: Ts. Nguyễn Văn Tuấn, Đại học sư phạm kỹ thuật TP. Hồ Chí Minh
"Like" us to know more!