Thống kê ứng dụng – SPSS căn bản: giới thiệu

Hiện nay, dữ liệu (data) là một thứ có thể tìm kiếm khắp mọi nơi, tuy nhiên, xử lý data là một bài toán khó cho tất cả các doanh nghiệp. Việc xử lý data có thể giúp doanh nghiệp tìm ra được  điểm yếu để cải thiện, cũng có thể đẩy doanh nghiệp đi xa khỏi mục tiêu của mình. Hiểu được tầm quan trọng của việc thu thập và xử lý các “con số biết nói” hiện nay, FLC xin gửi tới các bạn chuỗi bài viết về Thống kê ứng dụng cho những người mới bắt đầu, và SPSS (viết tắt của Statistical Package for the Social Sciences) – một phần mềm phục vụ việc phân tích dữ liệu căn bản và khá phổ biến ở Việt Nam hiện nay, sẽ là công cụ đầu tiên mà chúng tôi quyết định sẽ tiếp cận trong chuỗi bài viết này.

I. Lợi ích và sự nguy hiểm của việc phân tích dữ liệu

Bạn có bao giờ thắc mắc việc tại sao luôn phải ghi chép và báo cáo lại tất cả mọi thứ đang diễn ra trong doanh nghiệp của bạn? Hoặc ví dụ, trong giáo dục, tại sao phải lưu trữ và tổng hợp điểm thi của học sinh qua từng năm, qua từng thời kỳ? làm sao để xác định rằng phương thức giáo dục của nhà trường hiện tại đã thực sự mang lại hiệu quả như những lời cam kết? Đặc biệt, phải làm gì để có thể cải thiện chất lượng học tập và giảng dạy? Sự thật là, việc phân tích dữ liệu hoàn toàn có thể giúp nhà trường tìm ra câu trả lời cho những câu hỏi mơ hồ và “nan giải” đã được nêu trên.

Thông thường, khi nhắc tới phân tích và thu thập dữ liệu (data), người ta sẽ thường nghĩ ngay tới nền công nghiệp, nơi những nhà máy lớn hoạt động cùng với hàng ngàn công nhân, những con số và máy móc phức tạp, hay là những doanh nghiệp với chiến lược và kế hoạch kinh doanh phức tạp. Cũng rất dễ hiểu vì rằng bằng một cách nào đó, thống kê và phân tích đã mang lại cho các doanh nghiệp tăng hiệu suất làm việc và tối ưu hóa lợi nhuận một cách đáng kể. Tuy nhiên, ngành giáo dục cũng sẽ không trở thành ngoại lệ, vì thống kê hoàn toàn có thể được ứng dụng và khai thác triệt để trong lĩnh vực này.

Thống kê có thể giúp gì cho giáo dục? đâu là những ưu và nhược điểm trong việc áp dụng phương thức phân tích này?

Trong giáo dục, dữ liệu sẽ tồn tại không chỉ dựa vào các ghi chép về điểm số giữa kỳ, cuối kỳ, các số liệu về học sinh qua từng năm học (số học sinh lên lớp, chuyển trường, phần trăm học sinh giỏi các khóa,…), những phản hồi (feedback) của học sinh, phụ huynh, giáo viên… mà còn là những sự quan sát về hành vi và phản hồi của học sinh trong quá trình học tập. Nhờ vào việc quan sát, thu thập và phân tích những dữ liệu này, nhà trường sẽ có thể giải quyết được một số khía cạnh như sau:

  • Nhìn nhận lại các “biến cố” đã xảy ra, biết được vấn đề trong quá khứ: việc phân tích và sử dụng số liệu có thể giúp nhà trường tìm ra các lỗ hổng trong cách vận hành, các chính sách giảng dạy trong quá khứ, từ đó có thể chủ động tiến hành tìm kiếm nguyên nhân và loại bỏ các yếu tố này, nhằm việc trách lặp lại các “sai lầm” tiếp diễn trong hiện tại và tương lai. Ví dụ, khi phân tích điểm tổng kết sau các năm học, nhà trường có thể hiểu được phần nào hiệu quả của năm học vừa qua, từ đó phân tích chuyên sâu về những “điểm bất thường” trong các số liệu về từng môn học, thu gọn phạm vi gây ra sự bất ổn, từ đó đưa ra những biện pháp phòng ngừa thích hợp.
  • Cập nhật tình hình hiện tại của trường học: bằng các con số và những sự quan sát, so sánh hợp lý, nhà trường có thể đưa ra những dự đoán về hiệu quả học tập, phản ứng của học sinh về những phương pháp giảng dạy mà nhà trường áp dụng trong thời điểm hiện tại. Từ đó, có thể phần nào nhận định được chất lượng học tập, hiệu suất tiếp thu kiến thức của học sinh, và hiệu quả giảng dạy cả chính các giáo viên. Bên cạnh đó, việc quan sát và đánh giá này cũng bổ trợ cho việc theo dõi, phân tích và khám phá kịp thời xu hướng học tập mong muốn cũng như nhu cầu của học sinh phát sinh một cách ngẫu nhiên và khó lường.
  • Dự đoán xu hướng trong tương lai : Tiếp nối theo việc nắm bắt kịp thời nhu cầu mong đợi của học sinh, việc sử dụng các loại dữ liệu khác nhau để phân tích và nhận định cũng sẽ giúp trường học có một cái nhìn tổng quát về toàn bộ nền giáo dục trong nước và thậm chí ở ngoài nước. Điều này sẽ giúp nhà trường có thể học tập và du nhập nhiều những phương pháp đã và đang mang lại hiệu quả tốt trong môi trường học đường, cải tiến liên tục các phương pháp giảng dạy, nâng cao chất lượng học tập và vận hành trường học, nâng cao khả năng nắm bắt cơ hội trong môi trường cạnh tranh gay gắt và sáng tạo hiện nay.

Tuy nhiên, bên cạnh những lợi ích to lớn của thống kê ứng dụng, việc lạm dụng và quá phụ thuộc vào chúng cũng sẽ dẫn tới rất nhiều hệ lụy nghiêm trong cho các doanh nghiệp/ trường học, ví dụ như việc chọn mẫu sai (chọn các đối tượng dữ liệu để phân tích: phản hồi của học sinh trong các môn học, điểm thi đầu vào mỗi năm…), cách đọc và tiếp cận dữ liệu sai (thay vì so sánh để biết được sự khác biệt, hiệu quả sau các kế hoạch thay đổi thì lại chọn việc so sánh với các đối tượng dữ liệu không liên quan trong cùng một thời điểm…), xác định vấn đề và đưa ra kết luận sai, từ đó dẫn tới các phương pháp phòng ngừa và giải quyết không hiệu quả…. Tất cả những sự sai lầm trên có thể dẫn tới những thiệt hại to lớn cho doanh nghiệp, trường học về tài chính, tiêu tốn nhiều thời gian mà không thu được hiệu quả, trì trệ trong việc xử lý các vấn đề tồn động hoặc các vấn đề tiềm năng…

Chính vì vậy, thống kê ứng dụng có thể được coi là một con dao hai lưỡi. Thống kê ứng dụng, phân tích dữ liệu có thể mang lại cho trường học những lợi thế to lớn, những cũng mang theo rất nhiều rủi ro với tầm ảnh hưởng rất lớn tới việc đưa ra những kết luận và quyết định của lãnh đạo.

II. Sử dụng SPSS xử lý các thông tin – căn bản

Dựa trên quá trình tổng hợp và cân nhắc, đội ngũ FLC sẽ tập trung giới thiệu và làm rõ chức năng, hiệu quả của một số phương pháp kiểm định cơ bản mà cực kỳ hữu dụng của SPSS. Cụ thể, trong dự án lần này, FLC sẽ gửi tới các bạn các bài viết về chủ đề sau:

1. Mức độ đo lường (Level of measurement): phân biệt và những lưu ý về các loại thang đo lường trong SPSS, ví dụ minh họa và cách luyện tập phân biệt.

2. Thống kê mô tả (Descriptive statistic): cách đọc các số liệu cơ bản trong bảng chỉ số thống kê mô tả, ứng dụng thực tiễn của các chỉ số này (Mean, Median, mode, SD – phương sai, skewness, Kurtosis, Histogram) và các ví dụ minh họa.

3. T-test and The Mann-Whitney U test : Phương pháp được sử dụng để so sánh giá trị trung bình của một quần thể (hay là một tệp dữ liệu đã được chọn), đưa ra kết quả là liệu rằng giá trị trung bình này có khác với một giá trị cụ thể được định trước hay không, và những lưu ý khi sử dụng.

4. Anova and The Kruskall-Wallis test:  Phương pháp được sử dụng để xác định việc có tồn tại sự khác biệt về phương sai của các nhóm mẫu hay không và những lưu ý khi sử dụng. (định nghĩa và ứng dụng của phương sao sẽ được giải thích ý nghĩa tại mục 1).

5. Paired T-test and Wilcoxon test:  Phương pháp được sử dụng để xác định rằng liệu có sự thay đổi của một tập hợp hay một tệp dữ liệu trước và sau khi có những sự thay đổi hay không, và những lưu ý khi sử dụng.

*Lưu ý: các khái niệm mang tính học thuật trên sẽ được truyền đạt một cách dễ hiểu và thực tế thông qua từng bài viết chuyên sâu nhỏ, các bạn cùng theo dõi chuỗi bài viết trong dự án này của FLC để có thể sử dụng thống kê ứng dụng trong đời sống một cách thuần thục và hiệu quả nhé!

Tác giả: Hương Lê.

Trả lời

Email của bạn sẽ không được hiển thị công khai.