I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. ·...

98
BBÀÀII GGII ẢẢ NNGG TTÓÓMM TT ẮẮ TT VV ỀỀ PPHHÂÂNN TTÍÍCCHH DD ỮỮ LLII ỆỆ UU 1 PPHHÂÂNN TTÍÍCCHH DD ỮỮ LLII ỆỆ UU

Transcript of I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. ·...

Page 1: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

BBBÀÀÀIII GGGIII ẢẢẢNNNGGG TTTÓÓÓMMM TTT ẮẮẮTTT VVV ỀỀỀ PPPHHHÂÂÂNNN TTTÍÍÍCCCHHH DDD ỮỮỮ LLLIII ỆỆỆUUU

1

PPPHHHÂÂÂNNN TTTÍÍÍCCCHHH DDD ỮỮỮ LLLIII ỆỆỆUUU

Page 2: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phântích dữ liệu

2

Page 3: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Xác định n.dung cần phân tích để mô tả kết quả xử lý dữ liệu

Xác định loại dữ liệu thu thập được

Phân tích d ữ liệu bao g ồm một số bước sau

Đọc kết quả xử lý, phát hiện ra những điều có tính quy luật, chọn lựa phép kiểm định thống kê để kiểm nghiệm kết quả

Nhập dữ liệu và xử lý kết quả

Chọn kỹ thuật p.tích tương thích với y.cầu của từng n.dung

Viết phần diễn giải để cho những người không thích số liệu và không am hiểu về thống kê có thể theo dõi

Page 4: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phântích dữ liệu

• Không phải dự án nghiên cứu nào đạt được dữ liệu cũng thích hợp cho các phân tích thống kê

• Các phần mềm thống kê giúp chúng ta nhưng không phải là tất cả. Nó giúp chúng ta

4

nhưng không phải là tất cả. Nó giúp chúng ta tính toán nhanh hơn và dể dàng hơn

• Tuy nhiên nhà nghiên cứu phải có đủ kiến thức về các nền tảng của thống kê và các giảđịnh của các kiểm định

Page 5: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phân tích dữ liệu

• Cần bắt đầu việc phân tích bằng việc kiểm tra dữ liệu thô, sử dụng scatterplots, để tìm kiếm các đặc trưng. Tất nhiên các đặc trưng này có thể được kỳ vọng từ tổng quan các lý thuyết và các bài báo đã công bố

5

thuyết và các bài báo đã công bố

• Có thể gặp khó khăn và gian khổ khi phân tích dữ liệu định tính nhưng đừng bỏ cuộc. Hãy kiên trì bạn sẽ nhận được thành quả

Page 6: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phân tích dữ liệu• Các hiệu ứng thị giác và các đồ thị có thể rất

hữu ích trong phân tích dữ liệu. • Cho các ‘dữ liệu thứ cấp’ , như là các kết quả

thống kê mà đã được công bố bởi chính quyền, dữ liệu thô có thể không có sẳn, hoặc là chúng thường không thuận tiện để đánh giá, vì thế

6

thường không thuận tiện để đánh giá, vì thế các dữ liệu đã xuất bản phải được dùng.

Page 7: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phân tích dữ liệu• Phân tích nội dung có thể được thực hiện

một cách đơn giản bởi sự đếm số lần xuất hiện của một biến nghiên cứu

• Tuy nhiên, ngay cả với các phân tích dể dàng, nhận thức và giải thích của nhà nghiên cứu, là cần thiết

7

là cần thiết

Page 8: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

111... Phân tích dữ liệu• Tuy nhiên, mục đích của phân tích là cung cấp các

bằng chứng về các quan hệ và gia tăng sự hiểu biết; trong bối cảnh của quản lý, nó hổ trợ việc ra quyết định– vì thế quan trong là sự luận ra kết luận (inference).

• Sự suy ra kết luận là những gì tuân theo logic từ các

8

• Sự suy ra kết luận là những gì tuân theo logic từ các bằng chứng và quan trọng là biết làm thế nào hiệu lực các bằng chứng đó.

• Hầu hết các phần mềm thống kê có thể thực hiện các thao tác tính toán nhưng nhà nghiên cứu phải biết cái gì đang được làm

Page 9: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

222... Môtả dữ liệu bằng đồ thị

9

Page 10: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Với dữ liệu phân lo ại (categorical data)

• Bảng tần suất (xem sách “Thống kê ứng dụng trong kinh tế - xã hội” – Hoàng Trọng & Chu Nguyễn Mộng Ngọc, trang 38 – 53)

• Đồ thị thanh (bar charts)• Đồ thị thanh (bar charts)• Đồ thị bánh (pie charts)• Bảng ngẫu nhiên (contingency tables)

10

Page 11: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Với dữ liệu định lượng (qualitative data)

• Histogram• Các chú ý:

– Không tạo ra một histogram với biến phân loạiloại

– Tránh những quy mô đo lường không thích hợp

– Ghi tên các biến cẩn thận

11

Page 12: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Một khi dữ liệu đã được thu thập xong, nó là hữu ích để tạo ra các sơ đồ hoặc đồ thị của chúng (một ‘scatter plot’ của dữ liệu thô).

• Các đồ thị như thế để chỉ ra tính chất của phân phối dữ liệu và mối quan hệ giữa

12

phân phối dữ liệu và mối quan hệ giữa chúngđể mà các kỹ thuật thống kê thích hợp có thể được thực hiện trong phân tích. – Với biến lưỡng phân như là ‘có’ hoặc ‘không’,

cross-tabulations, hoặc bảng ngẫu nhiên, mà được dùng để khám phá các đặc trưng, kỹ thuật thống kê thường dùng là χ2 (chi-square) test

Page 13: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

13

Page 14: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Tần suất của Ad Recall

Value Label Value Frequency Percent Valid CumulativePercent Percent

14

Page 15: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Một bảng tần suất (frequency table) là phương tiện đơn giản cho sự mô tả dữ liệu. Nó mô tả các mã phân loại từ thấp nhất đến cao nhất, với các cột là tần suất, phần trăm, phần trăm hiệu lực và phần trăm tích lũy.

• Ad recall, một biến danh nghĩa (nominal variable), mô tả những người tham gia nghiên cứu quảng cáo nhớ lại những gì nhìn thấy hoặc nghe mà không có sự nhắc nhở của nhà nghiên cứu hoặc các thiết bị khác

15

thiết bị khác• Mặc dù chỉ có 100 quan sát, một số lượng chỏ của

các phương tiện nghe nhìn đã được lập thành bảng (slide trước).

• Dữ liệu này được trình bày dưới dạng đồ thị bánh (pie chart) và đồ thị thanh (bar chart) ở các slide kế tiếp

Page 16: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Đồ th ị bánh

16

Page 17: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Đồ th ị thanh

17

Page 18: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Đồ thị bánh và đồ thị thanh thường dùng cho dữ liệu phân loại (categorical data)

18

Page 19: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Histogram

• Histogram là giải pháp truyền thống để hiển thị dữliệu interval-ratio.

• Histograms được dùng khi nó có thể nhóm giá trị các biến thành các khoảng (intervals)

• Một histogram là sự đồ thị hóa đồ thị thanh (bar chart) mà các nhóm giá trị dữ liệu liên tục thành các khoảng bằng nhau với một thanh cho một khoảng dữ

19

chart) mà các nhóm giá trị dữ liệu liên tục thành các khoảng bằng nhau với một thanh cho một khoảng dữ liệu

• Phân tích dữ liệu với các histograms hữu ích cho:1) hiển thị các khoảng trong một phân phối, và 2) kiểm tra hình dạng của phân phối cho skewness, kurtosis,

và đặc trưng hình thái (modal pattern).

Page 20: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Histogram

• Các giá trị biến doanh số trung bình hàng năm được trình bày trong hình kế.

• Histogramskhông hữu ích cho các biến danh nghĩa như là ad recallmà không có cho các sự phân loại của chúng

20

phân loại của chúng

Page 21: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Histogram: Các giá trị biến doanh sốtrung bình hàng năm

21

Page 22: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Trong trường hợp bất kỳ, nó là hữu ích nếudữ liệu thô được trình bày trong phụ lục của một báo cáo nghiên cứu;

• Dữ liệu là giá trị cho các nghiên cứu chi tiết, các kiểm định, … cũng như là cho kiểm tra

22

các kiểm định, … cũng như là cho kiểm tra và thẩm tra kết quả

Page 23: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Stem-and-Leaf

• Hình tiếp theo hiển thị giá trị mua hàng năm trung bình (average annual purchase values) của một công ty XD

23

Page 24: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Hiển th ịStem-and-

Leaf

5678910111213

455666788889124667990223567802268

2401831

24

Leaf1415161718192021

06336

3

68

Page 25: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Stem-and-leaf hiển thị kỹ thuật mà rất gần gủi với histogram.

• Ngược lại với histograms, mà thông tin bị mất bởi nhóm các giá trị dữ liệu vào trong các khoảng (intervals), stem-and-leaf trình bày giá trị dữ liệu thực tế mà có thể được kiểm tra thực tế trực tiếp,

25

thực tế mà có thể được kiểm tra thực tế trực tiếp, không có sử dụng thanh đính kèm hoặc dấu hoa thịnhư là sự trình bày medium.

• Sự hình dung là ưu điểm thứ hai của stem-and-leaf. Các đặc tính trong dữ liệu được quan sát dể dàng.

Page 26: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Mỗi dòng được đề cập như là một stem, và mỗi mảnh của thông tin được gọi là một leaf.

• Trong stem thứ nhất, có 12 items (leaves) trong bộ dữliệu mà số thứ nhất là 5. – 455666788889 trình bày

54,55,55,56,56,56,57,58,58,58,58,59

• Dòng thứ 2 trình bày có 8 giá trị mua hàng năm trung

26

• Dòng thứ 2 trình bày có 8 giá trị mua hàng năm trung bình (average annual purchase values) mà số đầu tiên là 6. – 12366799 trình bày 61,62,63,66,66,67,69,69

Page 27: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Đồ thị Pareto: Sự than phiền của khách hàng

27

Page 28: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Đồ thị Pareto trình bày dữ liệu như là một thanh, thứ tự từ thấp nhất, đường đè lên đồ thịmô tả phần trăm tích lũy tại mỗi cấp độ biến.

• Tổng cộng là 100%.

28

• Tổng cộng là 100%.

• Thường dùng đồ thị Pareto trong quản lý chất lượng

Page 29: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Boxplot

29

Page 30: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Các chẩn đoán với Boxplots

30

Page 31: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Boxplots là công cụ chẩn đoán xuất sắc, đặc biệt khi scale tương tự nhau.

• Hai plots bên trên là đối xứng nhưng một cái thì rộng hơn.

31

thì rộng hơn. – Bề rộng box (Larger box widths) rộng hơn thỉnh

thoảng được dùng khi biến thứ 2 (từ quy mô đo lường giống nhau) đến từ mẫu lớn hơn.

Page 32: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Bản đồ hóa

Dùng màu để mô tả trên bản đồ các

32

tả trên bản đồ các đặc trưng của mẫu hoặc kết quảnghiên cứu

Page 33: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Bản đồ kỹ thuật số (Digital Camera Map)

Bản đồnày mô tảphân bổtheo địa lý của sựthâm nhập thị trường

33

thị trường máy ảnh kỹ thuật sốcủa một công ty phân phối máy ảnh tại My

Page 34: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

BÀI T ẬP NHÓM TẠI LỚP (20 PHÚT)• Dùng loại phân tích nào cho dữ liệu thu thập

trong luận văn mà nhóm đã chọn

• Với dữ liệu đã thu thập được, hãy liệt kê:– Loại đồ thị nào đã được dùng để hiển thị cho dữ liệu – Loại đồ thị nào đã được dùng để hiển thị cho dữ liệu

thu thập được ứng với từng câu hỏi. Giải thích tại sao lại dùng loại đồ thị đó

– Nếu các đồ thị đã dùng là không tương thích với loại dữ liệu đã thu thập, hãy đề xuất ý kiến của nhóm. Giải thích tại sao?

34

Page 35: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

333... Cácphương pháp thống kê

35

Page 36: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

333... Cácphương pháp thống kêVài phương pháp thống kê thông thường được dùng trong phân

tích dữ liệu là :• Các kiểm định phi tham số (non-parametric tests)

◦ sign test◦ rank-sum test◦ chi-square test

36

◦ goodness of fit

• Các kiểm định tham số (parametric tests)◦ t-test◦ ANOVA (analysis of variance)

• Hồi quy và tương quan• Chuỗi thời gian (time series)• Các chỉ số (index numbers)

Page 37: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

333... Các phương pháp thống kê

• Các kiểm định tham số và phi tham số là có sẳn cho các giả định kiểm tra liên quan đến sự khác nhau trong thang đo metric và non-metric.

• Trong các trường hợp tham số, t-testđược dùng đểkiểm định các giả thiết liên quan đến các trung bình của mẫu

37

bình của mẫu.

• Trong các trường hợp phi tham số, các kiểm định phổthông nhất bao gồm chi-square, binomial test,và Mann–Whitney U-test (xem bảng 7.1)

Page 38: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

38

Page 39: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Sign test

• Kiểm định phi tham số là phân phối-tự do và vì thế là linh động hơn trong áp dụng

• Sign testkiểm tra cặp dữ liệu mà sử dụng dấu cộng (+) và trừ (−)

39

cộng (+) và trừ (−)

Page 40: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

40

Page 41: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Sign test

• HO: p = 0.5 (không có sự khác biệt giữa ngói A và B)

• HA: p ≠0.5 (Có sự khác biệt giữa ngói A và B)

• Loại trừ số 0:

41

• Loại trừ số 0:

• n = 11

• p = 6/11 (tỷ lệ của ‘successes’)

• q = 5/11 (tỷ lệ của ‘failures’)

• Cho ‘không khác biệt’, pHO = qHO = 0.5

Page 42: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Sign test

� không có sự khác biệt trong nhận thức kiến trúc giữa các loại ngói (Không thể bác bỏ HO)

42

Page 43: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Cáckiểm định phi tham số: Rank-sum tests

• Ki ểm định Rank-sumđược dùng để kiểm tra có hay chăng các mẫu độc lập được rút ra từmột tập hợp.

• Kiểm định Mann–Whitney U-testđược dùng

43

• Kiểm định Mann–Whitney U-testđược dùng khi có 2 mẫu, và Ki ểm định Kruskal–Wallis K-testđược dùng khi có 3 mẫu trở lên

Page 44: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

44

Page 45: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

45

Page 46: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Rank-sum tests

Dùng standard form của Mann–Whitney U-test:• The U-statistic là sự đo lường của sự khác biệt

giữa các quan sát thứ hạng của 2 mẫu

H : Các mẫu là từ

46

HO: Các mẫu là từ cùng một tập hợpHA: Các mẫu là từnhững tập hợp khác nhau

Page 47: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Rank-sum tests

• Nếu HO đúng, các mẫu là cùng từ một tập hợp và U-statistic có phân phối được miêu tả bởi:

µ = mean

47

µu = meanz-value = Mức tin cậy được yêu cầuα = Mức tin cậy

Page 48: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

48

Page 49: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Rank-sum tests

• Theo Levin and Rubin (1990, p. 609), K-statistic có thể xấp xỉbằng một phân phối chi-square khi tất cả các kích thước mẫu là tối thiểu 5. Độ tự do (degrees of freedom) là k − 1.

• HO: µ1 = µ2 = µ3• HA: µ1, µ2, µ3 là không bằng nhau• α = 0.05

49

• α = 0.05Từ bảng của phân phối chi-square; với 2 bậc tự do và 0.05 của

vùng bên dưới đôi phải, χ2 = 5.991.• Vì giá tr ị tính toán của K là nhỏ hơn giá trị tương ứng

trong bảng χ2, mẫu nằm trong vùng chấp nhận và vì thế HOnên được chấp nhận � không có sự khác biệt giữa các loại xe tải

Page 50: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Chi-square (χ2) test

• Chi-square testđược dùng để so sánh tần suất kỳ vọng và tần suất quan sát của một biến mà có 3 hoặc nhiều loại hơn, để kiểm tra có hay chăng hai tỷ lệ tập hợp hoặc nhiều

50

tra có hay chăng hai tỷ lệ tập hợp hoặc nhiều hơn có thể được cân nhắc là cân bằng.

• Một cách tổng quát, phân phối χ2 không nên được dùng nếu nội dung của bất kỳ một cell có tần suất kỳ vọng thấp hơn 5

Page 51: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Biên soạn & giảng: PGS.TS. Lưu Trường Văn, Đại học Mở TP.HCM 51

Page 52: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

444... Các kiểm định phi tham số: Goodness of fit

• Godness of fit của dữ liệu đến một phân phối nào đó được kiểm tra bởi Kolmogorov–Smirnov test. Ki ểm định χ2 có thể được dùng cho mục đích này.

• Thống kê Kolmogorov–Smirnov, Dn, là giá trị tối đa của trị tuyệt đối độ lệch fe − fo, với fe và fo là tần

52

của trị tuyệt đối độ lệch fe − fo, với fe và fo là tần suất tích lũy tương đối giữa kỳ vọng và quan sát.

• Giá tr ị tiêu chẩn được lập bảng để mà nếu giá trị tính toán của Dn là nhỏ hơn giá trị trong bảng, giảthiết ‘không’ mà mẫu với phân phối được thừa nhận không thể được bác bỏ, vì thế, chấp nhận

Page 53: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

5. Các kiểm định tham số

• Các kiểm định tham số giả định rằng phân phối là được biết, hoặc mẫu đó là rộng, đểmà phân phối chuẩn có thể được giả định; equal intervalhoặc ratio scalesnên được dùng

53

equal intervalhoặc ratio scalesnên được dùng để đo lường

Page 54: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: t-test

• t-test được dùng để xác định nếu mean của một mẫu là tương tự với mean của một tập hợp

54

Trong đó: ˆσx là sai số chuẩn đã ước lượng của mean.Bậc tự do là (n − 1).ttab = giá trị lầy từ đồ thị của phân phối t đã được lập bảng

Page 55: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: t-test

• T-test có thể được dùng để kiểm tra mean của hai mẫu:

55

Page 56: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Analysis of variance (ANOVA)

• Analysis of variance (ANOVA)được dựa trên phương pháp thống kê gọi là F-test, mà tỷ số các phương sai trong vòng các điều kiện (phương sai giữa-các-nhóm) đến phương sai trong vòng các điều kiện (trong-vòng-các-nhóm, hoặc phương sai của sai

56

kiện (trong-vòng-các-nhóm, hoặc phương sai của sai số (error variance)).

• Phương sai giữa các nhóm rộng hợn một cách tương đối đến phương sai trong vòng các nhóm, Giá trị tính toán lớn hơn của F, và có lẽ là có sự khác biệt trong vòng các mean của điều kiện phản ánh ảnh hưởng thực của biến độc lập hơn là phương sai sai số

Page 57: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Analysis of variance (ANOVA)

• ANOVA và t-testđược phát triển trong bối cảnh của nghiên cứu thử nghiệm để kiểm tra sự khác biệt trong vòng means của các nhóm thử nghiệm nhưng chúng cũng áp

57

nhóm thử nghiệm nhưng chúng cũng áp dụng rộng rãi đến phân tích dữ liệu từ dữliệu các nghiên cứu thử nghiệm phi tham số(non-experimental studies).

Page 58: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Thông thường, hồi quy và tương quan được cân nhắc lẫn nhau trong sự biểu lộ một quan hệgiữa 2 biến: một hoặc nhiều giá trị đã biết (biến độc lập) và một không biết (biến phụ

58

(biến độc lập) và một không biết (biến phụ thuộc).

• Để nghiên cứu rõ ràng, nó là thích hợp, tối thiểu lúc bắt đầu, cân nhắc các biến trong một cặp –một biến độc lập và 1 biến phụ thuộc.

Page 59: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Số liệu hồi quy và tương quan thiết lập thiết lập mối quan hệ nào đó giữa các giá trị đã nhận biết của các biến mà xuất hiện; chúng không thiết lập quan hệnhân quả, mà là phạm vi của lý thuyết và lô gic có lý,

59

dưới ánh sáng của thống kê

• Một cách truyền thống, biến độc lập được vẽ trên trục X và biến phụ thuộc được giả định trên trục Y.

• Hồi quy tuyến tính cân nhắc đường quan hệ giữa 2 biến là tuyến tính

Page 60: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Dạng chuẩn của phương trình đường thẳng là:

y = a + bx

• Trong đó:– a là tung độ gốc (intercept) của đường thẳng và

60

– a là tung độ gốc (intercept) của đường thẳng và

– b là độ dốc của đường thẳng.

• Vì thế, cho tối thiểu 2 điểm trên scatter plot (một đồ thị liên quan đến các giá trị x & y), ta có thể vẽmột đường hồi quy

Page 61: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Có quan hệthuận khi đường hồi quy có độ dốc dương, hướng từ trái sang phải

61

phải

Page 62: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Đường thẳng hồi quy, đường thẳng phù hợp nhất đi quan các điểm dữ liệu, sử dụng tiêu chuẩn bình phương tối thi ểu.

• Một đường hồi quy được dùng cho ước lượng –

62

• Một đường hồi quy được dùng cho ước lượng –sẽ có sai số giữa đường thẳng và các điểm dữ liệu thực tế.

Page 63: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Phương trình của đường hồi quy là:• Trong đó: y (y-hat) là các giá trị trên

trục Y được ước lượng bởi phương trình

Sai số bình phương tối thi ểu (Least-squares

63

Sai số bình phương tối thi ểu (Least-squares error), để xác định đường thẳng phù hợp nhất, tối thi ểu hóa (y − ˆy)2. Cho các điểm dữ liệu mà liên quan đến biến độc lập x và biến phụ thuộc y, Levin and Rubin (1990, p. 491) phát biểu các phương trình đểxác định đường thẳng phù hợp nhất:

Page 64: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• b = độ dốc của đường thẳng tốt nhất (ước lượng/hồi quy)• x = các giá trị của biến độc lập• y = các giá trị của biến độc lập• x = Trung bình của các giá trị x• y = Trung bình các giá trị của y• n = số lượng các điểm dữ liệu (các cặp giá trị của các biến x, y)

64

• n = số lượng các điểm dữ liệu (các cặp giá trị của các biến x, y)• a = y-intercept.Sai số chuẩn của các đo lường ước lượng tính biến đổi các giá trị

thực tế từ đường hồi quy:

Page 65: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Hồi quy giả định rằng sự phân tán của các điểm dữliệu xung quanh đường thẳng thích hợp nhất là ‘ngẫu nhiên’, trong trường hợp ngược lại gọi là homoscedastic.

• Nếu có đặc trưng cho sự phân tán của các điểm dữ liệu, mà trình bày sự phân tán là khác biệt tại các điểm khác

65

mà trình bày sự phân tán là khác biệt tại các điểm khác nhau, heteroscedasticity được trình bày và vì thế hồi quy là có vấn đề.

• Một cách chặt chẽ, homoscedasticitylà sai số có phương sai không đổi; heteroscedasticitylà phương sai của sai sốthay đổi dọc theo chiều dài của đường hồi quy (Pindyck & Rubinfeld 1981, p. 49)

Page 66: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Hệ số tương quan (coefficient of correlation), r, nhận dạng mức độ và tính chất mối quan hệ giữa 2 biến, từquan hệ thuận hoàn hảo (+1) đến quan hệ nghịch hoàn hảo (−1), tức là, −1 ≤ r ≤ +1

• Nếu r = 0 không có quan hệ; các thay đổi trong các biến là hoàn toàn độc lập với nhau; chúng là ngẫu nhiên.

66

biến là hoàn toàn độc lập với nhau; chúng là ngẫu nhiên. • Tuy nhiên, nó là thông thường để biết thay đổi bao nhiêu

trong các giá trị của một biến phụ thuộc bị gây ra, bởi một thay đồi trong các giá trị của một biến phụ thưộc. Thống kê được yều cầu là coefficient of determination, r2

Page 67: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Nếu r2 = 0.81 (tức là r = 0.9), 81% của các thay đổi trong y được gây ra bởi các thay đổi trong x.

Hệ số r2 có thể được tính toán theo phương pháp sau:

Một mẫu của dữ liệu có sự khác biệt về mean của chính nó là (về phương diện sai số bình phương tối thiểu):

67

là (về phương diện sai số bình phương tối thiểu):

• Σ(y − y)2

Một cách tương tự, sự sai biệt của dữ liệu về đường hồi quy là:

• Σ(y − ˆy)2

Page 68: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Hệ số xác định của mẫu là:

R2 đo lường sức mạnh của một quan hệ tuyến tính giữa các biến.

68

biến.Levin and Rubin (1990, p. 510) ghi chú ‘phương pháp short-cut’ cho tính toán r2 và các gói thống kê (các phần mềm thống kê) có thể tính r2 một cách trực tiếp:

Page 69: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

69

Page 70: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Các trung bình (Means) và các độ lệch chuẩn (standard deviations) lúc này là không thích hợp.

• Tương quan thứ hạng nên được dùng.

• Các thứ hạng của sự hài lòng đạt được từ từ sự

70

• Các thứ hạng của sự hài lòng đạt được từ từ sự kiểm tra các điểm trong cột hoàn toàn hài lòng (cột thứ 1)

Page 71: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

71

Page 72: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Hồi quy & t ương quan

• Hệ số của sự tương quan giữa các thứ hạng là một đo lường mối quan hệ giữa hai (02) biến mà được xác định từ các thứ hạng của các quan sát của các biến. Nó được gọi là Hệ số Spearmancủa tương quan thứ hạng, ρ:

72

Page 73: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Multiple regression

• Phân tích hồi quy ám chỉ đến các quan hệ của các thay đổi trong các mức độ của y đến các thay đổi trong các mức độ của x.

• Trong hồi quy bội, giá trị của biến đầu ra dự

73

• Trong hồi quy bội, giá trị của biến đầu ra dự báo y được xem như là phụ thuộc vào, độ dốc trên trục y, và các giá trị của các biến x1, x2, x3, xk

v.v…. được nhân với hệ số β được chọn trong thực hành để mà tối thiểu hóa các sự khác nhau giữa các giá trị dự báo và đạt được y

Page 74: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Multiple regression

• Giá trị c được thêm vào để mô tả sự khác biệt giữa một giá trị cụ thể của y và giá trị dự báo cho biến y đó. Vì thế, cho 2 biến đầu vào, x1 and x2, phương trình là:

y = α + β x + β x + c

74

y = α + β1x1 + β2x2 + c• Số lượng các biến đầu vào tăng thêm, tất cả sự

thay đổi của β và α để mà độ lớn, dấu và sự đáng kể thống kê của mỗi hệ số hồi quy phụ thuộc một cách hoàn toàn vào chính xác của những biến đầu vào khác trong phu7o7gn trình hồi quy

Page 75: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Phần mềm SPSS cung cấp 3 phương pháp phân tích hồi quy cho việc xây dựng mô hình bởi sựkiểm soát việc đưa vào hoặc lấy ra các biến: forward, backward eliminationvà stepwise selection.

75

selection.

• Forward đưa các biến vào trong mô hình từng biến một với tương quan đơn giản + (hoặc -) mạnh nhất với biến phụ thuộc và dừng khi tiêu chuẩn đã thiết lập cho F không giữ nữa.

Page 76: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

• Backward elimination bắt đầu với các biến tiềm năng trong mô hình, sau đó, tại mỗi bước, nó lấy ra các biến đầu vào mà thích hợp kém nhất với mô hình.

• Stepwise bắt đầu giống forward nhưng tại mỗi bước, các biến kiểm tra sẳn sàng trong mô hình

76

bước, các biến kiểm tra sẳn sàng trong mô hình cho việc lấy ra.

• SPSS (1997) phát biểu rằng không có cái nào trong 3 phương pháp trên cung cấp tập hợp con tốt nhất trong ý nghĩa tuyệt đối

Page 77: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Time series

• Hầu hết các dữ liệu mà được dùng bởi các nhà nghiên cứu là chuỗi thời gian (time series).

• Chúng là sự đo lường của các biến liên tục như là nhiệt độ của không khí tại một vị trí cụ thể, theo

77

nhiệt độ của không khí tại một vị trí cụ thể, theo những thời đoạn cố định.

Page 78: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Time series

• Bước thứ nhất là tạo ra một scatter plot, kế tiếp best fitđược dùng để trình bày xu thế thời gian.

• Nó là tốt nhất để chọn hình dạng đơn giản và những công thức toán học đã biết – đường thẳng

78

những công thức toán học đã biết – đường thẳng (straight line), lũy thứa lgaric (logarithmic exponential), Gompertz, logistic, đa thức (polynomial).

Page 79: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Time series

• Các phương trình toán học tiêu chuẩn cho các đường là:

79

Sự hiểu biết rõ các hình dạng của các đường được tạo ra bởi các phương trình dạng tiêu chuẩn sẽ là sự giúp đỡ đáng chú ý trong xu thếthích hợp (trend-fitting). Tốt nhất nên tránh lũy thừa cao của x

Page 80: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kiểm định tham số: Time series

• Các phương pháp khác là semi-averages và trung bình trượt (moving averages).

• Với semi-averages, bộ dữ liệu được phân chia thành những cái phân nữa (halves), trung bình

80

thành những cái phân nữa (halves), trung bình của mỗi phân nữa được tính toán và đường xu thếsemi-averagelà đường thẳng xuyên qua các điểm trung bình của hai bộ phân nữa, tức là, các điểm semi-average.

Page 81: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

81

Page 82: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

555... Các kỹ thuật phân tích khác: Cluster analysis

• Các thuật toán thích hợp được dùng trong Phân Tích Đám (cluster analysis)chia dữ liệu thành các đám/nhóm.

• Có 2 kiểu cơ bản của kỹ thuật chia đám: hierarchical và partitioning (được thực hiện bởi Statistical Package for Social Sciences (SPSS))

82

Package for Social Sciences (SPSS))• Phương pháp thứ bậc (hierarchical method) thực

hiện sự phân chia liên tiếp dữ liệu, mà tạo ra sự phân bổ không thể hủy bỏ được của các đám,

• Phương pháp phân chia (partitioning method)cho phép dữ liệu để chuyển đổi thành phần của đám.

Page 83: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Phân tích nhân tố là phương pháp đa biến mà mối quan hệ trong vòng khó khăn để giải thích các biến tương quan trong một vài khía cạnh của những khái niệm có ý nghĩa, các nhân tố độc lập một cách tương đối, mỗi của chúng trình bày vài bộ của những biến ban đầu (Rummel 1970; Kleinbaum et al. 1988;

83

ban đầu (Rummel 1970; Kleinbaum et al. 1988; Comrey & Lee 1992), tức là các biến được nhóm thành những nhóm thành phân nhỏ hơn (factor extraction) mà có thể được dùng để trình bày các quan hệ trong vòng những bộ của nhiều biến có tương hổ nhau (xem Norusis 1992).

Page 84: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Ví thế, một nhân tố là một kiểu cấu trúc ẩn (latent construct)trong đó một cấu trúc là một sự hợp nhất của các biến và là ẩn bởi vì nó không thể được quan sát (và đo lường) một cách trực tiếp nhưng chỉ thông quan các biến tạo thành.

• Một cách thông thường, goodness of fitcủa các biến

84

• Một cách thông thường, goodness of fitcủa các biến mà được tin tưởng để cấu thành cấu trúc được đánh giá bởi các trung bình của tính toán Chronbach’s alpha (α), mà là hệ số của sự tin cậy (consistency).

• Vì thế, Chronbach’s alphasử dụng thang đo của sốbiến mà được tin tưởng để cấu thành cấu trúc và tương quan giữa chúng:

Page 85: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

N là số lượng biếnr là trung bình tương quan nội giữa các biến.

• Một cách tổng quát, mức độ tiêu chuẩn cho sựtin cậy khi dùng Chronbach’s alpha là 0.7; bất kỳ hệ số dưới mức nói trên chỉ ra rằng các biến là tương quan nội không đủ để phối hợp đạt được

85

tương quan nội không đủ để phối hợp đạt được một cấu trúc ẩn. • Ngoại trừ được dùng trong factor analysis, Chronbach’s alpha được dùng như một chỉ số tin cậy – như là trong đo độ tin cậy của quy mô đo lường trong Khoa học xã hội.

Page 86: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Một cách thông thường, sự trích xuất nhân tố (factor extraction) được làm bởi các trung bình của phân tích các thành phần chính (principal components analysis) mà biến đổi bộ gốc của các biến thành một bộ nhỏ hơn của các phối hợp tuyến tính mà chịu trách

86

nhỏ hơn của các phối hợp tuyến tính mà chịu trách nhiệm cho hầu hết các sự khác biệt của bộ gốc.

• Các thành phần chủ yếu (principal components) được trích xuất để mà thành phần chủ yếu thứ nhất (first principal component) chịu trách nhiệm cho sự khác biệt lớn nhất trong dữ liệu.

Page 87: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Các kiểm định khác nhau được yêu cầu cho sự thích hợp của sự trích xuất nhân tố, bao gồm Kaiser– Meyer–Olkin (KMO) đo lường sự chính xác của lấy mẫu và Barlett test of sphericity mà kiểm tra giả thiết rằng ma

87

sphericity mà kiểm tra giả thiết rằng ma tr ận tương quan là ma trận đồng nhất.

• Một cách thông thường, một bộ dữ liệu của tối thi ểu 100 số liệu là cần thiết cho factor analysis.

Page 88: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Vì đặc trưng nổi bật của phân tích các thành phần chủ yếu (principal components analysis) là khả năng giảm dữ liệu của nó, nó phải xác định số lượng nhân tố còn lại.

• Kaiser (1958) đề nghị rằng một tiêu chuẩn cho xác

88

• Kaiser (1958) đề nghị rằng một tiêu chuẩn cho xác định số lượng nhân tố còn lại là loại tr ừ các nhân tố với các phương sai nhỏ hơn 1.

• Lý do căn bản cho điều này là bất kỳ nên chịu trách nhiệm cho nhiều phương sai hơn là bất cứ biến đơn nào trong khoảng điểm kiểm tra tiêu chuẩn.

Page 89: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Vì mục đích của phân tích nhân tố là nhóm các biến thành các nhân tố (hoặc các thành phần chủ yếu) mà được xác định bởi factor loadings, mà là sự giải thích có ý nghĩa của của các nhân tố đã được tạo ra là quan trọng.

• Factor loadings(hoặc các hệ số) cung cấp các tương quan giữa các biến và các nhân tố.

89

• Factor loadings(hoặc các hệ số) cung cấp các tương quan giữa các biến và các nhân tố.

• Trong khi factor loading = 0.30thường được dùng như là cách thức xác định sự đáng kể (vì thế các biến mà có factor loadings < 0.30là không được bao gồm trong các nhân tố),

• Nunnally (1978, p. 434) đề nghị rằng nó là đáng nghi với các factor loadings < 0.40

Page 90: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Factor analysis

• Để dể dàng giải thích cho sự trích xuất, các thành phần chủ yếu thường được xoay.

• Có một vài cách xoay có sẳn trong SPSS và những phương pháp thông dụng nhất là varimax và oblimin.

• Dillon and Goldstein (1984) khẳng định rằng phương

90

• Dillon and Goldstein (1984) khẳng định rằng phương pháp varimax là thông dụng nhất để xoay các giải pháp các thành phần chủ chốt.

• Trong thuật ngữ đơn giản, thủ tục tìm kiếm để xoay các nhân tố để mà phương sai của bình phương các factor loadingscho một nhân tố đã biết được làm đểcho phép giải thích dể dàng dựa trên sự đáng kể của các loadings

Page 91: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Cáckỹ thuật phân tích khác: Path analysis

• Phân tích hướng đi (Path analysis)là sự tổng quát hóa của hồi quy bội mà cho phép một ai đó ước lượng sức mạnh và dấu của các quan hệ có hướng cho các phối hợp nhân quả phức tạp với các biến phụ thuộc bội (multiple dependent variables) (Li 1975).

• Path analysis cung cấp cho các nhà nghiên cứu với 1

91

• Path analysis cung cấp cho các nhà nghiên cứu với 1 phương pháp đa biến để ước lượng, một cách tương đối, ảnh hưởng nhân quả trực tiếp, gián tiếp và toàn bộ trong vòng các cấu trúc ẩn – giả định rằng mô hình lý thuyết vững chắc bao gồm các quan hệ nhân quả đã giả định ưu tiên của các cấu trúc có liên quan, đã được quan niệm (see Bollen 1989; Mueller 1996).

Page 92: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Cáckỹ thuật phân tích khác: SEM

• Sự mô hình các phương trình cấu trúc (Structural equations modelling -SEM) là một phân tích thống kê mà kiểm tra khả năng tồn tại được của các giải thích nhân quả thay thế của các biến mà tương quan với các biến khác.

• Vì chúng ta không thể luận ra nhân quả từ tương

92

• Vì chúng ta không thể luận ra nhân quả từ tương quan, nó là quan trọng để nhớ rằng Sự mô hình các phương trình cấu trúc cung cấp thông tin liên quan đến sự hợp lý (plausibility) của giả định nhân quả NHƯNG không kết luận về sự nhân quả

Page 93: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Path analysis

• SEM so sánh một cách toán học ma trận tương quan được ngụý bởi một mô hình giả định cụ thể đến ma trận tương quan thực được dựa trên dữ liệu đã thu thập.

• Sự phân tích này kiểm tra sự thích hợp (fit) của ma trận tương quan từ mô hình đã giả định và từ dữ liệu thực.

• SEM cung cấp chỉ số của goodness of fitmà chỉ ra làm thế

93

• SEM cung cấp chỉ số của goodness of fitmà chỉ ra làm thế nào mô hình đã giả định vừa vặn với dữ liệu.

• SEM trở nên phức tạp khi các đo lường bội được dùng để cải thiện sự đo lường của mỗi cấu trúc –biến ẩn. Khi các đo lường đơn của mỗi cấu trúc được dùng, các nhà nghiên cứu thỉnh thoảng gọi là path analysis

Page 94: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Analytic hierarchy process (AHP)

• Analytic hierarchy process (AHP) đã được phát triển và viết ra ban đầu bởi Thomas Saaty (1980, 1982).

• Sức mạnh của phương pháp AHP nằm trên:– (1) khả năng của nó để phân ly một vấn đề ra quyết định phức tạp thành

thứ bậc của những vướng mắc nhỏ; – (2) Tính thay đổi và khả năng của nó trong sự cấu trúc và sự phân tích

94

– (2) Tính thay đổi và khả năng của nó trong sự cấu trúc và sự phân tích các vần đề quyết định phức tạp; và

– (3) sự đơn giản và dể dàng của nó trong sử dụng.

• Tuy nhiên, sự chỉ trích lớn nhất của AHP là vấn đề thứ hạng đảo chiều khi sự hướng dẫn của một giải pháp thay thế đảo chiều các thứ hạng của những giải pháp thay thế đã được đánh gía (xem Belton & Gear 1983, Dyer 1990).

Page 95: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Conversation analysis

• Phân tích hội thoại liên quan ‘thứ tự tương hổ’ (Goffman 1955) nhưng nó liên quan đến thứ tựxã hội trong tương hổ lẫn nhau.

• Vì thế, các hội thoại được phân tích về phương

95

• Vì thế, các hội thoại được phân tích về phương diện khía cạnh nội dung và cấu trúc của các trao đổi miệng (tức là sự ngắt giọng, điệu bộ, văn phạm, mở đầu và kết thúc).

Page 96: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

666... Các kỹ thuật phân tích khác: Meta-analysis

• Số lượng các nghiên cứu tăng lên rất nhanh, vì thế rất thú vị đểcân nhắc các sự tương tự và sự khác biệt giữa các kết quả. Vì thế, meta-analysisđã được nghĩ ra để tích hợp một cách định tính các nghiên cứu trên chủ đề giống nhau để nghiên cứu sựkhác biệt trong các kết quả và để dự báo cho mẫu rộng hơn.

• Meta-analysis là thủ tục thống kê được dùng để phân tích và

96

• Meta-analysis là thủ tục thống kê được dùng để phân tích và tích hợp các kết quả của nhiều nghiên cứu cá nhân trên chủ đềđơn (Cooper 1990).

• Meta analysiskiểm tra mỗi nghiên cứu mà đã được thực hiện trên một chủ đề cụ thể để đánh giá quan hệ giữa các biến đó mà tạo thành tiêu điểm của nghiên cứu.

Page 97: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Bài tập nhóm v ề nhà

• Các kiểm định thống kê nào đã được dùng để phân tích dữ liệu

• Các kiểm định đó có phù hợp với mục tiêu và dữ liệu của luận văn không? Giải thích tại sao?

97

sao?• Theo nhóm có thể thực hiện thêm các kiểm định thống kê nào để cải thiện phần phân tích của luận văn. Nêu lý do

• Nộp bài:

Page 98: I G II G G I À II ÀB ÀB B ẢẢẢT T T M M M Ó ÓÓ T T T G GG N N N ... · 2020. 5. 23. · • Đồ thị bánh (pie charts) • Bảng ngẫu nhiên (contingency tables)

Xin cảm ơn đã lắng nghe!

98