Cách thực hiện phân tích dữ liệu cơ bản trong Excel

Chia sẻ kiến thức 14/08/2022

Excel không dùng để phân tích dữ liệu, nhưng nó vẫn có thể xử lý các số liệu thống kê. Trong bài viết dưới đây, FUNiX sẽ hướng dẫn bạn cách sử dụng Data Analysis Toolpak để chạy thống kê Excel.

 

Khi chạy thống kê, bạn thường cần đến sự trợ giúp của phần mềm thống kê. Các công cụ này được xây dựng để thực hiện các phép tính như kiểm tra t -test, kiểm tra chi-square, tương quan, v.v. Excel không dùng để phân tích dữ liệu. Nhưng bạn có thể làm được điều này với tiện ích bổ sung của Excel: Công cụ phân tích dữ liệu Toolpak.

Công cụ này bao gồm một loạt các chức năng thống kê hữu ích. Hãy xem những gì chúng ta có thể làm với thống kê Excel.

Thêm công cụ phân tích dữ liệu Excel

Mặc dù bạn có thể thực hiện thống kê mà không cần Công cụ phân tích dữ liệu, nhưng nó sẽ giúp việc này dễ dàng hơn nhiều. Để cài đặt Toolpak trong Excel 2016, hãy đi tới Tệp> Tùy chọn> Phần bổ trợ (File > Options > Add-ins).

Nhấp vào Đi (Go) bên cạnh “Quản lý: Phần bổ trợ Excel” (Manage: Excel Add-ins).

Trong cửa sổ hiện ra, chọn hộp bên cạnh Analysis Toolpak, sau đó bấm OK .

Nếu bạn đã thêm chính xác Data Analysis Toolpak vào Excel, bạn sẽ thấy nút Phân tích Dữ liệu trong tab Dữ liệu, được nhóm thành phần Phân tích:

Nếu bạn muốn nhiều sức mạnh hơn nữa, hãy nhớ xem các phần bổ trợ khác của Excel.

Thống kê mô tả trong Excel

Bất kể bạn đang chạy thử nghiệm thống kê nào, trước tiên bạn có thể muốn nhận được thống kê mô tả của Excel. Nó sẽ cung cấp cho bạn thông tin về trung bình, trung vị phương sai, độ lệch chuẩn và sai số, độ nhọn, độ lệch và nhiều số liệu khác.

Chạy thống kê mô tả trong Excel thật dễ dàng. Nhấp vào Phân tích dữ liệu trong tab Dữ liệu, chọn Thống kê mô tả và chọn phạm vi đầu vào của bạn. Nhấp vào mũi tên bên cạnh trường phạm vi đầu vào, nhấp và kéo để chọn dữ liệu của bạn và nhấn Enter (hoặc nhấp vào mũi tên xuống tương ứng), như trong GIF bên dưới.

Sau đó, hãy đảm bảo cho Excel biết liệu dữ liệu của bạn có nhãn hay không, nếu bạn muốn kết xuất trong một trang tính mới hay trên cùng một trang tính và nếu bạn muốn thống kê tóm tắt và các tùy chọn khác.

Sau đó, nhấn OK và bạn sẽ nhận được thống kê mô tả của mình:

T-test trong Excel

T -test là một trong những bài kiểm tra thống kê cơ bản nhất và rất dễ dàng để tính toán trong Excel với Toolpak . Nhấp vào nút Phân tích Dữ liệu và cuộn xuống cho đến khi bạn thấy các tùy chọn t -test.

Bạn có ba lựa chọn:

  • t-Test: Nên sử dụng hai mẫu cho phương tiện được ghép nối khi các phép đo hoặc quan sát của bạn được ghép nối. Sử dụng điều này khi bạn thực hiện hai phép đo của cùng một đối tượng, chẳng hạn như đo huyết áp trước và sau khi can thiệp.
  • t-Test: Giả sử hai mẫu có các phương sai bằng nhau nên được sử dụng khi các phép đo của bạn là độc lập (thường có nghĩa là chúng được thực hiện trên hai nhóm đối tượng khác nhau). Chúng ta sẽ thảo luận về phần “phương sai bằng nhau” trong giây lát.
  • t-Test: Giả định các phương sai không bằng nhau hai mẫu cũng dành cho các phép đo độc lập, nhưng được sử dụng khi phương sai của bạn không bằng nhau.
Để kiểm tra xem phương sai của hai mẫu có bằng nhau hay không, bạn sẽ cần chạy F-test. Tìm F-Test Two-Sample for Variances trong danh sách Công cụ phân tích, chọn nó và bấm OK .

Nhập hai tập dữ liệu của bạn vào các hộp phạm vi đầu vào. Để giá trị alpha ở mức 0,05 trừ khi bạn có lý do để thay đổi nó – nếu bạn không biết điều đó có nghĩa là gì, chỉ cần bỏ đi. Cuối cùng, bấm OK .

Excel sẽ cung cấp cho bạn kết quả trong một trang tính mới (trừ khi bạn chọn Phạm vi đầu ra và một ô trong trang tính hiện tại của mình):

Bạn đang xem giá trị P ở đây. Nếu nó nhỏ hơn 0,05, bạn có phương sai không bằng nhau . Vì vậy, để chạy t -test, bạn nên sử dụng tùy chọn phương sai không bằng nhau.

Để chạy kiểm tra t , hãy chọn kiểm tra thích hợp từ cửa sổ Công cụ phân tích và chọn cả hai bộ dữ liệu của bạn theo cách tương tự như bạn đã làm đối với kiểm tra F. Để giá trị alpha là 0,05 và nhấn OK .

Kết quả bao gồm mọi thứ bạn cần báo cáo cho thử nghiệm t : phương tiện, bậc tự do (df), thống kê t và giá trị P cho cả thử nghiệm một và hai phía. Nếu giá trị P nhỏ hơn 0,05 thì hai mẫu có sự khác biệt đáng kể.

ANOVA trong Excel

Công cụ phân tích dữ liệu Excel cung cấp ba loại phân tích phương sai (ANOVA). Thật không may, nó không cung cấp cho bạn khả năng chạy các bài kiểm tra tiếp theo cần thiết như Tukey hoặc Bonferroni. Nhưng bạn có thể xem liệu có mối quan hệ giữa một vài biến số khác nhau hay không.

Dưới đây là ba bài kiểm tra ANOVA trong Excel:

  • ANOVA: Single Factor phân tích phương sai với một biến phụ thuộc và một biến độc lập. Tốt hơn là sử dụng nhiều bài kiểm tra khi bạn có nhiều hơn hai nhóm.
  • ANOVA: Two-Factor with Replication tương tự như t -test được ghép nối; nó liên quan đến nhiều phép đo trên các đối tượng đơn lẻ. Phần “hai nhân tố” của thử nghiệm này chỉ ra rằng có hai biến độc lập.
  • ANOVA: Two-Factor không Replication liên quan đến hai biến độc lập, nhưng không lặp lại trong phép đo.

Chúng ta sẽ xem xét phân tích một nhân tố ở đây. Trong ví dụ của chúng tôi, chúng tôi sẽ xem xét ba bộ số, được gắn nhãn “Can thiệp 1”, “Can thiệp 2” và “Can thiệp 3”. Để chạy ANOVA, hãy nhấp vào Phân tích dữ liệu , sau đó chọn ANOVA: Yếu tố duy nhất .

Chọn phạm vi đầu vào và đảm bảo cho Excel biết liệu các nhóm của bạn nằm trong cột hay hàng. Tôi cũng đã chọn “Nhãn ở hàng đầu tiên” ở đây để tên nhóm được hiển thị trong kết quả.

Sau khi nhấn OK , chúng tôi nhận được kết quả sau:

Lưu ý rằng giá trị P nhỏ hơn 0,05, vì vậy chúng tôi có một kết quả có ý nghĩa. Điều đó có nghĩa là có sự khác biệt đáng kể giữa ít nhất hai trong số các nhóm trong bài kiểm tra. Nhưng vì Excel không cung cấp các bài kiểm tra để xác định nhóm nào khác nhau, nên tốt nhất bạn có thể làm là xem xét các giá trị trung bình được hiển thị trong phần tóm tắt. Trong ví dụ của chúng tôi, Can thiệp 3 có vẻ như nó có thể là sự khác biệt.

Điều này không hợp lý về mặt thống kê. Nhưng nếu bạn chỉ muốn xem liệu có sự khác biệt hay không và xem nhóm nào có thể gây ra nó, thì nó sẽ hoạt động.

Tương quan trong Excel

Tính toán tương quan trong Excel đơn giản hơn nhiều so với t -test hoặc ANOVA. Sử dụng nút Phân tích Dữ liệu để mở cửa sổ Công cụ Phân tích và chọn Tương quan .

 

Chọn phạm vi đầu vào của bạn, xác định nhóm của bạn dưới dạng cột hoặc hàng và cho Excel biết liệu bạn có nhãn hay không. Sau đó, nhấn OK .

Bạn sẽ không nhận được bất kỳ thước đo tầm quan trọng nào, nhưng bạn có thể thấy mỗi nhóm có tương quan như thế nào với những nhóm khác. Giá trị của một là tương quan tuyệt đối, cho biết rằng các giá trị hoàn toàn giống nhau. Giá trị tương quan càng gần một thì mối tương quan càng mạnh.

Hồi quy trong Excel

Hồi quy là một trong những bài kiểm tra thống kê được sử dụng phổ biến nhất trong ngành và Excel cung cấp một lượng sức mạnh đáng ngạc nhiên cho phép tính này. Chúng tôi sẽ chạy một hồi quy bội nhanh trong Excel tại đây. Nếu bạn không quen thuộc với hồi quy, hãy xem hướng dẫn của HBR để sử dụng hồi quy cho doanh nghiệp .

Giả sử biến phụ thuộc của chúng ta là huyết áp, và hai biến độc lập của chúng ta là cân nặng và lượng muối ăn vào. Chúng tôi muốn xem công cụ dự đoán huyết áp nào tốt hơn (hoặc nếu cả hai đều tốt).

Nhấp vào Phân tích dữ liệu và chọn Hồi quy . Bạn cần phải cẩn thận khi điền vào các hộp phạm vi đầu vào lần này. Hộp Phạm vi Y đầu vào phải chứa một biến phụ thuộc của bạn. Hộp Đầu vào X Phạm vi có thể bao gồm nhiều biến độc lập. Đối với một hồi quy đơn giản, đừng lo lắng về phần còn lại (mặc dù hãy nhớ cho Excel biết nếu bạn đã chọn nhãn).

Đây là cách tính toán của chúng tôi trông như thế nào:

Sau khi nhấn OK , bạn sẽ nhận được một danh sách lớn các kết quả. Tôi đã đánh dấu giá trị P ở đây cho cả trọng lượng và lượng muối ăn vào:

Như bạn có thể thấy, giá trị P cho trọng lượng lớn hơn 0,05, vì vậy không có mối quan hệ đáng kể nào ở đó. Tuy nhiên, giá trị P của muối dưới 0,05, cho thấy rằng đó là một yếu tố dự đoán tốt về huyết áp.

Nếu bạn đang lên kế hoạch trình bày dữ liệu hồi quy của mình, hãy nhớ rằng bạn có thể thêm một dòng hồi quy vào biểu đồ phân tán trong Excel. Đó là một trợ giúp trực quan tuyệt vời cho phân tích này.

Thống kê Excel: Khả năng đáng ngạc nhiên

Mặc dù Excel không được biết đến với sức mạnh thống kê, nhưng nó thực sự đóng gói một số chức năng thực sự hữu ích, chẳng hạn như công cụ PowerQuery , tiện dụng cho các tác vụ như kết hợp các tập dữ liệu . (Tìm hiểu cách tạo Tập lệnh truy vấn Microsoft Power đầu tiên của bạn .) Ngoài ra còn có bổ trợ thống kê Data Analysis Toolpak, thực sự mang lại một số tính năng tốt nhất của Excel. Tôi hy vọng bạn đã học được cách sử dụng Toolpak và bây giờ bạn có thể tự mình tìm hiểu cách sử dụng nhiều chức năng của nó.

Vân Nguyễn

Dịch từ: https://www.makeuseof.com/tag/data-analysis-excel/

Bình luận (
0
)

Graphic Noti Complete Course

Chúc mừng học viên

Hoàng Lê Tuấn Nam

Đã xuất sắc hoàn thành

Kỹ sư phần mềm cơ bản - Basic Software Engineer đạt học bổng 5%

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        

yêu cầu gọi lại

error: Content is protected !!