4 cách nhập dữ liệu từ trang web vào Google Sheets

4 cách để nhập dữ liệu từ trang web vào Google Sheets

Chia sẻ kiến thức 28/09/2023

Bạn mệt mỏi với việc copy và paste dữ liệu từ các trang web? Tìm hiểu cách nhập trực tiếp dữ liệu từ trang web vào Google Sheets.

 

Dữ liệu đóng một vai trò quan trọng trong việc ra quyết định và phân tích. Cho dù bạn là nhà phân tích kinh doanh (business analyst), nhà nghiên cứu hay bất kỳ ai cần xử lý dữ liệu lớn, kỹ năng nhập dữ liệu trực tuyến vào bảng tính đều rất cần thiết. 

Nếu bạn từng sử dụng Google Sheets để phân tích dữ liệu thì bạn đã biết rằng việc copy và paste dữ liệu từ các trang web là không hiệu quả. Trong hầu hết các trường hợp, dữ liệu có định dạng lộn xộn và không thể sử dụng. 

May mắn là có rất nhiều phương pháp hiệu quả để nhập dữ liệu từ trang web vào Google Sheets. 

Nhập dữ liệu từ trang web vào Google Sheets

Google Sheets cung cấp một số phương pháp để nhập dữ liệu từ trang web. Bạn có thể sử dụng hàm IMPORT tích hợp hoặc cài đặt các tiện ích bổ sung của Google Sheets để nhập dữ liệu một cách dễ dàng.

Nhóm hàm IMPORT bao gồm IMPORTDATA, IMPORTHTML và IMPORTXML. Mỗi hàm này phù hợp để nhập các loại dữ liệu cụ thể. Tuy nhiên, các hàm này không thể sử dụng thông tin xác thực hoặc mã thông báo bảo mật để truy cập thông tin bảo mật.

Trong những trường hợp như vậy, bạn sẽ cần cài đặt tiện ích bổ sung Google Sheets để truy cập dịch vụ bằng thông tin xác thực của bạn và nhập dữ liệu vào bảng tính. 

1. IMPORTDATA

Bạn có thể sử dụng hàm IMPORTDATA để nhập dữ liệu đơn giản từ tệp CSV hoặc TSV trực tuyến. Đây là cách dễ nhất để nhập dữ liệu trực tuyến vào Google Sheets.

=IMPORTDATA(URL, dấu_phân_cách, địa_chỉ)

IMPORTDATA tự động tìm nạp và nhập dữ liệu vào bảng tính của bạn. Trong cú pháp trên, URL là địa chỉ của tệp, dấu phân cách là ký tự được sử dụng để phân tích dữ liệu trong tệp và địa chỉ là địa chỉ cụ thể mà IMPORTDATA nên sử dụng.

Hai đối số cuối cùng, dấu phân cách và địa chỉ, là không bắt buộc. Nếu để trống, IMPORTDATA sẽ xem qua dữ liệu và tự động giả định các đối số này. Trong hầu hết các trường hợp, tốt nhất nên để trống hai đối số này.

Sử dụng IMPORTDATA trong Google Trang tính

Ví dụ: công thức bên dưới tìm nạp dữ liệu từ tệp CSV được chỉ định:

=IMPORTDATA("https://people.sc.fsu.edu/~jburkardt/data/csv/crash_catalonia.csv")

Vì các đối số dấu phân cách và địa chỉ được để trống nên IMPORTDATA tự động tìm và giả định các giá trị này. Lưu ý rằng hàm này hoạt động với các tệp CSV và TSV chứ không phải các trang web. Nếu bạn nhập URL của trang web vào IMPORTDATA, nó có thể không trả về dữ liệu mong đợi hoặc có thể dẫn đến lỗi.

2. IMPORTHTML

Bạn có thể sử dụng hàm IMPORTHTML để nhập dữ liệu từ các bảng và danh sách trên một trang web. Hàm này có nhiều ứng dụng hơn IMPORTDATA vì nó cho phép bạn nhập bảng dữ liệu từ các trang web mà không yêu cầu tệp CSV.

=IMPORTHTML(URL, query_type, index)

Theo cú pháp, URL là địa chỉ của trang web, query_type là bảng hoặc danh sách và index là số của bảng hoặc danh sách trong trang web.

Sử dụng IMPORTHTML trong Google Trang tính

Ví dụ: bạn có thể sử dụng IMPORTHTML để nhập bảng từ bài viết Wikipedia:

=IMPORTHTML("https://en.wikipedia.org/wiki/Demographics_of_Germany", "table", 8)

Trong công thức này, IMPORTHTML đi tới URL đã chỉ định, tìm nạp dữ liệu và xuất ra bảng thứ tám.

3. MPORTXML

Hàm IMPORTXML tìm nạp dữ liệu từ các trang XML và HTML. Cú pháp của hàm này như sau:

=IMPORTXML(URL, xpath_query)

Trong cú pháp này, URL là địa chỉ của trang web và xpath_query là truy vấn XPath xác định các nút bạn muốn nhập. Điều kiện tiên quyết để sử dụng IMPORTXML trong Google Sheets là phải có kiến ​​thức cơ bản về XML là gì và cách bạn có thể điều hướng các tệp XML bằng truy vấn XPath.

Sử dụng IMPORTXML trong Google Trang tính

Ví dụ: công thức bên dưới xuất ra một bảng XML chứa tên và mô tả của một số loại cây:

=IMPORTXML("https://www.w3schools.com/xml/plant_catalog.xml", "CATALOG/PLANT")

Trong công thức này, IMPORTXML thu thập dữ liệu trong tệp XML và sau đó xuất ra các nút PLANT là con của nút CATALOG. Vì đối số ngôn ngữ trống nên IMPORTXML sử dụng ngôn ngữ của tệp XML.

Vì URL web có thể khá lộn xộn nên tốt nhất bạn nên nhập URL vào một ô riêng biệt và chỉ đến ô đó trong công thức của mình.

Với kiến ​​thức về các thẻ HTML cần thiết và các truy vấn XPath, bạn có thể làm được nhiều việc hơn với IMPORTXML. Ví dụ: công thức bên dưới trích xuất tất cả các tiêu đề H2 trong một bài viết:

=IMPORTXML(B2, "//*/h2")
Sử dụng IMPORTXML trong Google Sheets để trích xuất dữ liệu XML
 

4. Sử dụng Tiện ích bổ sung của Google Trang tính để nhập dữ liệu

Ngoài các hàm tích hợp sẵn, Google Trang tính còn hỗ trợ các tiện ích bổ sung của bên thứ ba giúp mở rộng khả năng nhập dữ liệu trực tuyến. Những tiện ích bổ sung này cung cấp một cách thuận tiện để nhập dữ liệu từ các nguồn trực tuyến.

Biểu tượng Google Workspace Marketplace

Ưu điểm chính của các tiện ích bổ sung này là chúng cho phép truy cập vào các tài nguyên yêu cầu xác thực. Mỗi tiện ích bổ sung phù hợp nhất với các nguồn và loại dữ liệu khác nhau. Do đó, việc chọn tiện ích bổ sung Google Trang tính phù hợp để nhập dữ liệu tùy thuộc vào loại và nguồn gốc dữ liệu của bạn.

Dưới đây là các tiện ích bổ sung đáng chú ý hỗ trợ nhập dữ liệu trong Google Trang tính:

  • Coefficient: Coefficient là một tiện ích bổ sung Google Trang tính thân thiện với người dùng được thiết kế để giúp bạn tìm nạp dữ liệu từ các trang web mà không cần mã hóa. Thông qua giao diện của nó, bạn có thể chọn các thành phần dữ liệu cụ thể để nhập và tận hưởng các bản cập nhật theo thời gian thực. Coefficient hỗ trợ các hệ thống kinh doanh như Salesforce, Hubspot, Google Analytics, Redshift, Looker, Tableau, MySQL, v.v.
  • Coupler.io: Coupler.io là một tiện ích bổ sung tuyệt vời khác giúp đơn giản hóa việc nhập dữ liệu vào Google Trang tính. Ngoài việc nhập dữ liệu từ nhiều nguồn khác nhau, Coupler.io cho phép bạn lên lịch nhập tự động để cập nhật bảng tính của bạn. Coupler.io hoạt động liền mạch với Google Analytics, Mailchimp, HubSpot, Salesforce, Shopify, Xero, Airtable, Trello, v.v.
  • Awesome Table: Ngoài việc chỉ nhập dữ liệu, Awesome Table cho phép bạn tùy chỉnh và chuyển đổi dữ liệu để nâng cao khả năng phân tích dữ liệu của mình. Bảng tuyệt vời cho phép bạn chọn dữ liệu bạn muốn nhập bằng bộ lọc dữ liệu trực quan và lên lịch làm mới tự động. Nó hoạt động với QuickBooks, Xero, HubSpot, Airtable, Notion, YouTube, v.v.

Bằng cách tận dụng các tiện ích bổ sung này của Google Trang tính, bạn có thể nhập dữ liệu của mình mà không cần nhập một công thức dài hoặc biết XML. Các tính năng bổ sung, chẳng hạn như chuyển đổi dữ liệu và nhập theo lịch, thậm chí còn nâng cao hiệu quả quy trình làm việc của bạn hơn nữa.

Kết luận

Dù bạn xử lý loại dữ liệu nào, việc copy và paste dữ liệu lớn từ các nguồn trực tuyến vào bảng tính của bạn là không khả thi. May mắn thay, Google Trang tính có các hàm tích hợp sẵn và một loạt tiện ích bổ sung của bên thứ ba để tạo điều kiện thuận lợi cho việc nhập dữ liệu.

Biết cách nhập dữ liệu trực tuyến vào Google Trang tính sẽ trang bị cho bạn bộ kỹ năng quý giá để truy cập nhanh vào dữ liệu liên quan. Bằng cách sử dụng các phương pháp này, bạn có thể tự động hóa quy trình một cách hiệu quả và thay vào đó tập trung vào việc phân tích dữ liệu.

Tìm hiểu ngay chương trình học công nghệ thông tin trực tuyến tại FUNiX ở đây:

Vân Nguyễn

Dịch từ: https://www.makeuseof.com/import-data-website-into-google-sheets/

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
Chat với FUNiX GPT ×

yêu cầu gọi lại

error: Content is protected !!