Hãy cùng FUNiX đi săn kho báu âm nhạc với Data.world.
Bắt đầu với Data.World
Data.world là một nền tảng mạng xã hội để tìm kiếm và chia sẻ các tập dữ liệu. Nó cho phép bạn tạo các dự án sử dụng những dữ liệu có sẵn công khai. Nó cũng có nhiều tích hợp cho phép nó hoạt động với nhiều công cụ phổ biến. Trên hết, nó có bản miễn phí phù hợp cho mục đích sử dụng cá nhân.
Hãy bắt đầu bằng cách tạo một tài khoản. Sau khi đăng nhập, hãy lấy danh sách nhạc bằng cách sử dụng hộp tìm kiếm ở trên cùng của trang. Tìm kiếm “Billboard hot weekly charts” (Bảng xếp hạng hàng tuần hot của Billboard) và chọn lựa chọn có hàng nghìn đánh dấu trang (bookmarks).
Đánh dấu tập dữ liệu để có thể dễ dàng tìm lại sau này.
Nếu bạn kéo xuống, bạn sẽ thấy có hai tệp. Có một tệp CSV (comma-separated values, hay các giá trị được phân tách bằng dấu phẩy) với thông tin chi tiết về các bảng xếp hạng âm nhạc.
Tệp Excel thì lại có rất nhiều thông tin thú vị về âm nhạc từ Spotify.
Có khoảng 30000 bài hát trong các tập dữ liệu đó. Bạn có lẽ không thích tất cả chúng, vì vậy hãy sắp xếp lại dữ liệu.
“Đào bới” dữ liệu âm nhạc
Như đã nói, có hai tập dữ liệu trong dự án bảng xếp hạng bài hát hot hàng tuần, một tập bao gồm dữ liệu Billboard và một bao gồm dữ liệu Spotify.
Khám phá tập dữ liệu Billboard
Để có dữ liệu về bản nhạc hay nhất, bạn cần mở file HotStuff.csv. Nó bao gồm dữ liệu từ Bảng xếp hạng Billboard Hot 100 tính từ năm 1958.
Bạn có thể sắp xếp các cột để giúp tìm kiếm các bài hát phổ biến nhất theo ngày tháng và vị trí trên bảng xếp hạng. Danh sách có hơn 300000 bài hát, vì vậy có thể mất một chút thời gian để tải.
Sau đó, bạn có thể sắp xếp dữ liệu theo cách riêng bằng cách sử dụng các tùy chọn nâng cao hơn có sẵn trong chương trình bảng tính.
Và đây là kết quả:
Khám phá dữ liệu Spotify
Tập dữ liệu Spotify nằm trong file “Hot 100 Audio Features.xlsx” và có rất nhiều thông tin về các bài hát. Các cột bao gồm thông tin như mức độ phổ biến và khả năng bạn có thể nhảy theo bài hát (theo Spotify).
Tập dữ liệu này chỉ có khoảng 30.000 bài hát, vì vậy nó sẽ phản hồi nhanh hơn nhiều và bạn sẽ không cần phải xuất nó.
Tìm hiểu dữ liệu
Nếu bạn biết dùng SQL, bạn thật may mắn vì đó là nơi Data.world thực sự tỏa sáng! Có một tính năng cho phép tìm kiếm bất kỳ tập dữ liệu nào bằng các lệnh SQL cơ bản.
Ví dụ bạn muốn xem mọi bài hát của Adele lọt vào top 10. Đầu tiên, bạn chọn query từ góc trên bên phải của chế độ xem dữ liệu. Sau đó, bạn nhập truy vấn SQL của mình và nhấp vào Run query, cũng ở góc trên cùng bên phải.
Kết quả sẽ trông như thế này:
Khám phá các danh sách và tính năng khác
Data.world là một nguồn tài nguyên tuyệt vời để tìm tất cả các loại thông tin. Bạn có thể tìm dữ liệu về nhạc, phim, số liệu thống kê về Chiến tranh Thế giới thứ hai, v.v.
Bạn cũng có thể dùng nó để tạo các dự án và dữ liệu tham chiếu chéo. Và bạn có thể cung cấp dữ liệu cho các công cụ khác như Google Data Studio và Slack, bởi nó cung cấp quyền truy cập dữ liệu nâng cao cho tất cả mọi người.
ĐỌC TIẾP: 5 Công cụ phân tích dữ liệu chuẩn, hiệu quả nhất hiện nay
Vân Nguyễn
Dịch từ: https://www.makeuseof.com/how-find-data-best-music-past/
Bình luận (0
)