Kỹ thuật mô hình hóa dữ liệu và quy trình thực hiện bạn nên biết

Kỹ thuật mô hình hóa dữ liệu và quy trình thực hiện bạn nên biết

Chia sẻ kiến thức 17/07/2023

Ở bài viết này bạn sẽ được tham khảo Kỹ thuật mô hình hóa dữ liệu và quy trình thực hiện bài bản nhất.

Kỹ thuật mô hình hóa dữ liệu và quy trình thực hiện bạn nên biết
Kỹ thuật mô hình hóa dữ liệu và quy trình thực hiện bạn nên biết

1. Kỹ thuật mô hình hóa dữ liệu

Kỹ thuật mô hình hóa dữ liệu xuất hiện vào những năm 1960 khi cơ sở dữ liệu được sử dụng rộng rãi hơn trên máy tính lớn và sau đó là máy tính mini. Nó cho phép các tổ chức mang lại tính nhất quán, khả năng lặp lại và sự phát triển có kỷ luật để xử lý và quản lý dữ liệu. Đó vẫn là trường hợp, nhưng các kỹ thuật được sử dụng để tạo mô hình dữ liệu đã phát triển cùng với sự phát triển của các loại cơ sở dữ liệu và hệ thống máy tính mới.

Đây là những phương pháp mô hình hóa dữ liệu được sử dụng rộng rãi nhất trong những năm qua, bao gồm một số phương pháp đã được thay thế phần lớn bằng các kỹ thuật mới hơn.

1.1 Mô hình hóa dữ liệu phân cấp

Các mô hình dữ liệu phân cấp tổ chức dữ liệu theo cách sắp xếp dạng cây của các bản ghi cha và con. Một bản ghi con chỉ có thể có một bản ghi mẹ, khiến đây trở thành phương pháp lập mô hình một hoặc nhiều. Cách tiếp cận phân cấp bắt nguồn từ cơ sở dữ liệu máy tính lớn,  Hệ thống Quản lý Thông tin (IMS) của IBM là ví dụ nổi tiếng nhất. Mặc dù các mô hình dữ liệu phân cấp hầu hết được thay thế bằng các mô hình quan hệ bắt đầu từ những năm 1980, IMS vẫn có sẵn và được sử dụng bởi nhiều tổ chức. Một phương pháp phân cấp tương tự cũng được sử dụng ngày nay trong XML, chính thức được gọi là Ngôn ngữ đánh dấu mở rộng.

1.2 Mô hình hóa dữ liệu mạng

Đây cũng là một tùy chọn mô hình hóa dữ liệu phổ biến trong cơ sở dữ liệu máy tính lớn hiện không được sử dụng nhiều. Các mô hình dữ liệu mạng được mở rộng trên các mô hình phân cấp bằng cách cho phép các bản ghi con được kết nối với nhiều bản ghi gốc. Hội nghị về ngôn ngữ hệ thống dữ liệu, một nhóm tiêu chuẩn kỹ thuật hiện không còn tồn tại thường được gọi là CODASYL, đã thông qua đặc tả mô hình dữ liệu mạng vào năm 1969. Do đó, kỹ thuật mạng thường được gọi là mô hình CODASYL.

1.3 Mô hình hóa dữ liệu quan hệ

Mô hình dữ liệu quan hệ được tạo ra như một giải pháp thay thế linh hoạt hơn cho mô hình mạng và phân cấp. Được mô tả lần đầu tiên trong bài báo kỹ thuật năm 1970 của nhà nghiên cứu IBM Edgar F. Codd, mô hình quan hệ ánh xạ mối quan hệ giữa các thành phần dữ liệu được lưu trữ trong các bảng khác nhau có chứa các tập hợp hàng và cột. Mô hình hóa quan hệ tạo tiền đề cho sự phát triển của cơ sở dữ liệu quan hệ và việc sử dụng rộng rãi chúng đã khiến nó trở thành kỹ thuật mô hình hóa dữ liệu thống trị vào giữa những năm 1990.

1.4 Mô hình hóa dữ liệu mối quan hệ thực thể

Mô hình hóa dữ liệu mối quan hệ thực thể
Mô hình hóa dữ liệu mối quan hệ thực thể (Nguồn ảnh: internet)

Một biến thể của mô hình quan hệ cũng có thể được sử dụng với các loại cơ sở dữ liệu khác, mô hình mối quan hệ thực thể (ER) ánh xạ trực quan các thực thể, thuộc tính của chúng và mối quan hệ giữa các thực thể khác nhau. Ví dụ: các thuộc tính của thực thể dữ liệu nhân viên có thể bao gồm họ, tên, số năm làm việc và các dữ liệu liên quan khác. Các mô hình ER cung cấp một cách tiếp cận hiệu quả cho các quy trình thu thập và cập nhật dữ liệu, làm cho chúng đặc biệt phù hợp với các ứng dụng xử lý giao dịch.

>>> Đọc thêm: Tương lai trí tuệ nhân tạo AI trong kỷ nguyên số

1.5 Mô hình hóa dữ liệu thứ nguyên

Các mô hình dữ liệu thứ nguyên chủ yếu được sử dụng trong kho dữ liệu và siêu thị dữ liệu hỗ trợ các ứng dụng kinh doanh thông minh. Chúng bao gồm các bảng thực tế chứa dữ liệu về giao dịch hoặc các sự kiện khác và bảng thứ nguyên liệt kê các thuộc tính của các thực thể trong bảng thực tế. Ví dụ: bảng thực tế có thể nêu chi tiết việc mua sản phẩm của khách hàng, trong khi bảng thứ nguyên được kết nối chứa dữ liệu về sản phẩm và khách hàng. Các loại mô hình thứ nguyên đáng chú ý là lược đồ hình sao , kết nối bảng thực tế với các bảng thứ nguyên khác nhau và lược đồ bông tuyết, bao gồm nhiều cấp độ của bảng thứ nguyên.

1.6 Mô hình hóa dữ liệu hướng đối tượng

Khi lập trình hướng đối tượng phát triển vào những năm 1990 và các nhà cung cấp phần mềm đã phát triển cơ sở dữ liệu đối tượng, mô hình hóa dữ liệu hướng đối tượng cũng xuất hiện. Cách tiếp cận hướng đối tượng tương tự như phương pháp ER trong cách nó biểu diễn dữ liệu, thuộc tính và mối quan hệ, nhưng nó trừu tượng hóa các thực thể thành các đối tượng. Các đối tượng khác nhau có các thuộc tính và hành vi giống nhau có thể được nhóm thành các lớp và các lớp mới có thể kế thừa các thuộc tính và hành vi của các lớp hiện có. Nhưng cơ sở dữ liệu đối tượng vẫn là một công nghệ thích hợp cho các ứng dụng cụ thể, điều này đã hạn chế việc sử dụng mô hình hướng đối tượng.

1.7 Mô hình hóa dữ liệu đồ thị

Mô hình dữ liệu đồ thị là một nhánh hiện đại hơn của mô hình mạng và mô hình phân cấp. Thường được kết hợp với cơ sở dữ liệu đồ thị , nó thường được sử dụng để mô tả các tập dữ liệu chứa các mối quan hệ phức tạp. Ví dụ: mô hình hóa dữ liệu đồ thị là một cách tiếp cận phổ biến trong các mạng xã hội, công cụ đề xuất và ứng dụng phát hiện gian lận. Các mô hình dữ liệu biểu đồ thuộc tính là một loại phổ biến trong đó, các nút đại diện cho các thực thể dữ liệu và ghi lại các thuộc tính của chúng được kết nối bằng các mối quan hệ, còn được gọi là các cạnh hoặc liên kết, xác định cách các nút khác nhau có liên quan với nhau.

2. Quá trình mô hình hóa dữ liệu là gì?

Quá trình mô hình hóa dữ liệu là gì?
Quá trình mô hình hóa dữ liệu là gì? (Nguồn ảnh: internet)

Lý tưởng nhất là các mô hình dữ liệu khái niệm, logic và vật lý được tạo trong một quy trình tuần tự có sự tham gia của các thành viên trong nhóm quản lý dữ liệu và người dùng doanh nghiệp. Thông tin đầu vào từ các giám đốc điều hành doanh nghiệp và người lao động đặc biệt quan trọng trong các giai đoạn mô hình hóa khái niệm và logic. Mặt khác, các mô hình dữ liệu có thể không nắm bắt đầy đủ bối cảnh kinh doanh của dữ liệu hoặc đáp ứng nhu cầu thông tin của một tổ chức.

Thông thường, người lập mô hình dữ liệu hoặc kiến ​​trúc sư dữ liệu bắt đầu một dự án mô hình hóa bằng cách phỏng vấn các bên liên quan trong kinh doanh để thu thập các yêu cầu và thông tin chi tiết về quy trình kinh doanh. Các nhà phân tích kinh doanh cũng có thể giúp thiết kế cả mô hình khái niệm và logic. Vào cuối dự án, mô hình dữ liệu vật lý được sử dụng để truyền đạt các yêu cầu kỹ thuật cụ thể cho các nhà thiết kế cơ sở dữ liệu.

Peter Aiken, nhà tư vấn quản lý dữ liệu và phó giáo sư về hệ thống thông tin tại Đại học Khối thịnh vượng chung Virginia, đã liệt kê sáu bước sau để thiết kế mô hình dữ liệu trong hội thảo trực tuyến Dataversity 2019:

  • Xác định các thực thể kinh doanh được đại diện trong tập dữ liệu.
  • Xác định các thuộc tính chính cho từng thực thể để phân biệt giữa chúng.
  • Tạo một mô hình mối quan hệ thực thể dự thảo để hiển thị cách các thực thể được kết nối.
  • Xác định các thuộc tính dữ liệu cần được tích hợp vào mô hình.
  • Ánh xạ các thuộc tính tới các thực thể để minh họa ý nghĩa kinh doanh của dữ liệu.
  • Hoàn thiện mô hình dữ liệu và xác nhận tính chính xác của nó.
  • Ngay cả sau đó, quy trình thường chưa kết thúc: Các mô hình dữ liệu thường phải được cập nhật và sửa đổi khi nội dung dữ liệu của tổ chức và nhu cầu kinh doanh thay đổi.

>>> Xem thêm chuỗi bài viết liên quan:

Công nghệ AI là gì? Những ứng dụng của công nghệ AI

Tương lai trí tuệ nhân tạo AI trong kỷ nguyên số

Ngôn ngữ lập trình nên học khi học lập trình trí tuệ nhân tạo

Những phẩm chất cần thiết để phát triển trí tuệ nhân tạo

Tìm hiểu các loại trí tuệ nhân tạo AI có thể bạn chưa biết

Nguyễn Cúc

Nguồn tham khảo: techtarget.com

ĐĂNG KÝ TƯ VẤN HỌC LẬP TRÌNH TẠI FUNiX

Bình luận (
0
)

Bài liên quan

  • Tầng 0, tòa nhà FPT, 17 Duy Tân, Q. Cầu Giấy, Hà Nội
  • info@funix.edu.vn
  • 0782313602 (Zalo, Viber)        
Chat Button
FUNiX V2 GenAI Chatbot ×

yêu cầu gọi lại