James Perry, Richard Newmark
Chương 2
Cơ sở dữ liệu và hệ thống kế toán
Chuẩn hóa
Trong thiết kế bảng quan hệ, cần nghĩ cẩn thận việc nên lưu từng mẩu dữ liệu vào đâu. Quá trình xác định vị trí đúng cho từng thuộc tính gọi là chuẩn hóa (normalization). Một cách hiểu khác về chuẩn hóa: chuẩn hóa cơ sở dữ liệu là lưu dữ liệu vào nơi duy nhất nó thuộc về. Cơ sở dữ liệu chưa chuẩn hóa có thể đưa đến tình trạng thông tin lưu trữ dư thừa, bất nhất, hay sai lệch.
Có nhiều cách bố trí các thuộc tính trong phân hệ hóa đơn vào tập hợp bảng. Có cách này tốt hơn cách kia. Cách bố trí thuộc tính vào bảng gọi là dạng chuẩn (normal form), và cơ sở để thực hiện việc bố trí gọi là lý thuyết chuẩn hóa (normalization theory).
Các nhà lý thuyết cơ sở dữ liệu đã nhận diện 7 dạng chuẩn. Giống như các lớp của một củ hành, mỗi dạng chuẩn bao gồm việc tuân thủ các qui tắc của mọi dạng chuẩn thấp hơn. Chẳng hạn, bảng nào ở dạng chuẩn ba thì tự động ở dạng chuẩn một và hai cũng như tuân thủ các qui tắc thuộc ba dạng chuẩn đó. Các qui tắc áp đặt vào từng dạng chuẩn sẽ ngày càng chặt chẽ hơn. Ít ràng buộc nhất là dạng chuẩn một (first normal forrm), viết tắt là 1NF. Sau đó là các dạng chuẩn hai, ba, Boyce-Codd, bốn, năm, và Domain-Key. Hầu hết hệ thống kế toán chỉ cần 3 dạng chuẩn đầu. Bảng ở dạng chuẩn ba tốt hơn bảng ở dạng chuẩn hai. Tương tự, bảng ở dạng chuẩn hai tốt hơn bảng ở dạng chuẩn một. Mục tiêu của quá trình chuẩn hóa là bắt đầu với tập hợp bảng (quan hệ) rồi chuẩn hóa để đi đến tập hợp bảng có dạng chuẩn cao hơn. Quá trình này được lặp cho đến khi mọi bảng đều có dạng chuẩn ba (3NF).
Không có nhận xét nào:
Đăng nhận xét