Trong Bao bì, mỗi cây riêng lẻđộc lập với nhauvì chúng xem xét các tập hợp con khác nhau của các tính năng và mẫu.
Đóng túi trong cây quyết định là gì?
Bagging (Bootstrap Aggregation) được sử dụngkhi mục tiêu của chúng tôi là giảm phương sai của cây quyết định. Ý tưởng ở đây là tạo một số tập hợp con dữ liệu từ mẫu huấn luyện được chọn ngẫu nhiên với sự thay thế. … Mức trung bình của tất cả các dự đoán từ các cây khác nhau được sử dụng, điều này chắc chắn hơn một cây quyết định duy nhất.
Tại sao việc đóng bao lại tạo ra các cây tương quan?
Tất cả các cây có túi của chúng tôi đều có xu hướngcắt giống nhau vì chúng đều có chung các tính năng. Điều này làm cho tất cả những cây này trông rất giống nhau do đó tăng mối tương quan. Để giải quyết mối tương quan của cây, chúng tôi cho phép rừng ngẫu nhiên chỉ chọn ngẫu nhiên m yếu tố dự đoán để thực hiện phân tách.
Rừng ngẫu nhiên có túi là gì?
Bagging là một thuật toán tổng hợp phù hợp với nhiều mô hình trên các tập con khác nhau của tập dữ liệu đào tạo, sau đó kết hợp các dự đoán từ tất cả các mô hình. Rừng ngẫu nhiên là một phần mở rộngcủa việc đóng túi cũng chọn ngẫu nhiên các tập hợp con của các tính năng được sử dụng trong mỗi mẫu dữ liệu.
Việc đóng bao hoạt động như thế nào trong khu rừng ngẫu nhiên?
Thuật toán rừng ngẫu nhiên thực chất là một thuật toán đóng bao: cũng ở đây, chúng tôi vẽ các mẫu bootstrap ngẫu nhiên từ tập huấn luyện của bạn. Tuy nhiên, ngoài những mẫu bootstrap, chúng tôi cònvẽ các tập hợp con ngẫu nhiên của các đặc điểm để huấn luyện các cây riêng lẻ; trong việc đóng bao, chúng tôi cung cấp cho từng cây với đầy đủ các tính năng.