Bộ Holdout là gì? Đôi khi được gọi là dữ liệu "thử nghiệm", một tập hợp con lưu giữ cung cấp ước tính cuối cùngvề hiệu suất của mô hình học máy sau khi nó đã được đào tạo và xác thực. Không bao giờ được sử dụng các tập hợp Holdout để đưa ra quyết định sử dụng thuật toán nào hoặc để cải thiện hoặc điều chỉnh các thuật toán.
Xác thực chéo có tốt hơn giữ lại không?
Xác thực chéo thường là phương pháp ưu tiênvì nó mang lại cho mô hình của bạn cơ hội đào tạo trên nhiều lần phân chia thử nghiệm đào tạo. Điều này cung cấp cho bạn dấu hiệu tốt hơn về mức độ hoạt động của mô hình của bạn trên dữ liệu không nhìn thấy. Mặt khác, việc cầm cự chỉ phụ thuộc vào một lần phân chia thử nghiệm đào tạo.
Phương pháp tiếp cận giữ lại là gì?
Phương pháp Holdout là phương phápđơn giản nhất để đánh giá bộ phân loại. Trong phương pháp này, tập dữ liệu (tập hợp các mục dữ liệu hoặc ví dụ) được tách thành hai tập, được gọi là tập huấn luyện và tập kiểm tra. Bộ phân loại thực hiện chức năng gán các mục dữ liệu trong một tập hợp nhất định cho một danh mục hoặc lớp đích.
Tôi có nên luôn xác thực chéo không?
Nói chung, xác thực chéo làluôn cần thiết khi bạn cần xác định các tham số tối ưu của mô hình, đối với hồi quy logistic, đây sẽ là tham số C.
Ưu điểm của xác thực chéo K-lần là gì?
nếu bạn so sánh thử nghiệm-MSE tốt hơn trong trường hợp CV gấp k so với LOOCV. CV gấp k hoặc bất kỳ CV hoặc phương pháp lấy mẫu lại nào khôngcải thiện lỗi kiểm tra. họ ước tính lỗi kiểm tra. trong trường hợp gấp k, nócông việc ước tính sai số tốt hơn LOOCV.