TIỂU LUẬN KHAI PHÁ DỮ LIỆU SỬ DỤNG PHẦN MỀM WEKA PHÂN LỚP CHO BỘ DỮ LIỆU GOLF DATASET BẰNG CÂY QUYẾT...
Tìm thấy 10,000 tài liệu liên quan tới từ khóa "TIỂU LUẬN KHAI PHÁ DỮ LIỆU SỬ DỤNG PHẦN MỀM WEKA PHÂN LỚP CHO BỘ DỮ LIỆU GOLF DATASET BẰNG CÂY QUYẾT...":
a.Xây dựng thuật toán cây quyết định bằng J48(chia dữ liệu thành 10 phần).......................................11 b.Xây dựng thuật toán cây quyết định bằng J48(chia dữ liệu thành 66%, 34% )...................................16 c.Lần thứ 3[r]
Tên Data set : car evaluation CSDL gồm các thuộc tính Tên thuộc tính value Mô tả buying v-high, high, med, low Giá mua maint v-high, high, med, low Giá bảo hành doors 2, 3, 4, 5-more Cửa Persons 2, 4 , more Năng lực người thực hiện Lug_boot Small, med, big Kích thước lug_boot safety Low[r]
Mục lục 1. Bài toán 2 1.1. Mô tả tập dữ liệu (Dataset) 2 1.1.1. Nguồn gốc (UCI ARFF Repository) 2 1.1.2. Thuộc tính và ý nghĩa các thuộc tính 2 1.2. Bài toán phân lớp (Classification Problem) trên tập dữ liệu đã cho 4 2. Xây dựng mô hình huấn luyện cho bộ phân lớp (classifier) 5 2.1. Tiền xử[r]
Đây là tài liệu mình tự viết, rất dễ hiểu trong môn kho dữ liệu và các phương pháp khai phá, các ví dụ tự đưa ra và hướng dẫn giải rất dễ hiểu, ngoài ra còn áp dụng phần mềm weka để ứng dụng thuật toán id3 tìm ra cây quyết định
+Tiếp theo, bấm chuột vào text box ngay bên phải nút “Choose” và thiết lập các tham số để thực hiện việc chuyển đổi kiểu dữ liệu từ numeric sang nominal Sau khi thực hiện xong việc rời rạc hóa dữ liệu, ta có thể chỉnh sửa dữ liệu +Đối với thuộc tính “Diested” ta thay thế cá[r]
Khai phá luật kết hợp (Association Rule Mining) là kỹ thuật rất quan trọng trong lĩnh vực khai phá dữ liệu. Mục đích của việc khai phá luật kết hợp là tìm ra các mối quan hệ, sự kết hợp hay mối tương quan giữa các đối tượng trong khối lượng lớn dữ liệu. Hiện nay có nhiều phần mềm hỗ trợ việc khai p[r]
V. ĐÁNH GIÁ VÀ KẾT LUẬN: Sau khi thực hiện chạy 10 lần J48 để xây dựng cây với các tham số đầu vào khác nhau ta thấy ứng với lần chạy thứ 2 với các tham số lựa chọn là : bộ dữ liệu dùng khởi tạo cây 95 %, bộ dữ liệu test là 5% đạt được tỉ lệ phân lớp<[r]
- Tóm tắt kết quả xác nhận phân lớp: + Trường hợp phân lớp chính xác : 289,chiếm : 75.2604 % + Trường hợp phân lớp không chính xác : 95,chiếm : 24.7396 % 2. Kết quả chạy thuật toán theo mô hình MultilayerPerceptron của mạng Neuron (Neural network)
3.Kết luân Sau 6 lần chạy thử , ta có thể rút ra kết luận lần chạy thử với bộ dữ liệu: 66% dữ liệu dùng để xây dựng cây, 34% để test có tỷ lệ phân lớp chính xác 98,2326%. Nên ta sử dụng cây quyết định tại lần thử này để sử dụng cho cá[r]
Các nhu cầu đó đã được biết đến từ lâu nhưng mới thực sự bùng nổ từ thập niên 90 này. Do đó, những năm gần đây đã phát triển mạnh mẽ một loạt các lĩnh vực nghiên cứu về tổ chức các kho dữ liệu và kho thông tin (data warehouse, information warehouse), các hệ trợ giúp quyết định, các[r]
Bài viết trình bày việc xem xét lại mô hình khai phá tập mục thường xuyên với trọng số thích nghi trong cơ sở dữ liệu tĩnh và mô hình khai phá tập mục thường xuyên với trọng số trên dòng dữ liệu bằng cách sử dụng một độ đo mới để tỉa cây SAWFI-tree và các cây điều kiện hiệu quả hơn, và mở rộng việc[r]
CÁC GIẢI THUẬT QUY NẠP CÂY QUYẾT ĐỊNH ƯU ĐIỂM NHƯỢC ĐIỂM 1.1.2.2 ƯU VÀ NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT QUY NẠP CÂY QUYẾT ĐỊNH ƯU ĐIỂM NHƯỢC ĐIỂM 1.1.3 PHÂN LỚP DỮ LIỆU BẰNG MẠNG NẠ[r]
Báo cáo môn Khai phá dữ liệu V. ĐÁNH GIÁ VÀ KẾT LUẬN: Sau khi thực hiện chạy 10 lần J48 để xây dựng cây với các tham số đầu vào khác nhau ta thấy ứng với lần chạy thứ 2 với các tham số lựa chọn là : bộ dữ liệu dùng khởi tạo cây 90 %, bộ dữ l[r]
BÁO CÁO BÀI TẬP LỚN MÔN KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆUHọ và tên: Phan Tiến DũngLớp: Tin học 1- K42Chương 1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU1.1 Giới thiệu về khai phá dữ liệu:Khai phá dữ liệu được định nghĩa là quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu t[r]
Ph ươ ng pháp khai phá d ữ li ệ u trong nh ữ ng n ă m g ầ n đ ây đượ c ứ ng d ụ ng trong nhi ề u l ĩ nh v ự c nh ư : th ươ ng m ạ i, giáo d ụ c, y t ế , b ư u chính vi ễ n thơng... Tuy nhiên, ở Vi ệ t Nam ph ươ ng pháp này cịn ch ư a đượ c áp d ụ ng nhi ề u, nh ấ t là trong l ĩ nh[r]
Quá trình khai phá dữ liệu là quá trình phát hiện mẫu trong đĩ giải thuật khai phá dữ liệu tìm kiếm các mẫu đáng quan tâm theo dạng xác định như các luật, cây phân lớp, hồi quy, phân nhĩ[r]
- Rời rạc hóa giá trị của các trường liên tục là “children”,” age” và “income” vì mô hình khai phá luật kết hợp không làm việc với các kiểu dữ liệu liên tục. Quá trình này goi là rời rạc hóa dữ liệu ( Discretization ) Nạp dữ liệu (Loading the[r]
NỘI DUNG: SỬ DỤNG PHẦN MỀM WEKA ĐỂ PHÂN LỚP YEAST DATASET
1.Tóm lược lý thuyết về phân lớp ---------------------------------------------trang 3 2.Qui trình Train và Test một classifier --------------------------------------trang 3 3.Giới thiệu dataset --------------------------------------[r]
Đối với dataset wine thì có 3 class tương ứng với 3 giống nho, và được gọi là class1, class2, class3. 2. Qui trình Train và Test một classifier - Dữ liệu để xây dựng mô hình: dữ liệu gốc (original dataset), dữ liệu này phải có thuộc tính phân lớp[r]