Áp dụng kỹ thuật phân cụm dữ liệu trong phân cụm kết quả tìm kiếm Abstract Phần này chúng tôi giới thiệu hướng tiếp cận trong việc sử dụng kỹ thuật phân cụm dữ liệu vào tìm kiếm và phân lại tài liệu Web, như xây dựng mô hình tìm kiếm, t[r]
họ cần. Theo tâm lý chung, người dùng chỉ xem qua vài chục kết quả đầu tiên, họ thiếu kiên nhẫn và không đủ thời gian để xem qua tất cả kết quả mà các search engine trả về. Nhằm giải quyết vấn đề này, ta có thể nhóm các kết quả tìm kiếm thành các nhóm theo từng chủ đề, khi đó người dùng có thể bỏ qu[r]
bản lẻ xăng dầu. Để xác định được vị trí đặt các trạm bán lẻ xăng dầu cần2phải tuân theo các quy định của Bộ Công thương, nhất là các quy định về antoàn, phòng chống cháy nổ. Ngoài ra, cây xăng cũng phải đặt ở vị trí thuậnlợi cho việc kinh doanh đạt doanh số cao. Hoặc một bài toán khác cũng có ýnghĩ[r]
Lý thuyết về ỨNG DỤNG KỸ THUẬT PHÂN TÍCH CỤM CLUSTER TRONG VIỆC PHÂN NHÓM CỔ PHIẾU NGÀNH BẤT ĐỘNG SẢN. Thực tế về ỨNG DỤNG KỸ THUẬT PHÂN TÍCH CỤM CLUSTER TRONG VIỆC PHÂN NHÓM CỔ PHIẾU NGÀNH BẤT ĐỘNG SẢN. Các kiến nghị về ỨNG DỤNG KỸ THUẬT PHÂN TÍCH CỤM CLUSTER TRONG VIỆC PHÂN NHÓM CỔ PHIẾU NGÀNH BẤT[r]
• Tổng hợp (Summarization) 4 • Mô hình ràng buộc (Dependency modeling) • Biểu diễn mô hình (Model Evaluation) • Phân tích sự phát triển và độ lệch (Evolution and deviation analyst) • Phương pháp tìm kiếm (Search Method) Có nhiều phương pháp khai phá dữ liệu được nghiên cứu ở trên, trong đó có ba ph[r]
Internet được phát triển nhanh chóng và sinh ra một khối lượng khổng lồ các dữ liệu dạng siêu văn bản (dữ liệu Web), đã trở thành một kênh quan trọng về mọi thông tin của đời sống. Chính vì vậy, lĩnh vực khai phá Web có tốc độ phát triển vượt bậc, nhận được nhiều sự quan tâm của các nhà khoa học và[r]
nhằm tăng tốc độ tìm kiếm của hệ thống là một chủ đề đang được rất nhiều quan tâm của các nhà nghiên cứu trong lĩnh vực tra cứu ảnh. Sau đây là các kết quả đã được trong luận văn: Nghiên cứu lý thuyết tổng quan về tra cứu ảnh theo nội dung. Nghiên cứu các kỹ thuật đánh chỉ số ảnh và một s[r]
KẾT LUẬN Kết quả ñạt ñược Nội dung nghiên cứu trong ñề tài, tác giả ñã ñưa ra một giải pháp từ việc phân loại dữ liệu trên các phiên giao dịch, trên TMĐT , rồi tiến hành khai thác xử lý chúng ñể chiết xuất ra các tri thức cần thiết. Các tri thức này lại ñược tối ưu hoá và ñem vào sử dụng một cách[r]
Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đồng nhất cấu tạo nên ảnh hoặc các đối tƣợng [17], [52]. Phân đoạn ảnh thƣờng đƣợc sử dụng để xác định vị trí đối tƣợng (chẳng hạn nhƣ các loại cây trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đƣờng biên, ranh giới[r]
Các phương pháp KPDL truyền thống đặc biệt là các kỹ thuật phân cụm đã được áp dụng thành công và đem lại nhiều hiệu quả to lớn; tuy nhiên đối với các CSDL có kích thước rất lớn thì độ phức tạp tính toán về mặt thời gian lại tỏ ra là một trở ngại lớn, thậm chí là không khả thi. Để giải quy[r]
sau: (a) tái định cư. Thêm một cụm mới centroid Z k+1 tại một số điểmtrống xj vị trí và tìm thấy những chỉ số i của trọng tâm tốt nhất để xóa; chovij biểu sự thay đổi trong giá trị hàm mục tiêu; (b) Giữ tốt nhất. Giữ đôi chỉsố i và j nơi vij là tối thiểu;S32 (chuyển hay thay thế) Nếu trọng tâ[r]
ỨNG DỤNG PHÂN CỤM DỮ LIỆU TRONG PHÂN TÍCH, ĐÁNH GIÁ KẾT QUẢ ĐIỂM CỦA HỌC SINH Bố cục luận văn gồm 3 chương: Chương 1: Tìm hiểu tổng quan về khai phá dữ liệu và kỹ thuật phân cụm dữ liệu trong KPDL.
Chương 2: Tìm hiểu một số thuật toán điển hình trong phân cụm dữ liệu.
sau: (a) tái định cư. Thêm một cụm mới centroid Z k+1 tại một số điểmtrống xj vị trí và tìm thấy những chỉ số i của trọng tâm tốt nhất để xóa; chovij biểu sự thay đổi trong giá trị hàm mục tiêu; (b) Giữ tốt nhất. Giữ đôi chỉsố i và j nơi vij là tối thiểu;S32 (chuyển hay thay thế) Nếu trọng tâ[r]
nghiệp, vai trò của các thông tin định hướng điều khiển càng trở nên quan trọng. Từcác nghiên cứu về nhận dạng có thể đưa ra các định hướng cơ bản và điều này rất cầnthiết cho việc hoạch định ra con đường đúng đắn để phát triển trong bất kỳ lĩnh vựcnào.Nhận dạng có lịch sử lâu đời, trước những năm 1[r]
Các hướng tiếp cận khai phá dữ liệu phổ biến đang được nghiên cứu và sử dụng hiện nay: mạng nơron, kỹ thuật phân cụm và phân đoạn, phương pháp Xác định mục tiêu Thu thập và tiền xử lý dữ liệu KHAI PHÁ DỮ LIỆU (Triết xuất tri thức) Phát biểu kết quả và đánh giá Sử dụng tri thức đ[r]
Chính vì vậy, trên thực tế người ta thường đi tìm giải pháp tối ưu cục bộ cho vấn đề nàybằng cách sử dụng một hàm tiêu chuẩn để đánh giá chất lượng của các cụm cũng như đểhướng dẫn cho quá trình tìm kiếm phân hoạch dữ liệu.2.3.2 Phân cụm dữ liệu phân cấpPhân cụm ph[r]
Cho trước một cơ sở dữ liệu với n đối tượng hay các bộ dữ liệu, một phương pháp phân chia được xây dựng để chia dữ liệu thành k phần, mỗi phần đại diện cho một cụm, k ≤ n. Đó là phân loại dữ liệu vào trong k nhóm, chúng thoả các yêu cầu sau: (1) Mỗi nhóm phải chứa ít nhất một đối tượng, (2) M[r]
Trong những năm gần đây, sự phát triển vượt bậc của công nghệ thông tin đã làm tăng số lượng giao dịch thông tin trên Internet một cách đáng kể. Phương thức sử dụng giấy tờ trong giao dịch đã dần được số hóa chuyển sang các dạng văn bản lưu trữ trên máy tính hoặc truyền tải trên mạng.[r]
• Không thể xác định trước được số cụm để gán chủ đề.• Sau khi phân cụm, chọn nhãn nào cho từng cụm để phù hợp cho người dùng?181Một số vẩn đề chọn lọc cùa Câng nghệ thông tin và truyền thông, Hung Yén, 19-20 tháng 08 năm 2010• Vì thực hiện trực tuyến nên yêu cầu phải có[r]
dữ liệu và sắp xếp các giá trị này, sau đó thuật toán lựa chọn một giá trị trong dãy sắp xếp sao cho hàm tiêu chuẩn đạt giá trị tối thiểu. Nhƣ vậy, ý tƣởng chính của thuật toán phân cụm phân hoạch tối ƣu cục bộ là sử dụng chiến lƣợc ăn tham (Greedy) để tìm kiếm nghiệm. Một số thuật toá[r]