DSpace
 

Defence Technology Institute Repository >
โครงการพัฒนาบุคลากร (K41-TAC) >
ทุนพัฒนาบุคลากรปี 2561 >

Please use this identifier to cite or link to this item: http://hdl.handle.net/123456789/4651

Title: วิทยานิพนธ์เรื่อง การเลือกคุณลักษณะข้อมูลโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้
Authors: ประจักษ์, ยาพิลา
Keywords: ทุนวิจัย 2561
ทุน สทป.
สหสัมพันธ์รูปแบบต้นไม้
ประจักษ์ ยาพิลา
K41-00046
Issue Date: 18-Oct-2023
Publisher: สถาบันเทคโนโลยีป้องกันประเทศ
Abstract: การเรียนรู้ของเครื่อง (machine learning) เป็นวิธีการทางด้านปัญญาประดิษฐษ์ (artificial intelligence) ที่ถูกนํามาใช้ในการสร้างระบบตรวจจับสัญญาณการบุกรุกในระบบสารสนเทศ ซึ่งส่วน ใหญ่จะใช้เทคนิคการจําแนกประเภทข้อมูล (data classification) ในการวิเคราะห์ข้อมูลภายในระบบ หรือโปรแกรมต่างๆ เพื่อระบุว่าข้อมูลจากระบบมีรูปแบบที่สอดคล้องกับการบุกรุกหรือไม่ แต่ในการจําแนกประเภทของข้อมูลขนาดใหญ่จําเป็นต้องใช้ทรัพยากรเป็นจํานวนมาก จึงมีขั้นตอนในการลดขนาดของข้อมูลก่อนนําข้อมูลที่ได้ไปเข้ากระบวนการจําแนกประเภทข้อมูล ในการลดขนาดข้อมูลที่มีความนิยมจะใช้การเลือกคุณลักษณะข้อมูล (feature selection) เพื่อลดปริมาณของคุณลักษณะข้อมูลลง ทําให้สามารถจําแนกประเภทข้อมูลได้เร็วขึ้น ในงานวิจัยนี้เสนอวิธีการเลือกคุณลักษณะข้อมูลด้วยวิธีสหสัมพันธ์รูปแบบต้นไม้ (correlation tree) โดยการสร้างโครงสร้างต้นไม้จากค่าสหสัมพันธ์ (correlation) ของข้อมูลแล้วเลือกข้อมูลสําคัญตามความสําคัญในลําดับชั้นของโครงสร้างต้นไม้ที่สร้างขึ้น จากนั้นจึงเปรียบเทียบประสิทธิภาพในการจําแนกประเภทข้อมูลของชุดข้อมูลที่ได้จากการเลือกคุณลักษณะโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้กับการเลือกคุณลักษณะโดยวิธีอื่นๆ ซึ่งจะทดสอบโดยการใช้การจําแนกประเภทข้อมูล 3 วิธีคือ แบบต้นไม้ตัดสินใจ (decision tree) แบบการสุ่มป่าไม้ (random forest) และแบบนาอีฟเบย์ (naïve bayes)
Machine learning, an algorithm using a concept of artificial intelligence, is used in intrusion detection systems. Data classification is a process mostly used to analyze data in systems or programs in order to identify if the data have any correlation to an intrusion. However, a number of resources must be consumed in order to classify large amount of data. For this reason, there are processes used to reduce a size of the data before using those data in a data classification process. One of the most frequently used data reduction techniques is a feature selection technique, resulting in a faster data classification process. In this research, correlation tree method is applied for the feature selection method by creating correlation tree from the correlations of data and selecting the data prioritized by the correlation tree. After that, the efficiency of feature selection methods, correlation tree and other techniques, will be compare by using three data classification methods, which are decision tree, random forest and naïve bayes.
Description: ทุนอุดหนุนการศึกษา
URI: http://hdl.handle.net/123456789/4651
Appears in Collections:ทุนพัฒนาบุคลากรปี 2561

Files in This Item:

File Description SizeFormat
วิทยานิพนธ์เรื่อง การเลือกคุณลักษณะข้อมูลโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้.pdfวิทยานิพนธ์เรื่อง การเลือกคุณลักษณะข้อมูลโดยใช้วิธีสหสัมพันธ์รูปแบบต้นไม้16.34 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback