กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้: https://buuir.buu.ac.th/xmlui/handle/1234567890/1409
ระเบียนเมทาดาทาแบบเต็ม
ฟิลด์ DC ค่าภาษา
dc.contributor.authorเบญจภรณ์ จันทรกองกุลth
dc.contributor.authorสุวรรณา รัศมีขวัญth
dc.contributor.authorสุนิสา ริมเจริญth
dc.contributor.authorภูสิต กุลเกษมth
dc.contributor.authorกฤษณะ ชินสารth
dc.contributor.authorอัณณ์นุพันธ์ รอดทุกข์th
dc.contributor.authorปิยนุช วรบุตรth
dc.contributor.authorจรรยา อ้นปันส์th
dc.contributor.otherมหาวิทยาลัยบูรพา. คณะวิทยาการสารสนเทศ
dc.date.accessioned2019-03-25T09:04:33Z
dc.date.available2019-03-25T09:04:33Z
dc.date.issued2557
dc.identifier.urihttp://dspace.lib.buu.ac.th/xmlui/handle/1234567890/1409
dc.description.abstractวัตถุประสงค์ของขั้นตอนวิธีในการเรียนรู้คือ เพื่อให้เกิดอัตราความผิดพลาดในการเรียนรู้ข้อมูลน้อยที่สุด โดยในงานวิจัยนี้ได้ทำการปรับปรุงฟังก์ชั่นความผิดพลาดที่ใช้วัดอัตราความผิดพลาดสำหรับชุดข้อมูลที่ไม่สมดุลได้อย่างเหมาะสม ซึ่งฟังก์ชันความผิดพลาดส่วนใหญ่จะใช้ค่าน้ำหนักที่เท่ากันทุกคลาส จากที่ทราบกันโดยทั่วไป ข้อมูลที่ไม่สมดุล หมายถึง ชุดข้อมูลที่มีจำนวนสมาชิกของคลาสส่วนมากและคลาสส่วนน้อยจำนวนไม่เท่ากัน ดังนั้นหากใช้ค่าน้ำหนักเท่ากันทุกคลาสจะทำให้การจัดกลุ่มไม่เหมาะสม และปัญหาของการเรียนรู้รูปแบบข้อมูลของชุดข้อมูลไม่สมดุลส่วนใหญ่ พบว่าข้อมูลในคลาสส่วนน้อยถูกครอบงำด้วยข้อมูลของคลาสส่วนมาก จึงเป็นผลให้เกิดความเอนเอียงในการจำแนกข้อมูลทำให้ข้อมูลในคลาสส่วนน้อยเกิดความผิดพลาดในการจำแนกกลุ่มมากกว่าคลาสส่วนมาก จากที่กล่าวมางานวิจัยนี้จึงได้ทำการหาพารามิเตอร์ที่เหมาะสมสำหรับปรับปรุงฟังก์ชั่นความผิดพลาดเฉลี่ยกำลังสอง โดบวิธีการที่นำเสนอได้นำอัตราการซ้อนทับกันของข้อมูลและอัตราความไม่สมดุลของข้อมูลมาใช้ร่วมในการปรับปรุงด้วย สำหรับขั้นตอนวิธีในการเรียนรู้ข้อมูลได้ใช้โครงข่ายประสาทเทียมแบบแพร่ย้อนกลับและฟังก์ชั่นความผิดพลาดที่ทำการปรับปรุง ขอบเขตของชุดข้อมูลที่ใช้ในงานวิจัยนี้เป็นปัญหาการจำแนกชุดข้อมูลที่มี 2 คลาส จาก UCI ผลการทดลองแสดงให้เห็นว่าฟังก์ชันความผิดพลาดที่ทำการปรับปรุงให้ประสิทธิภาพในการจำแนกข้อมูลดีกว่าฟังก์ชั่นความผิดพลาดเฉลี่ยกำลังสองแบบมาตรฐาน เมื่อเปรียบเทียบกับค่า TPR ค่า G-Mean และ F-measurementth_TH
dc.description.sponsorshipโครงการนี้ได้รับการสนับสนุนทุนวิจัย จาก สำนักงานคณะกรรมการวิจัยแห่งชาติ ปีงบประมาณ พ.ศ. 2556en
dc.language.isothth_TH
dc.publisherคณะวิทยาการสารสนเทศ มหาวิทยาลัยบูรพาth_TH
dc.subjectข้อมูลth_TH
dc.subjectสาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์th_TH
dc.titleวิธีการที่เหมาะสมสำหรับการแบ่งกลุ่มข้อมูลที่ไม่สมดุลสูงth_TH
dc.title.alternativeOptimal methods for classification of highly imbalanced datasetsth_TH
dc.typeResearchth_TH
dc.year2557
dc.description.abstractalternativeThe objective of learning is to achieve the least error rate. In this research we proposed a modified cost function as a means to properly measure error rate for imbalanced dataset. Most cost functions apply the same weights to all classes. However, it has been known that for imbalanced problem, the number of ins tances in the majority class is larger than the minority class. Therefore, the application of equal weight to all classes will significantly lead to improper classification boundary. That is, for most learning model, the minority class would be dominated by majority class which then causes a misclassification on the minority class. The objective of the research is to find the appropriate parameters to improve MSE cost function based on overlap ratio and class distribution ratio. Backpropagation algorithm with the proposed modified cost function is used to solve two-class classification problem. UCI datasets are used for the experimentation. The results show that the modified MSE cost function provides a better result than the standard one, based on True-positive rate. G-Mean, and F-measurement.en
ปรากฏในกลุ่มข้อมูล:รายงานการวิจัย (Research Reports)

แฟ้มในรายการข้อมูลนี้:
แฟ้ม ขนาดรูปแบบ 
2559_047.pdf21.29 MBAdobe PDFดู/เปิด


รายการทั้งหมดในระบบคิดีได้รับการคุ้มครองลิขสิทธิ์ มีการสงวนสิทธิ์เว้นแต่ที่ระบุไว้เป็นอื่น