Abstract:
การค้นหาเซตรายการ/รูปแบบที่ปรากฏบ่อยและสม่ำเสมอได้ถูกค้นคว้าและนำเสนออย่างแพร่หลายในการค้นหาเซตรายการที่มีความน่าสนใจจากฐานข้อมูล ซึ่งวิธีการดั้งเดิมสำหรับการค้นหาเซตรายการดังกล่าวจะพิจารณาถึงพฤติกรรม/รูปแบบในการปรากฏของข้อมูล โดยพิจารณาเพียงความถี่หรือจำนวนครั้งและความสม่ำเสมอในการปรากฏขึ้นของข้อมูล แต่อย่างไรก็ตามในการประยุกต์ใช้งานจริงนั้นข้อมูลหรือเซตรายการที่ต้องการค้นหาจากฐานข้อมูลสามารถมีความสำคัญหรือ ความน่าสนใจที่แตกต่างกันส่งผลให้วิธีการดั้งเดิมไม่สามารถตอบสนองต่อความต้องการดังกล่าวได้ ดังนั้นงานวิทยานิพนธ์นี้จึงได้มีการนำเสนอปัญหาและวิธีการสำหรับการค้นหาเซตรายการที่ปรากฏบ่อยและสม่ำเสมอภายใต้การกำหนดค่าน้ำหนักความสำคัญของแต่ละรายการ (WeightedFrequent-Regular Itemsets Miner, WFRIM) ซึ่งจะสามารถค้นหาเซตรายการที่ปรากฏบ่อยและสม่ำเสมอในฐานข้อมูลภายใต้เงื่อนไขที่เซตรายการมีความสำคัญหรือความน่าสนใจที่แตกต่างกัน โดยวิธีการ WFRIM ใช้โครงสร้างต้นไม้ที่เรียกว่า WFRI-tree ในการจัดเก็บข้อมูลและใช้เทคนิค WFRIMgrowth ในการค้นหาเซตรายการที่เป็นผลลัพธ์ในขนาดต่าง ๆ ต่อมาได้ทำการพัฒนาปรับปรุงขั้นตอน วิธีในการค้นหาเซตรายการที่นำเสนอให้มีประสิทธิภาพเพิ่มมากขึ้นที่เรียกว่า Weighted-FrequentRegular Itemset Miner using Inverval Word Segment structure (WFRIM-IWS) โดยใช้การจัดเก็บข้อมูลในรูปแบบไดนามิกบิตเวกเตอร์ (dynamic bit-vector) ที่เรียกว่า โครงสร้างแบ่งกลุ่มเวิร์ดเป็นช่วง (interval word segment, IWS) ซึ่งทั้งสองขั้นตอนวิธีได้มีการประยุกต์ใช้เทคนิคการคํานวณหาค่าน้ำหนักที่มากสุด (Global maximum weight) และค่าน้ำหนักที่มากสุดของเซตรายการที่พิจารณา (Local maximum weight) เพื่อทำการลดทอนปริภูมิสถานะและเวลาในการประมวลผล จากผลการทดลองในฐานข้อมูลสังเคราะห์และฐานข้อมูลจริงแสดงให้เห็นว่าทั้งสอง ขั้นตอนวิธีสามารถค้นหาเซตรายการ/รูปแบบที่ปรากฏบ่อยและสม่ำเสมอภายใต้การกำหนดค่าน้ำหนักความสำคัญของแต่ละรายการได้อย่างมีประสิทธิภาพ โดยขั้นตอนวิธี WFRIM-IWS สามารถประมวลผลได้รวดเร็วและใช้หน่วยความจําน้อยกว่าขั้นตอนวิธี WFRIM