Abstract:
การค้นหารูปแบบที่ปรากฏบ่อยและปรากฏอย่างสม่ำเสมอได้รับความสนใจอย่างมากและถูกนำมาประยุกต์ใช้ในงานด้านต่าง ๆ อาทิเช่น งานด้านวิทยาศาสตร์ ด้านการแพทย์ ด้านการทำธุรกรรมต่าง ๆ เป็นต้น การค้นหารูปแบบที่ปรากฏบ่อยและปรากฏอย่างสม่ำเสมอภายใต้กรอบการพิจารณา ความสำคัญของความถี่/ความบ่อย และความสม่ำเสมอของการปรากฏซ้ำ ซึ่งการกำหนดค่าขีดแบ่งสนับสนุนที่เหมาะสมและความสม่ำเสมอ เพื่อวัดความน่าสนใจของเซตรายการนั้นสามารถทำได้ยาก ซึ่งอาจส่งผลให้ไม่มีผลลัพธ์ที่เพียงพอต่อความต้องการซึ่งทำให้ผลลัพธ์ที่ได้ไม่มีประโยชน์ต่อการนำข้อมูลไปใช้การวิเคราะห์ นอกจากนี้ยังมีการค้นหารูปแบบที่น่าสนใจจากฐานข้อมูลกระแสที่มีการไหลเวียนของข้อมูลอย่างต่อเนื่อง เพื่อประยุกต์ใช้กับธุรกิจที่มีการเพิ่มขึ้นของทรานแซกชั่นเป็นจำนวนมาก อาทิเช่น ข้อมูลการใช้บริการอินเทอร์เน็ต ข้อมูลหุ้น บริการที่ลูกค้าใช้บริการบ่อยในช่วงเวลาหนึ่ง ๆ จึงได้มีการคิดค้นการค้นหารูปแบบที่ปรากฏบ่อยสุดเคอันดับแรกและปรากฏอย่างสม่ำเสมอ จากฐานข้อมูลกระแส โดยการใช้เทคนิคการเลื่อนหน้าต่างในการพิจารณาเหตุการณ์ที่เกิดขึ้นล่าสุด ซึ่งถือได้ว่ามีความสำคัญมากกว่าเหตุการณ์ที่เกิดก่อนหน้านี้ขั้นตอนวิธีที่นำเสนอเรียกว่า TFRIM-DS (Top-k frequent-regular itemsets from data streams) ซึ่งจะได้ผลลัพธ์ของเซตรายการที่ปรากฏสมำเสมอและมีค่าสนับสนุนสูงสุดเคอันดับแรกในหน้าต่างการพิจารณาในปัจุบัน นอกจากนี้ยังมีการใช้บิตเวกเตอร์ที่ออกแบบมาเพื่อใช้ในการจัดเก็บเซตรายการ และนำบิตเวกเตอร์มาใช้ซ้ำเมื่อมีการเปลี่ยนแปลงของหน้าต่างการพิจารณาในการทดลองจะแสดงให้เห็นถึงประสิทธิภาพของขั้นตอนวิธี TFRIM-DS เพื่อใช้สำหรับค้นหารูปแบบที่ปรากฏบ่อยเคอันดับแรกและปรากฏอย่างสมำเสมอจากฐานข้อมูลกระแสด้วยเทคนิคการเลื่อนหน้าต่าง