กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้:
https://buuir.buu.ac.th/xmlui/handle/1234567890/7814
ชื่อเรื่อง: | กรณีศึกษาการสกัดข้อมูลงานวิจัยบนเว็บเพจด้วยเว็บครอว์เลอร์ |
ชื่อเรื่องอื่นๆ: | A cse study of web reserch dt scrping by web crwlers |
ผู้แต่ง/ผู้ร่วมงาน: | ทัศนีย์ เจริญพร สุทิน อุทธบูรณ์ มหาวิทยาลัยบูรพา. คณะวิทยาการสารสนเทศ |
คำสำคัญ: | เว็ปไซต์ -- การออกแบบ เว็ปเซิฟเวอร์ -- โปรแกรมคอมพิวเตอร์ เว็ปไซต์ มหาวิทยาลัยบูรพา -- สาขาวิชาเทคโนโลยีสารสนเทศ |
วันที่เผยแพร่: | 2560 |
สำนักพิมพ์: | คณะวิทยาการสารสนเทศ มหาวิทยาลัยบูรพา |
บทคัดย่อ: | งานนิพนธ์นี้ นำเสนอผลการศึกษาและประยุกต์ใช้วิธีการสกัดข้อมูลบนเว็บเพจด้วยเว็บครอเลอร์จากเว็บไซต์ที่รวบรวมงานวิจัยต่าง ๆ มาแสดงไว้บนเว็บไซด์เดียวกัน เพื่อให้สามารถค้นหาได้สะดวกและรวดเร็วขึ้น โดยใช้ภาษาและเครื่องมือที่ปรากฏอยู่ในปัจจุบัน ได้แก่ Nodejs และ Cheerio ซึ่งเป็นเครื่องมือที่สามารถดึงข้อมูลจากเว็บไซต์ด้วยวิธีการเข้าถึงโครงสร้าง HTML ของเว็บไซต์นั้น ๆ เพื่อสกัดข้อมูลที่ต้องการ และจัดเก็บข้อมูลที่ได้ลงในฐานข้อมูลสำหรับนำไปสร้างส่วนแสดงผลลัพธ์ต่อไป โดยได้ทดลองสกัดข้อมูลงานวิจัยจากเว็บไซต์งานวิจัยมหาวิทยาลัยบูรพา เว็บไซต์โครงการเครือข่ายห้องสมุดในประเทศไทย และเว็บไซต์คลังข้อมูลงานวิจัยไทย ผลการทดลองสกัดข้อมูลงานวิจัยทั้ง 3 เว็บไซต์ที่มีจำนวนงานวิจัยรวมทั้งหมด 543,695 รายการนั้นใช้เวลาในการครอว์ทั้งสิ้น 1,434 นาที เมื่อนำข้อมูลทั้งหมดมาหาค่า Precision, Recall และ F-Measure เพื่อหาประสิทธิภาพของการสกัดข้อมูล พบว่า ค่า Precision เท่ากับร้อยละ 99 ของสัดส่วนของจำนวนข้อมูล (Records) ที่สกัดได้ตรงตามความต้องการต่อจำนวนข้อมูลงานวิจัยทั้งหมด ค่า Recall เท่ากับ ร้อยละ 99 ของสัดส่วนของจำนวนข้อมูล (Records) ที่สืบค้นได้ตรงตามความต้องการต่อจำนวนข้อมูลที่ตรงตามความต้องการและเมื่อวัดค่า F-measure เพื่อหาประสิทธิภาพของการนำเครื่องมือดังกล่าวมาใช้ในการครอว์และสืบค้น พบว่า มีค่าความถูกต้องร้อยละ 99 จึงแสดงให้เห็นว่า การประยุกต์ใช้วิธีการสกัดข้อมูลบนเว็บเพจด้วยเว็บครอเลอร์นี้มีประสิทธิภาพ ผลของการศึกษาสามารถนำมาใช้เป็นส่วนหนึ่งของระบบบริหารจัดการประวัติการทำงานของบุคลากรต่อไปได้ |
รายละเอียด: | งานนิพนธ์ (วท.ม.)--มหาวิทยาลัยบูรพา, 2561 |
URI: | https://buuir.buu.ac.th/xmlui/handle/1234567890/7814 |
ปรากฏในกลุ่มข้อมูล: | วิทยานิพนธ์ (Theses) |
แฟ้มในรายการข้อมูลนี้:
แฟ้ม | รายละเอียด | ขนาด | รูปแบบ | |
---|---|---|---|---|
Fulltext.pdf | 2.9 MB | Adobe PDF | ดู/เปิด |
รายการทั้งหมดในระบบคิดีได้รับการคุ้มครองลิขสิทธิ์ มีการสงวนสิทธิ์เว้นแต่ที่ระบุไว้เป็นอื่น