QAST

Feb 09 2009 Published by admin under Uncategorized

ขอขอบคุณทุกท่านที่ให้ความสนใจกับระบบคำถามคำตอบสำหรับวิกิพีเดียภาษาไทยหรือ Question Answering System for Thai Wikipedia (QAST) ที่ผมนำไปจัดแสดงในงานการแข่งขันพัฒนาโปรแกรมคอมพิวเตอร์แห่งประเทศไทยครั้งที่ 11 (NSC 2009)

ขณะนี้ระบบกำลังอยู่ในช่วงพัฒนาครับ อาจใช้เวลาสักระยะหนึ่งกว่าจะเปิดให้ผู้ใช้ได้ใช้จริงได้ คาดว่าน่าจะอีกหลายอาทิตย์ครับ ในระหว่างนี้ผมขอแนะนำให้ผู้ใช้ลองใช้งานโปรแกรม ABDUL ไปก่อนครับ (http://www.hlt.nectec.or.th/abdul/index.php) ซึ่งเป็นแชทบอทที่สามารถคุยตอบโต้กับผู้ใช้เป็นภาษาไทยอย่างอัตโนมัติได้ เป็นผลงานของหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา (HLT) NECTEC ครับ

หลังจากที่ QAST สมบูรณ์แล้ว ผมจะเปิดให้ใช้งานผ่านเว็บและนำไปรวมเป็นส่วนหนึ่งของสมอง ABDUL ด้วยครับ หวังว่าผู้ที่ใช้งาน ABDUL คงได้เห็นความเปลี่ยนแปลงในการตอบคำถามของ ABDUL ครับ

One response so far

Senior project หลังหมดปี 4 เทอมแรก

Oct 17 2008 Published by admin under Uncategorized

ปี 4 เทอมแรกหมด ปิดเทอมแล้ว เหมือนโปรเจคหลัก (โปรเจคจบ) จะไม่ค่อยก้าวหน้าอะไรเลย คงเป็นเพราะใช้เวลาไปหลายเดือนกับ paper ซึ่งก็ไม่ค่อยเกี่ยวกับโปรเจคหลักที่ทำมากนัก โปรเจคหลักคือ ระบบคำถามคำตอบสำหรับวิกิพีเดียภาษาไทย ตามชื่อเลยคือ ระบบจะรับคำถามเป็นภาษาไทยจากผู้ใช้แล้วจะตอบคำถามนั้น โดยเรื่องที่ถามได้มีขอบเขตอยู่แค่ในวิกิพีเดียภาษาไทยเท่านั้น ซึ่งก็มากพอแล้ว มาลองสรุปดูดีกว่าว่าเทอมหนึ่งได้อะไรมาบ้าง

  • ได้มา 1 paper อย่างที่เคยเล่าไป (ส่ง KICSS 2008)
  • ระบบคำถามคำตอบตอนนี้ตอบได้แค่ “อะไร คือ X” หรือ “X คืออะไร” แค่นั้นเลย ง่ายมาก คงยังใช้อะไรมากไม่ได้ ตามแผนแล้วระบบต้องตอบคำถามได้ 5 ประเภท คือ คำถามเกี่ยวกับบุคคล คำถามเกี่ยวกับองค์กร คำถามเกี่ยวกับสถานที่ คำถามเกี่ยวกับตัวเลขเชิงปริมาณ และคำถามเกี่ยวกับวันเวลา (ตอบ “ทำไม” หรือ “อย่างไร” ไม่ได้ ยากเกิน..)

เรื่องที่ค้นคว้ามาจนถึงตอนนี้ ส่วนใหญ่ไม่ใช่ความรู้อะไรหรูหรา มีแต่ศึกษาคู่มือ API (เฮ้อ..) :

  • RDF (Resource Description Framework) – ข้อมูลในวิกิพีเดียทั้งหมดที่ใช้ตอบคำถามถูกสกัดเก็บอยู่ในรูปของ RDF นี้
  • SPARQL – ภาษา query สำหรับ RDF
  • API มากมายจนนึกไม่ออกส่วนใหญ่ใช้กับ Java เช่น Lucene, Jena, Jena ARQ, HTMLParser, JFreeChart, JWBF, Wikipedia-Parser, etc.

คงต้องทำต่อไป

No responses yet