Friday, May 21, 2010

Recommended Book: Statistical methods in bioinformatics

This book is recommended for studying about sequence, statistical methods in bioinformatics.

Statistical methods in bioinformatics
by Warren J. Ewens Gregory Grant



Thursday, May 20, 2010

หลักการเลือกจำนวน clusters ที่เหมาะสมสำหรับการทำ Clustering

ในการแบ่งกลุ่ม clusters นั้นบางครั้งเราอาจจะต้องกำหนดจำนวน clusters ที่เหมาะสม โดยเป็นค่า parameter หนึ่งของการคำนวณ
เช่นการทำ k-means clustering ต้องกำหนดจำนวนกลุ่มให้ algorithm ก่อน
ดูหลักการได้ใน
หลักการเลือกจำนวน clusters ที่เหมาะสมสำหรับการทำ clustering (wikipedia)

Note: ถ้าเอาไป apply กับ CART ก็อาจใช้กำหนดจำนวน node หรือ ระดับการ prune ที่เหมาะสมได้