深入淺出Mahout K-means (PART 5) 如何決定群聚的數量 Conopy

決定群聚數量其實是一個不太容易的事情,往往需透過經驗或是對於資料預先的瞭解。不只是如何找群聚的數量,通常在分析一堆網誌資料的時候,對於不同類型、來源、作者的資料,我們都無法輕易預先瞭解在裡面到底有哪些群,例如:我們到mobile01的攝影方面的版,這裡面就至少有三種主題,包含為開箱文、攝影技巧文與比較文,但是到別的論壇可能就有其他不同的主題,如何在大量的資料中找出群聚的數量,是一個很挑戰的事情。

Continue Reading