Java的Map與Set在找尋Distinct與反向Map的分享

處理大量資料時,尤其採用Lucene作為資料索引架構,沒有SQL這類高階查詢查詢語言的DISTINCT(找出獨一無二的值),要找出Unique就需透過程式階層的實作。

通常找獨一無二值在Text Mining會被用來找尋語詞的集合,而在Data Mining,更可用來找尋屬性的有限集合(Finite State),對於離散型的資料,若能找出有限集合,可降低問題的複雜性,也可節省需多不必要的運算。

Continue Reading