资料狂人 发表于 2014-11-2 10:04 
坛友゛为つaiり=んU:
你好,老师i,我想问一下文本挖掘的热点有哪些,NLP的瓶颈在哪里,对于文本挖掘和数 ...
您好,
文本挖掘目前商業上熱點為網路的輿情分析! NLP(自然語言處理)的瓶頸若是要分析中文,
則首先會遇到斷詞/分詞的問題, 其次是詞性標註及語法剖析的問題!
若是輿情分析的話則還有情緒分析的問題!
文本挖掘主要的分析數據為文本數據, 數據挖掘主要是數據庫中的結構化數據!
方法上, 有共同之處, 例如文本也會做分類, 也會作聚類!
但文本的複雜度比數據庫的數據複雜許多!
機器學系的算法是比較難理解的, 但需用簡單且淺顯的方式來讓別人理解!
11/13~11/16的課程中, 應該可以有此體會!