Powered by GitBook

分段：在没有特定的单词边界预防的文本中（例如：中文文本中）对【单词】的边界进行识别。可以将分段方法应用于任何字符或数字序列：例如。购物车、DNA片段等。
文本分类：根据预设的条件将文本划分到某一已知类别中。情绪分析师文本分类的一种特殊情况，通常以情绪词的出现频率作为分析的基础。
实体提取：检测具有预定属性的单词或短语，通常指实体，例如：人、地理位置、公司、产品、品牌
潜在语义索引：使用奇异值分解（SVD）的非结构文化集合中识别出术语和概念之间关系的模型。顺便指出，SVD在统计学上被称为主成分分析（PCA）。

results matching ""

No results matching ""