• 分段:在没有特定的单词边界预防的文本中(例如:中文文本中)对【单词】的边界进行识别。可以将分段方法应用于任何字符或数字序列:例如。购物车、DNA片段等。
  • 文本分类:根据预设的条件将文本划分到某一已知类别中。情绪分析师文本分类的一种特殊情况,通常以情绪词的出现频率作为分析的基础。
  • 实体提取:检测具有预定属性的单词或短语,通常指实体,例如:人、地理位置、公司、产品、品牌
  • 潜在语义索引:使用奇异值分解(SVD)的非结构文化集合中识别出术语和概念之间关系的模型。顺便指出,SVD在统计学上被称为主成分分析(PCA)。

results matching ""

    No results matching ""