输入主题短语时,如何选择适当的严格性值?

要确定短语的最佳严格度,请从默认设置开始,然后评估捕获的事件并相应地调整严格度。实验是找到精确度和召回率之间适当平衡的关键。

包含更多有意义单词的较长短语通常不需要那么严格的匹配。例如,一个由三个单词组成的短语可能只需要中等严格程度(三个单词中有两个单词)就能有效匹配,而一个由五个单词组成的短语可能只需要三个匹配(中低严格程度)。理想的严格性取决于具体短语及其预期用途。

下面是一些示例,其中调整严格度可能会对结果有帮助或有阻碍,凸显了调整严格度以获得最佳准确率/召回率权衡的重要性。

有关详细信息,请参阅For more information, see处理主题, 和使用短语

定义程序短语 检测到的短语 主题匹配 精选严格 解释

前几天打过电话

前几天打过电话

之前曾联系过

“那里”提供了与匹配主题无关的上下文。增加严格度将使这种情况被视为与“之前联系”的“匹配不够紧密”。

我回电话了

我可能会回电话

之前联系过

MedLow

“可能”提供的背景信息与匹配的主题无关。增加严格度将使这种情况被视为与“之前联系”的“匹配不够紧密”。

您想取消

因为这不像取消

取消提及

MedHigh

“取消”的上下文不同,因此与匹配的主题无关。增加严格度将使这种情况被视为“与取消提及不够匹配”。

定义程序短语 检测到的短语 主题匹配 精选严格 解释

我刚才打过电话

不久前打过电话

之前联系过

Med-Low

尽管检测到的短语中多了一个“little”,但“Contacted Previously”还是被正确匹配了。增加严格度将导致将此事件归类为与“之前联系”的“不够匹配”。

我和另一个人谈过了

与我交谈过的人

之前联系过

Med-Low

尽管检测到的短语中缺少“another”,但“Contacted Previously”仍被正确匹配。增加严格度将导致将此事件归类为与“之前联系”的“不够匹配”。

想要取消

只想取消

取消提及

Med-Low

尽管检测到的短语中多了“just”,但“取消提及”仍被正确匹配。增加严格度会导致将这种情况归类为取消提及的“不够匹配”。

取消订单

取消汇票

取消提及

Med-Low

尽管检测到的短语中多了“钱”,但“取消提及”仍被正确匹配。增加严格度会导致将这种情况归类为取消提及的“不够匹配”。