统计语言模型(Statistical Language Models, SLM)是一种利用概率和统计理论来表示文本中词汇、短语和句子的相对频率的模型。SLM在许多自然语言处理任务中都有应用,如语音识别、文本生成、机器翻译等。 n-gram模型 n-gram模型是一种常见的SLM,其中n表示窗口内的词数。以下是一个使用Python的例子来展示n-gram的基本概念。