存在惩罚(Presence Penalty)
什么是存在惩罚(Presence Penalty)?
存在惩罚(Presence Penalty)介于 -2.0 和 2.0 之间,它会影响模型如何根据新令牌到目前为止是否出现在文本中来惩罚它们。
存在惩罚(Presence Penalty)设置为正值时,GPT 平台将惩罚和规避已使用的标记(token),来增加模型讨论新主题的可能性。
通常,存在惩罚(Presence Penalty)的默认值为 0,当您想要使用输入中存在的单词生成与输入提示一致的文本时,会使用它。
另一方面,如果您希望模型生成受输入限制较小的文本,则可能需要使用更高的存在惩罚(Presence Penalty),这将鼓励模型生成输入中不存在的新单词,从而实现更多样化和创造性的输出。
调整存在惩罚(Presence Penalty)
平台使用 0.01 作为默认的存在惩罚(Presence Penalty)值。
但是,您可以从“GPT 模型”选项卡的“存在惩罚(Presence Penalty)”字段中进行更改。
修改步骤:
- 单击“设置”页面,然后查找“AI 引擎”选项卡。
- 在“存在惩罚(Presence Penalty)”字段中输入新值。
- 单击“保存”按钮以保存更改。
频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty)之间的差异
这两个参数之间的主要区别在于它们修改模型预测的概率分布的方式。
频率惩罚(Frequency Penalty)参数修改概率分布,使模型在训练期间更频繁地看到的单词的可能性较小。这鼓励模型生成新颖或不太常见的单词。它的工作原理是缩小模型在训练期间经常看到的单词的对数概率,使模型生成这些常用单词的可能性降低。
存在惩罚(Presence Penalty)是一次性的累加贡献,适用于至少采样过一次的所有标记(token),而频率惩罚(Frequency Penalty)是与特定标记(token)已被采样的频率成比例的贡献。
另一方面,存在惩罚(Presence Penalty)参数修改概率分布,以降低输入提示或种子文本中出现的单词。这会鼓励模型生成不在输入中的单词。它的工作原理是缩小输入中存在的单词的对数概率,使模型不太可能生成输入中已有的这些单词。
简而言之,频率惩罚(Frequency Penalty)会惩罚模型生成模型在训练期间经常看到的常用单词,而存在惩罚(Presence Penalty)会惩罚模型生成输入文本中存在的单词。
这两个参数都可用于增加生成文本的多样性,并鼓励模型生成更多新颖或意想不到的单词,但它们以不同的方式进行,并且根据用例和特定要求,一个可能比另一个更有益,或者它们可以一起使用来控制生成的文本的多样性。