网站标志
导航菜单
当前日期时间
当前时间:
购物车
购物车中有 0 件商品 去结算 我的订单
商品搜索
商品搜索:
文章正文
生成式AI大模型之提示词工程实践
作者:    发布于:2024-04-13 10:00:59    文字:【】【】【
x提示工程是一个新兴的领域,专注于开发、设计和优化提示,以增强 LLM 的输出,从而满足您的需求。它为您提供了一种引导模型的行为从而达到您想要实现的结果的方法。

提示工程与微调不同。在微调中,使用训练数据调整权重或参数,目标是优化成本函数。就计算时间和实际成本而言,微调可能是一个昂贵的过程。然而,提示工程试图引导经过训练的 FM、LLM 或文本到图像模型给出更相关、更准确的答案。

提示工程是充分发挥大语言模型的强大能力的最快方法。通过利用一系列问题、语句或指令与 LLM 交互,您可以根据您希望实现的输出的特定上下文来调整 LLM 输出行为。

有效的提示技术可以助力您的企业实现以下益处:

提高模型的能力,增强安全性。

使用领域知识和外部工具增强模型,而无需更改模型参数或进行微调。

与语言模型交互以掌握其全部能力。

通过更高质量的输入获得更高质量的输出。

提示的要素

提示的形式取决于您给模型指定的任务。当您探索提示工程示例时,您会注意到提示包含以下部分或全部要素:

•指令:这是大语言模型要执行的任务。它提供模型应如何执行任务的描述或说明。

•上下文:这是用于引导模型的外部信息。

输入数据:这是需要响应的输入

输出指示:这是输出类型或格式

评估模型的响应

务必检查模型的响应,以确保提示产生适当质量、类型和范围的响应。根据需要更改提示。您甚至可以要求模型的一个副本改进或检查模型的另一个副本的输出。

通过反复尝试,您将提升您撰写和优化提示的直觉,从而最好地适应您的需求和模型。提示工程是一种可通过实践不断提高的迭代技能。

零样本提示是这样一种提示技术:用户向 LLM 提出任务,而不给模型提供进一步示例。在这种技术中,用户期望模型在没有事先理解或尝试任务的情况下执行任务。现代 LLM 表现出卓越的零样本能力。

使用零样本提示技术的技巧包括:

•LLM 越大,零样本提示产生有效结果的可能性就越大。

•指令调整可以改进零样本学习。您可以采用基于人类反馈的强化学习 (RLHF, reinforcement learning from human feedback) 来扩展指令调整,使现代 LLM 更好地适应人类偏好。

小样本提示是这样一种提示技术:您为模型提供有关所请求执行的任务的上下文信息。在这种技术中,您同时提供任务和所需输出的示例。在提示条件中提供此上下文或少量样本,可以使模型严格遵循任务指导。

小样本提示中的标签不必正确即可提高模型性能。通常,应用随机标签比完全不使用标签要好。然而,演示指定的标签空间和输入文本的分布很重要。此上下文中使用的“标签”一词是指提示示例的输出。“提示示例”中的语句所表达的情绪是标签的示例。

如果您有大量示例可以利用,请使用技术来遵守模型的标记限制并动态填充提示模板。您可以使用基于语义相似度的示例选择器来提供帮助。

思维链 (CoT, chain-of-thought) 提示通过中间推理步骤分解复杂的推理任务。您可以将零样本提示技术和小样本提示技术与 CoT 提示结合使用。 思维链提示特定于问题类型。您可以使用短语“一步一步地思考”在机器学习模型中调用 CoT 推理。

基本提示技术并不总是能提供您的特定业务任务所需的结果。本节课将向您介绍多种高级技术。您将学习每种高级技术的运作方式,您还将进一步了解哪种使用案例最适合每种策略。

自洽性是一种类似于思维链提示的提示技术。然而,自洽性技术不采取明显的一步一步路径或贪婪路径,而是提示模型对各种推理路径进行采样。然后,模型根据来自各个路径的多个数据点聚合最终答案。根据 Xuezhi Wang 等人撰写的文章“利用自洽性提高语言模型中的思维链推理效果”(Self-Consistency Improves Chain of Thought Reasoning in Language Models),当用于一系列常见算术和常识推理基准时,自洽性可以改进 CoT 推理提示。
浏览 (12) | 评论 (0) | 评分(0) | 支持(0) | 反对(0) | 发布人:
将本文加入收藏夹
新闻详情
脚注栏目
|
脚注信息
机电工程网(C) 2015-2020 All Rights Reserved.    联系我们