大模型文本生成——解码策略(Top-k & Top-p & Temperature)
在自然语言任务中,我们通常使用一个预训练的大模型(比如GPT)来根据给定的输入文本(比如一个开头或一个问题)生成输出文本(比如一个答案或一个结尾)。为了生成输出文本,我们需要让模型逐个预测每个 token ,直到达到一个终止条件(如一个标点符号或一个最大长度)。在每一步,模型会给出一个概率分布,表示它对下一个单词的预测。
2023年09月18日
关于大模型驱动的AI智能体Agent的一些思考
众所周知,大模型可以写好的文案、故事、散文和程序,而随着AutoGPT, GPT-Engineer and BabyAGI等项目的火爆,以LLM(large language model) 作为核心控制器来构建agents,通过集成不同系统、工具自主决策完成各类复杂任务,正在成为自主人工智能新的创新方向。 注意:这里是让LLM去做事,不是去对话。
2023年09月18日
大模型业务应用中数据准备的要求、难点及解决思路
自2022年底OpenAI发布ChatGPT以来,大模型涌现式的智能引起了世界的广泛关注,大模型在商业场景的应用方兴未艾。与大模型交谈时,我们惊讶于它可比真人的理解能力、创作能力,而究其根源,我们更惊叹于支撑大模型智能的海量高质量数据。可以说,数据的准备决定了大模型应用的成败。然而,针对大模型在垂直应用场景中的数据准备,还有诸多问题并不明确:在业务场景中,大模型对数据准备有什么要求?谁来参与数据准备?数据准备的工作中可能遇到哪些难点,有什么解决思路?本文将着眼于大模型在业务领域的优化训练,对这些问题做一下探讨。
2023年09月13日
大模型再发展5年,搜索引擎还在么?
大模型既是内容的生成器也是信息的过滤器,而搜索只是信息的过滤器,那发展下去搜索引擎这个自互联网发生以来就存在的产品会受到什么影响?
2023年09月13日
AI领域的agent是什么意思?
代理(Agent)指能自主感知环境并采取行动实现目标的智能体。基于大语言模型(LLM)的 AI Agent 利用 LLM 进行记忆检索、决策推理和行动顺序选择等,把Agent的智能程度提升到了新的高度。LLM驱动的Agent具体是怎么做的呢?接下来的系列分享会介绍 AI Agent 当前最新的技术进展。
2023年09月13日
人工智能的应用范式呼之欲出
论文中这套十步工作流极有可能成为未来三到五年乃至更长时期内人工智能大模型的应用范式。这个预判的起始于思维链(CoT,Chain-of-Thought)涌现的那个时刻。通过CoT咒语般的提示词 “Step by Step”,大语言模型一改过去的一本正经胡说八道,开始认真严肃的逐步推导,虽然推导得出的答案有时候还是会出现张冠李戴的低级错误,但是推导的过程却已经展现了一定的因果推理的能力。
2023年09月12日