AI应用开发 | 开发者人工智能社区 --开发者开聊

【privateGPT】使用privateGPT训练您自己的LLM

developer.chat

29 May 2023

了解如何在不向提供商公开您的私人数据的情况下训练您自己的语言模型

使用OpenAI的ChatGPT等公共人工智能服务的主要担忧之一是将您的私人数据暴露给提供商的风险。对于商业用途，这仍然是考虑采用人工智能技术的公司最大的担忧。

很多时候，你想创建自己的语言模型，根据你的数据集（如销售见解、客户反馈等）进行训练，但同时你不想将所有这些敏感数据暴露给OpenAI等人工智能提供商。因此，理想的方法是在本地训练自己的LLM，而无需将数据上传到云。

如果你的数据是公开的，并且你不介意将它们暴露给ChatGPT，我有另一篇文章展示了如何将ChatGPT与你自己的数据连接起来：

Connecting ChatGPT with Your Own Data using LlamaIndex

【LLM】LangChain 的Callbacks 改进

pgmr.cloud

12 May 2023

TL；DR：我们宣布对我们的回调系统进行改进，该系统支持日志记录、跟踪、流输出和一些很棒的第三方集成。这将更好地支持具有独立回调的并发运行，跟踪深度嵌套的LangChain组件树，以及范围为单个请求的回调处理程序（这对于在服务器上部署LangChain非常有用）。

阅读更多关于【LLM】LangChain 的Callbacks 改进
登录发表评论

【LLM】LangChain整合Gradio和LLM代理

pgmr.cloud

12 May 2023

编者按：这是Gradio的软件工程师Freddy Boulton的一篇客座博客文章。我们很高兴能分享这篇文章，因为它为生态系统带来了大量令人兴奋的新工具。代理在很大程度上是由他们所拥有的工具定义的，所以能够为他们配备所有这些gradio_tools对我们来说是非常令人兴奋的！

重要链接：

大型语言模型（LLM）给人留下了深刻的印象，但如果我们能赋予它们完成专门任务的技能，它们可以变得更加强大。

阅读更多关于【LLM】LangChain整合Gradio和LLM代理
登录发表评论

【LLM】LangChain 利用上下文压缩改进文档检索

pgmr.cloud

12 May 2023

注意：这篇文章假设你对LangChain有一定的熟悉程度，并且是适度的技术性文章。

💡 TL；DR：我们引入了新的抽象和新的文档检索器，以便于对检索到的文档进行后处理。具体来说，新的抽象使得获取一组检索到的文档并仅从中提取与给定查询相关的信息变得容易。

介绍

许多LLM支持的应用程序需要一些可查询的文档存储，以便检索尚未烘焙到LLM中的特定于应用程序的信息。

假设你想创建一个聊天机器人，可以回答有关你个人笔记的问题。一种简单的方法是将笔记嵌入大小相等的块中，并将嵌入的内容存储在向量存储中。当你问系统一个问题时，它会嵌入你的问题，在向量存储中执行相似性搜索，检索最相关的文档（文本块），并将它们附加到LLM提示中。

langchain

A simple retrieval Q&A system

【LLM】LangChain自定义代理

pgmr.cloud

11 May 2023

我们听到的最常见的要求之一是为创建自定义代理提供更好的功能和文档。这一直有点棘手，因为在我们看来，实际上还不清楚“代理”到底是什么，因此它们的“正确”抽象可能是什么。最近，我们感觉到一些抽象开始融合在一起，所以我们在Python和TypeScript模块上做了一个大的努力，以更好地执行和记录这些抽象。请参阅下面的技术文档链接，然后是我们介绍的抽象和未来方向的描述。