跳转到主要内容

ChatGPT席卷全球。数以百万计的人在使用它。但尽管它对通用知识很有帮助,但它只知道自己接受过哪些培训的信息,即2021年之前普遍可用的互联网数据。它不知道你的私人数据,也不知道最近的数据来源。

如果真的这样做了,那不是很有用吗?这就是LangChain的用武之地。

LangChain的目标是让每个人都更容易开发语言模型应用程序。我们最近在这里发布了一份关于如何通过您的数据创建自己的ChatGPT的指南。其中包括一个示例GitHub repo,用于启动和自定义。但即便如此,仍有一长串数据源需要集成和编写提示。我们在发出呼吁,看看什么是最有趣的集成,并得到了压倒性的回应后意识到了这一点。

在“Chat Your Data”挑战中,我们将发起为期一周的挑战,通过您的数据源创建ChatGPT。

动机

一如既往,这样做的动机是让每个人都更容易开发语言模型应用程序。特别是,我们认为示例对于帮助人们做到这一点至关重要。因此,我们希望为各种数据源提供尽可能多的示例(数据加载程序+提示)。

然后,我们将把数据加载逻辑放在LangChain中,把提示放在LangChainHub中,并把示例放在LangChain文档中,使其他人尽可能容易地开始。

如何开始

  • 克隆示例GitHub 代码库
  • 自定义数据源+数据提示(可以按照本教程操作)
  • 额外的好处:部署一个不错的前端来配合它!在上面的教程中,我们有一个关于拥抱面部空间的示例部署。
  • 使用此表格提交您的参赛作品
  • 重复

示例

我们在这个示例GitHub repo的基础上创建了两个示例repo,以展示它可能是什么样子:

  • Notion::与你的理念相联系
  • ReadTheDocs:连接您的ReadTheDoc网站

我们从上述推文中看到的其他消息来源的想法是:

  • Obsidian
  • Gong calls
  • PDFs
  • Audio files (can use Whisper!)
  • Git repos
  • Arbitrary websites

还有很多,更多!如果你正在寻找创意,只需查看这条推特的回复即可。

用您的数据聊天提交

上周,我们启动了一个为期一周的比赛,通过您自己的数据创建一个聊天机器人。目标是激发(1)大量用于加载各种类型数据的文档加载程序,(2)大量端到端示例。

我们在两方面都取得了成功!在文档加载程序方面,我们在College Confidential网站上添加了25个以上的文档加载程序,从s3到EveryNote不等。

在端到端的例子方面,我们很高兴能重点介绍下面的一些项目。作为提醒,比赛的获胜者将由本周末GitHub回购中拥有最多星星的人决定——所以如果你喜欢某个特定的一次性星星,那就去吧!

参赛者包括:

TokBot

Ask Everything About Me

  • Author: Yongtae
  • Twitter: @Yoooongtae
  • GitHub Repo: https://github.com/Yongtae723/chat-your-data
  • Description: This bot can do the following on your behalf: analyze your tweets and show you what you are interested in these days, answer questions about you from your blog or profile.

Roam QA

Chat-Your-Data Self Hosted

Chat With Data

Chat LangChain Telegram

Chat ISW Reports

Chat Your Data Chef

YouTuber Chatbot

Investor Education ChatChain

 

Bonus (non-valid) Submissions

There were also a series of submissions that will not be counted (due to not open source or created before the submission deadline), but that we still want to highlight because they are awesome :)

ChatGPT+WolframAlpha+Whisper

Paper QA

Any Questions