跳转到主要内容

category

介绍


随着OpenAI的ChatGPT-4于2023年推出,以及Anthropic AI的Claude 3于本月早些时候推出,当前的人工智能市场正在蓬勃发展,尤其是在世代人工智能领域。这些模型减轻了内容开发人员的工作,现在城里有了一名软件工程师。

不到72小时前,Cognition发布了世界上第一位完全自主的人工智能软件工程师Devin,在SWE工作台编码基准上树立了最先进的新标准。只需一个提示,Devin就可以编写代码或创建网站,就像人类软件工程师一样。

在我们深入研究Devin之前,我们将熟悉它的创造者——认知。

什么是Cognition?


Cognition成立于2023年11月,是一家位于美国的应用人工智能实验室,专注于推理。通过利用推理,他们打算解锁人工智能的众多学科。认知目前包括与谷歌DeepMind、Cursor、Scale AI和Nuro等科技巨头合作过的专业人士和领导者。他们已经获得了2100万美元,由彼得·蒂尔的创始人基金领导。Cognition得到了DoorDash首席执行官Tony Xu和加密货币平台Coinbase创始人Fred Ehrsam等巨头的支持。

 

Devin是什么?


Devin是一个自主模型,可以在一个提示下规划、分析和执行复杂的代码和软件工程任务。它有自己的命令行、代码编辑器和单独的web浏览器。

通过在几个不同的API提供商上测试Meta的Llama 2,展示了该模型的功能。在解决问题之前,Devin首先制定了一个循序渐进的“计划”。然后,它继续使用与人类软件工程师相同的工具构建整个项目。使用内置浏览器,Devin能够调出API文档,阅读并学习如何插件到这些API中的每一个。最后,它构建并部署了一个样式齐全的网站。

Devin的与众不同之处在于它从错误中学习的能力。它可以做出成千上万的决定,并随着时间的推移变得更好。

当它在一些标准的软件工程问题集上进行测试时,它的性能优于其他解决方案。

Devin还就人工智能任务接受了顶级科技品牌的采访,并达到了预期。它还完成了Upwork上发布的真实工作中的任务,如编码任务、调试计算机视觉模型和生成详细报告。

Devin在GitHub Copilot(一种代码完成工具)上有一个一瞥。程序员可以将提示转换为可运行的代码。这种人工智能编码器不仅可以完成代码块,还可以跨多种语言进行翻译。相当令人印象深刻,对吧?但Devin能够在没有人为干预的情况下从头开始完成代码,这让它更上一层楼。

Devin是如何工作的?


如前所述,Devin有自己的命令行、自己的代码提示器部分和自己的web浏览器来收集资源。
当输入提示时,Devin将进入“计划器”模式,在该模式中,一个循序渐进的指南将解释如何解决问题。

完成此操作后,仪表板将移动到四部分界面

  • 一个具有所有输入提示的
  • 第二个是命令行部分
  • 第三,它自己的代码编辑器和
  • 第四,它有自己的浏览器,可以对资源进行全面分析,从而得出推论。
  • 最后给出了解决方案的可视化。


如何访问Devin?


Devin可以提前访问,您可以通过加入候补名单来使用或“雇佣”Devin。

Devin与其他模型相比如何?


Devin已经在SWE平台上进行了测试,SWE平台是一个基准测试平台,任务代理解决开源项目中的现实问题,最常用于软件工程师。根据Cognition的说法,Devin是在数据集的随机25%的子集上进行评估的。所有模型都得到了帮助,即模型被告知需要编辑的确切文件,而Devin则没有得到帮助。Devin端到端正确解决了13.86%的问题,这与Claude 2的4.8%和ChatGPT-4的1.74%相比有了巨大的飞跃。Cognition表示,他们将很快发布更详细的技术报告!

Devin会取代软件工程师吗?


从基准测试中可以看出,这些令人印象深刻的数字在人们,尤其是软件开发人员和工程师的心目中引起了混乱,他们对软件工作和相关工作的未来感到不安。

Cognition是一家专注于推理的应用人工智能实验室,声称正在培养具有超越现有人工智能工具能力的人工智能队友。

Cognition表示,“Devin是一个不知疲倦、技术娴熟的队友,同样愿意与你一起建设或独立完成任务供你审查。有了Devin,工程师可以专注于更有趣的问题,工程团队可以努力实现更宏伟的目标”。

有趣的是,正如大多数人认为Devin是许多软件工程师的终点一样,Devin的制造商Cognition正在积极雇佣“人类”软件工程师!各方意见不一,在对Devin进行全面测试之前,我们无法得出任何结论。

正如特斯拉前人工智能总监Andrej Karpathy所说,“在我看来,自动化软件工程将类似于自动化驾驶。”他接着说,软件工程正在发生重大变化。它将涉及更多的监督自动化,同时用英语提出高级命令、想法或进展策略。

就像任何其他生成人工智能工具一样,Devin只能和使用它的人一样好!这些只是高效用户手中的工具,使他/她的任务不那么繁琐和耗时!

 

结论


Devin AI是Generative AI领域的一大步,通过自动化编码任务和复杂问题,彻底改变了软件开发领域。随着GPT-4、Claude 3和现在Devin等模型的问世,Generative AI的未来似乎充满希望;他们不是来取代我们的,而是来帮助我们的。下一期再见!