您所在的位置：首页 > 焦点

本周最火AutoGPT，GitHub3.6万+标星，解决复杂任务全程无需

来源：IT之家发布时间：2023-04-14 15:05 作者：IT之家阅读量：8753

本周 AI 圈”最红炸子鸡“诞生 ——AutoGPT。

不仅如此，这款软件系统的横空出世，一举将 AI 进程推向了新高度 ——

自主人工智能。

顾名思义，它所具备的能力主打的就是一个“自主”，完全不用人类插手的那种！

例如一位网友就要求 AutoGPT 开发一个网站，结果不到 3 分钟，AI 自己就用 React 和 Tailwind CSS“唰唰唰”地搞定了。

AI 自己上网、自己使用第三方工具、自己思考、自己操作你的电脑。

这一套打法，算得上是把“行动观察结果思考决定下一步行动”这条路子给打通并循环了起来。

就连前特斯拉 AI 总监 Andrej Karpathy 对此都评价道:

AutoGPT 是提示工程的下一个前沿。

而且不只是 AutoGPT，最近还陆陆续续地衍生出了各种自主人工智能工具，例如 AgentGPT、BabyAGI 等等。

然后网友们对面此景也坐不住了，惊叹于 AI 发展的日新月异:

这俩月，一睁眼就出新东西，太累了。

无需人类插手的 AutoGPT 们

那么这个当红的 AutoGPT，和之前 ChatGPT 那波 AI 又有何区别？

微博博主“木遥”便下场亲测了一下。

图源:微博博主“木遥”

他测试所用的题目是“给我解释 LangChain 怎么用”。

这个问题若是交给传统的 GPT，由于 LangChain 这个概念太新，AI 就会出现不知道怎么回答的情况。

若是交给“GPT + 插件”这个组合来回答，那结果就会有点像 Bing 或者 Bard。

但 AutoGPT 上手就不一样了，来欣赏一下它的执行过程:

发现失败了之后想了想，说要不 Google 一下？
Google 出了很多结果。
读了半天这些结果，说「现在我们已经搜集了不少有用的信息了，接下来让我们安装它玩一下」
然后就开始动手在我的电脑上安装 LangChain……

而博主“木遥”在这整个过程中所做的事情就是“坐在屏幕前看着这一切自动在我眼前发生”……

图源:微博博主“木遥”

然后这位博主不禁发出了感慨:

我要是有它这个行动力，三个 PhD 都念完了。

有类似自主能力的 AI，还有最近同样火爆的 AgentGPT。

也是只需要给个任务，剩下的都交给它来完成:

用 100 美元的资金创建一个新的创业公司。

AgentGPT 在接到这项任务之后，便开始了他的展示:

思考中……
添加任务:研究需要最少资金的低成本商业模式。
添加任务:确定潜在的目标市场及其需求。
添加任务:开发一个精简的 MVP，并在目标市场进行测试以验证需求。
思考中……

然后 AgentGPT 先是输出执行“研究需要最少资金的低成本商业模式”的结果:

根据我的研究，一些需要最少资金的低成本商业模式包括:

1、Dropshipping:通过 Dropshipping，你可以在网上销售产品而无需持有库存。您只需通过第三方供应商完成订单，第三方供应商将产品直接运送给您的客户。你可以从 50 美元开始支付网站托管和域名注册费。

2、社交媒体营销:如果你有社交媒体营销的天赋，你可以通过帮助企业接触他们的目标受众来创办自己的代理公司。你所需要的只是一台电脑，互联网连接，以及一些社交媒体营销的经验和技能，而你的起价只有 50 美元或更少。

3、活动策划:如果你对组织活动有热情，你可以开始自己的活动策划业务。你可以从策划一些小活动开始，比如生日派对、婚礼等等。你可以从 100 美元开始，创建一个简单的网站，名片，并通过社交媒体营销自己。

4、自由写作:如果你有写作天赋，你可以开始自己的自由写作事业。你可以通过在线平台，如 Upwork、Fiver 和其他求职网站找到客户。只需 50 美元，你就可以创建一个投资组合网站，并通过社交媒体营销自己。

这些只是一些低成本的商业模式，你只需要 100 美元的资金就可以考虑。选择一个符合你的技能和兴趣的商业模式是很重要的。

到这还没有完，AgentGPT 会继续开始它的工作:

思考中……
添加任务:针对每种已确定的低成本商业模式，对潜在的产品或服务想法进行头脑风暴。
添加任务:评估每个想法的潜在盈利能力和可扩展性。
添加任务:选择最有希望的想法，并开发精益 MVP，用于目标市场的测试。

而后便是继续地再思考、执行。

再如 BabyAGI，也只需给个目标和任务迭代次数，AI“唰唰唰”地便自己搞了起来:

而且已经有博主开始把 AutoGPT 当做自己的生产力工具了 —— 做视频！

不少网友在看到 AI 们的如此表现之后，表示整个人都通透了:

怎么玩？

这么强的工具，真的不想亲自玩一下？

操作一点也不麻烦。

首先，准备好 OpenAI API 和 PINECONE API 的密钥。

Python 要求 3.8 版本及以上。

如果你需要语音输出，你也可以准备一个 ElevenLabs API 的。

Ps. 获取地址都放在文末链接中了。

接下来，打开你的 CLI 工具下载 AutoGPT 项目:

然后:

cd ‘Auto-GPT’

pip install -r requirements.txt

接着找到 AutoGPT 的根文件夹，将“.env.template”重命名为“.env”并打开。

再将密钥都替换为你准备好的那些。

最后，在终端运行:

python scripts/main.py

如果要使用语音模式，运行:

python scripts/main.py —speak

如果不能访问 GPT-4，开启“gpt3only”模式:

python scripts/main.py —gpt3only

现在，你就可以开始搞你自己的 AutoGPT 项目了。

记住在 AuroGPT 的每个操作之后，输入“NEXT COMMAND”授权程序继续。

尽管项目也提供了不用这么麻烦的“连续模式”，最开始运行时用这个命令:

python scripts/main.py —continuous

但作者强烈不推荐！！因为它可能会导致你的 AI 一直运行下去或执行你正常根本不会授权的操作。

如果你非要试试，风险自负……

以及默认情况下，AutoGPT 用 DALL-e 生成图像，要换 Stable Diffusion 的话，需要一个 HuggingFace API 的令牌。

本质是“套娃”

简单介绍一下 AutoGPT 的原理。

AutoGPT 由于扩大了自己的应用范围，包括执行文件操作、网页浏览和数据检索等，有别于我们之前见过的所有 AI。

如 Mila 研究所前 AI 研究员 Lior 分析:

AutoGPT 相当于给了基于 GPT 的模型一个内存和一个主体。

具体来说:

AutoGPT 的架构基于 GPT-4 和 GPT-3.5，靠 API 连接；

AutoGPT 可以进行自主迭代，即通过自我批判性审查来改进输出、在先前工作的基础上进行构建，并为了获得更准确的结果集成 prompt 历史记录；

AutoGPT 具有内存管理，集成了 Pinecone 数据库，因此它可进行长期内存存储，保存上下文并基于此进行决策改进。

而在推特博主 Jay Hack 看来，AutoGPT 等类似工具的出现，其实证明了智能的本质是“套娃”这件事儿。

因为不论是 AutoGPT 还是 BabyAGI，它们都是用 LLM 来递归地调用自己。

这在 AI 领域最近可谓是个大趋势:

专业一点的话来说，这叫模型堆叠，即模型“一路向下”，去套用别的模型来拆解并解决任务。

用咱大白话来说，这就是“套娃”。

除了 AutoGPT、BabyAGI 这些，还有 ViperGPT、SayCan 和 ToolKit 等最新工具，以及前面微软发布的 VisualGPT 和 HugginGPT，都差不多是这个思想。

再往前一些，初代 DALL?E 其实就是 CLIP 套 VAE。

有意思的是，Jay Hack 指出，有着“人工智能元老”之称的马文?明斯基早在 1986 年就把人类智能描述成有许多相互作用子系统的组织。

最后，Jay Hack 也表示，正是因为“套娃”这种操作，我们的 AI 现在才得以拿下更为复杂的任务。而这，也就离通用人工智能更近一步。

确实，有不少网友都赞同:

AutoGPT 可能就是 AI 领域中的下一大趋势。

面对如此强大的“套娃”工具们，一些人则开始哀嚎了:

参考链接:

密钥获取地址:

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

本周最火AutoGPT，GitHub3.6万+标星，解决复杂任务全程无需

站点精选

推荐阅读

实时热点