不要让代理处理几何图形

发布日期:2026-06-20 10:01:23   浏览量 :2
发布日期:2026-06-20 10:01:23  
2

我要求智能体将若干便签转换为带有连接线的思维导图。三十八秒后,它构建出了一个:中心有一个枢纽,周围有五个分支,从枢纽到每个分支都有一条箭头。这五个分支位于一个完美的圆环上,间距均匀,第一个分支恰好停在正上方。我想讨论的是没有发生的那部分。智能体并未计算任何一个坐标来得到那个圆环。

这种区别正是工作的核心所在。当你构建一个供智能体操作的工具时,诱惑在于让智能体变得更聪明:更长的提示词、更多良好布局的示例、一些关于间距的规则。这是错误的杠杆。正确的杠杆是一个确定性的原语,智能体可以调用它,从而使结构精确且可复现,而不是近似。智能体提供意图。工具提供精度。你的工作是将两者连接起来,然后退居幕后。

让模型进行数学运算时的样子

给语言模型一个空白画布,并要求它生成一个由五个方框组成的圆环,它会愉快地输出五组 x 和 y 坐标。它们看起来似乎合理。但它们也会以浮点数目测那种特有的方式出错:间距漂移,半径游移,五个方框中有两个靠得稍近,而且下周使用相同的提示词会产生一个不同的、近乎圆环的形状。模型擅长决定方框应该位于一个圆上。但它不擅长将它们放置在那里的三角函数运算,因为它并没有进行三角函数运算,而是在预测读起来像三角函数结果的数字。

你可以用更多的令牌来掩盖这个问题。要求它逐步推理,给它公式,告诉它中心点和半径。现在,你是在付费让模型用散文形式缓慢地运行正弦和余弦函数,每次都有非零的错误率。输出仍然不可复现,因为下一次请求会从头重新推导相同的算术运算,并以不同的方式舍入。你已经耗尽了你的智慧预算,去教一个概率系统模仿计算器。

原语处理模型绝不应触及的部分

替代方案是交给智能体一个工具:将这些元素标识符排列成一个圆。该工具由普通代码构成,接收标识符,通过真正的数学运算计算圆环上的中心点,并写入精确的位置。智能体从未见过角度。它命名元素,并命名希望它们形成的形状。网格、行、列、圆。几何结构由一个每次返回相同答案的函数确定。

以下是我如何知道智能体使用了工具而不是走捷径的方法。圆形布局默认将第一个元素放置在顶部,因为其起始角度为负九十度,即十二点钟方向。在思维导图中,智能体碰巧首先添加的分支恰好落在正上方中心。如果模型一直在猜测坐标,第一个分支会落在某个看似合理的数字所指向的位置,而这几乎从来都不是精确的顶部。顶部放置是一个指纹。它是原语的确定性默认值显露出来的结果,也是证明结构是由代码计算而非由模型叙述的证据。

连接线从另一方面说明了同样的观点。智能体通过命名两个端点,绘制了从枢纽到每个分支的箭头,而不是在两个坐标之间画线。箭头绑定到元素上。当圆环随后移动时,箭头会自动重新路由,因为它们从来就不是关于位置的。它们是关于关系的,而关系恰恰是智能体应该表达的内容,同时由工具处理像素的位置。

总体形态

这其实不是关于画布的问题。而是关于在任何情况下如何在智能体和工具之间划清界限

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
Copyright © 2025-2027 ToB产业网址导航 公安备案 浙公网安备33010602013138号 浙ICP备16025413号-9
支持 反馈 订阅 数据