首页 » 博客 » 的测试代理提供实时精度和规模

的测试代理提供实时精度和规模

是一家专注于人工智能驱动的自动化测试解决方案的公司,该公司发现,构建和全面测试 Web 应用程序(尤其是端到端测试)可能非常复杂且耗时。与单元测试不同,端到端测试可以揭示浏览器中实际发生的情况,通常可以发现其他方法遗漏的问题。

传统的解决方案,例如硬编码测试,不仅设置起来耗费大量人力,而且长期维护起来也极具挑战性。另外,聘请 QA 测试人员或许是一个解决方案,但对于初创公司来说,这很快就会成为瓶颈。每次发布都需要更多的测试人员,如果将测试外包,管理时间表和确保质量就会变得更加困难。

为了解决这个问题QA.tech 开发

了测试代理,它们可 时精度和规模 以在 行业电邮清单 浏览器上像用户一样执行任务,例如在旅行应用上购买机票。这些代理会引导整个预订流程,从搜索航班到完成购买,同时评估其成功率。它们会记录错误、记录流程并标记问题供开发者审核。通过访问控制台日志和网络调用,开发者可以轻松分析每个步骤,快速了解和调试出现的任何问题。

qdrant-qatech-2

QA.tech AI 代理的输出

是什么促使 QA.tech 使用矢量数据库?

QA.tech 最初将pgvector用于较为简单的向 除了可定制的仪表板和各种图形 量用例,但随着需求的增长,其可扩展性受到了限制,因此他们最终采用了 Qdrant。他们需要一个能够处理高速实时分析的向量数据库来支持他们的 AI 代理,这些代理在分析层中运行,负责观察和解读跨网页的操作。该分析层高度依赖多模态模型和大量的子处理,以使 AI 代理能够做出明智的实时决策。

在某些 Web 界面中可能会发生

数百个操作,实时处理这些操作(尤其是每次点击)可能会非常缓慢。动态 Web 元素和不断变化的标识符进一步加剧了这一问题,使传统方法变得不可靠。为了应对这些挑战,QA.tech 针对特定操作训练了自定义嵌入,从而显著加快了决策速度。

这种设置需要频繁的嵌入查找,每次交互都会产生大量的数据库调用。正如QA.tech 的 Vilhelm von Ehrenheim解释的那样:

“每次点击都会产生大量的嵌入、大量的调用、大量的数据库查找,这些都需要很好的扩展。”

Qdrant 的快速、可扩展的矢量搜索使 QA.tech 能够无缝处理这些高速查找,确保代理保持响应并能够实时做出快速、准确的决策。

.为何选择 Qdrant 作为其 AI 代理平台

QA.tech 的 AI 代理处理高速 Web 操作,需要 比利时商业指南 高效的 时精度和规模 实时操作和可扩展的基础架构。团队面临着管理网络开销、CPU 负载以及为不同用例存储多个嵌入数据的需求挑战。Qdrant 提供了解决这些问题的解决方案。

通过批量操作减少网络开销

在 Web 界面上单独处理数百个同时执行的操作会产生巨大的网络开销。Von Ehrenheim 解释说:“在单独的调用中执行所有这些操作会产生大量的网络开销。” Qdrant 的批处理操作使 QA.tech 能够同时处理多个操作,从而减少网络流量并提高效率。对于实时响应至关重要的 AI 代理来说,此功能至关重要。

优化嵌入处理的 CPU 负载

PostgreSQL 的事务保证机制导致处理嵌入时 CPU 使用率过高,尤其是在大规模处理时。Von Ehrenheim 指出,添加大量新嵌入“需要更多 CPU 资源”,从而导致性能瓶颈。Qdrant 的架构能够高效处理大规模嵌入,防止 CPU 过载,并确保流畅、不间断的性能,这是 AI 代理的关键要求。

针对不同用例管理多个嵌入

AI 代理需要灵活地处理实时操作和情境感知任务。QA.tech 需要不同的嵌入来实现即时操作处理和更深入的语义搜索。Von Ehrenheim 提到:“我们使用一种嵌入来处理高速操作,但我也希望存储其他类型的嵌入以用于分析目的。”

Qdrant 能够为每个数据点存储多个嵌入,这使得 QA.tech 能够满足这些多样化的需求,而不会增加复杂性。

QA.tech 如何克服 AI 代理开发中的关键挑战

构建可靠的人工智能代理具有独特的复杂性,特别是当工作流程变得更加多步骤和动态时。

QA.tech 联合创始人 Vilhelm von Ehrenheim 表示:“你要求代理采取的步骤越多,确保始终如一的表现就越困难。”

每个附加动作都会增加多层相互依赖的变量,如果不仔细管理,就会产生很容易导致错误的路径。

Von Ehrenheim 还指出了当前大型语言

模型 (LLM) 的 时精度和规模 局限性,他指出:“LLM 的功能越来越强大,但它们仍然难以进行多步推理,例如处理诸如暗模式或自适应 UI 等细微的视觉变化。”这些挑战使得代理必须具备精确的规划能力和情境感知能力,而 QA.tech 通过实现自定义嵌入和多模态模型解决了这些问题。

“这正是可扩展、适应性强的基础设施至关重要的地方,” von Ehrenheim补充道。Qdrant 对 QA.tech 至关重要,它提供了稳定、高性能的矢量搜索,以支持高要求的工作流程。“借助 Qdrant,我们能够在不影响可靠性的情况下处理这些复杂、高速的任务。”

滚动至顶部