今天最先进的方法很快就会成为明天的遗留系统。投资基于人工智能的 SaaS 解决方案的企业面临着一个关键问题:如何确保今天实施的系统不会成为明天的技术债务?
答案不在于选择当下最先进的技术,而在于选择建立在灵活、适应性强的架构上的平台,这种架构能够随着新兴人工智能能力的发展而发展。本文分析了模块化架构在人工智能领域的不同实现方式,重点关注检索-增强生成(RAG),并对不同的架构方法进行了比较。
许多组织在选择人工智能解决方案时,主要依据的是当前的能力,只关注眼前的功能,而忽视了决定长期适应性的底层架构。这种做法会带来若干重大风险:
人工智能创新的步伐不断加快,基本进步出现的时间越来越紧迫。围绕人工智能特定方法构建的僵化系统往往难以融入这些进步,导致与更新的解决方案相比存在能力差距。
即使技术一成不变(也不会),业务需求也会不断变化。企业经常会发现一些在最初实施时没有预见到的有价值的人工智能用例。不灵活的平台往往难以超越其最初的设计参数。
随着时间的推移,围绕人工智能解决方案的应用程序、数据源和系统将通过升级、替换和新增而发生变化。僵化的人工智能平台往往会成为集成瓶颈,需要昂贵的变通方法或限制其他技术投资的价值。
人工智能治理要求在全球范围内不断演变,新法规不断涌现,对可解释性、公平性评估和文档提出了要求。缺乏架构灵活性的系统往往难以适应这些不断变化的合规要求。
检索增强生成(RAG)是模块化架构的一个优秀范例,它正在彻底改变人工智能系统的设计和实施方式。AWS 将其定义为 "优化大型语言模型 (LLM) 输出的过程,该模型在生成响应之前会参考其训练数据源之外的权威知识库"。
AWS 开发的 RAG 云架构体现了模块化和灵活性原则。正如陈云杰和Henry Jia在AWS公共部门博客中指出的,该架构由四个不同的模块组成:
处理流程主要遵循两条路径:
用于上传数据:
为了生成答案:
AWS 强调了这种模块化架构的几个主要优势:
RAG 架构的一个关键要素是矢量数据库。AWS 指出:"由于所有数据(包括文本、音频、图像或视频)都必须转换为嵌入向量,生成模型才能与之交互,因此向量数据库在基于生成式人工智能的解决方案中发挥着至关重要的作用。"
AWS 通过提供多种矢量数据库选项来支持这种灵活性:
在这些选项中做出选择时,"可以根据对一些问题的回答,如新数据添加的频率、每分钟发送的查询次数以及发送的查询是否基本相似"。
AWS RAG 架构是作为一个分布式系统在多个云服务中实施的,而其他人工智能系统则采用了一种集成度更高的方法,即在一个统一的神经架构中采用模块化原则。
先进的人工智能助手,如基于最新 LLM 模型的助手,使用与 RAG 类似的原理,但在架构上有一些显著的不同:
尽管在实现上存在这些差异,但这些系统都遵循 RAG 的基本原则:通过创建一个分离(至少在概念上)不同处理阶段的架构,用相关外部信息来丰富语言模型,从而提高准确性并减少幻觉。
无论采用哪种具体方法,都有促进人工智能架构灵活性的通用设计原则:
真正灵活的人工智能平台采用模块化架构,其中的组件可以独立升级或更换,而无需更改整个系统。AWS 和集成人工智能系统方法都遵循这一原则,只是实现方式不同。
灵活的平台保持了业务逻辑与底层人工智能实现之间的分离,允许随着技术的发展改变底层人工智能组件。这一点在 AWS 架构中尤为明显,因为该架构中的模型可以轻松更换。
适应性最强的人工智能系统优先考虑通过全面的应用程序接口(API)来实现编程的可访问性,而不是只关注预定义的用户界面。在 AWS 架构中,每个组件都提供了定义明确的接口,便于集成和更新。
灵活的架构要求基础设施能够在不中断服务的情况下频繁更新。这一原则在 AWS 架构等分布式系统和集成人工智能模型中都能实现,只是机制不同而已。
真正灵活的平台可为客户特定的扩展提供框架,而无需供应商的干预。这在分布式系统中最为明显,但嵌入式人工智能模型也能提供各种形式的定制。
在强调架构灵活性的同时,必须认识到业务系统也需要稳定性和可靠性。要平衡这些看似矛盾的要求,就需要
虽然内部实现可能会经常变化,但通过正式的版本控制和支持政策来严格保证外部接口的稳定性是至关重要的。
新的功能应尽可能通过添加而非替换的方式引入,使组织能够按照自己的节奏采用创新。
升级应遵循可预测和可控制的时间表,在持续创新和运行稳定之间取得平衡。
未来的人工智能架构可能会出现 AWS RAG 所体现的分布式方法与先进人工智能模型的集成方法之间的融合。重要的趋势已经出现:
人工智能正迅速从单一模式处理转向跨模式(文本、图像、音频、视频)无缝工作的统一模式。
在通用模型不断进步的同时,针对特定领域和任务的专用模型的开发也在增加,这就需要能够协调和集成不同模型的架构。
人工智能处理越来越多地分布在从云到边缘的连续统一体中,分布式模式可以更有效地平衡性能、成本和数据要求。
随着全球人工智能法规的成熟,我们预计各司法管辖区的要求将更加统一,并可能伴有认证框架。
.png)
在人工智能这样一个快速发展的领域,平台最重要的特征不是其当前的能力,而是其适应未来进步的能力。主要根据当前能力选择解决方案的组织往往会发现自己限制了未来的可能性。
通过模块化设计、与模型无关的方法、API 优先思维、持续部署基础设施和强大的可扩展性等原则,优先考虑架构的灵活性,企业可以建立起随着技术进步和业务需求而不断发展的人工智能能力。
正如 AWS 所说,"生成式人工智能的发展速度是前所未有的",只有真正模块化和灵活的架构才能确保今天的投资在未来快速发展的技术环境中继续产生价值。
也许,未来不仅属于那些能够最好地预测未来的人,也属于那些建立起能够适应任何新出现情况的系统的人。