Skip to content

基本概念

字数
2886 字
阅读时间
11 分钟

一、什么是智能体?

1. 智能体的定义

智能体被定义为任何能够通过传感器(Sensors) 感知其所处环境(Environment),并自主地通过执行器(Actuators) 采取行动(Action) 以达成特定目标的实体。 其中,传感器(Sensors)、环境(Environmen)、执行器(Actuators)和行动(Action)是智能体的四大基本要素。 然而,真正赋予智能体"智能"的,是其自主性(Autonomy)。智能体并非只是被动响应外部刺激或严格执行预设指令的程序,它能够基于其感知和内部状态进行独立决策,以达成其设计目标。这种从感知到行动的闭环,构成了所有智能体行为的基础。

2. 智能体的分类

1)基于内部决策架构的分类

智能体发展以来,有如下几种发展历程:

  1. 反射/反应智能体:决策核心由工程师明确设计的“条件-动作”规则构成,完全依赖于当前的感知输入,不具备记忆或预测能力。它像一种数字化的本能,可靠且高效,但也因此无法应对需要理解上下文的复杂任务。 反射智能体的局限性引出了一个关键问题:如果环境的当前状态不足以作为决策的全部依据,智能体该怎么办?由此就引出了基于模型的反射智能体
  2. 基于模型的反射智能体:引入了“状态”的概念。这类智能体内部有一个世界模型,用于追踪和理解环境中那些无法被直接感知的方面。它试图回答:“世界现在是什么样子的?”。 例如,一辆在隧道中行驶的自动驾驶汽车,即便摄像头暂时无法感知到前方的车辆,它的内部模型依然会维持对那辆车存在、速度和预估位置的判断。这个内部模型让智能体拥有了初级的“记忆”,使其决策不再仅仅依赖于瞬时感知,而是基于一个更连贯、更完整的世界状态理解。
  3. 基于目标的智能体:这类智能体在以上智能体的基础上有了更明确的“目标”,该智能体可以主动地、有预见性地选择能够导向某个特定未来状态的行动。这类智能体需要回答的问题是:“我应该做什么才能达成目标?”。
  4. 基于效用的智能体:在以上智能体的基础上,又引入了多个目标的利弊权衡。这类智能体可以最大化期望效用。它需要回答一个更复杂的问题:“哪种行为能为我带来最满意的结果?”。这种架构让智能体学会在相互冲突的目标之间进行权衡,使其决策更接近人类的理性选择。
  5. 学习型智能体:核心理念就是“强化学习(Reinforcement Learning, RL)”
    • 组成:一个以上各类智能体(性能元件)+一个学习元件
    • 强化学习:学习元件通过观察性能元件在环境中的行动所带来的结果来不断修正性能元件的决策策略。当学习元件成功时会被给予正向奖励,使其不断通过强化学习发现更有效的策略。
2)基于时间和反应性的分类

该分类更注重智能体在接收到信息后是会立即行动,还是会深思熟虑后再行动。这揭示了智能体设计中一个核心权衡:追求速度的反应性(Reactivity) 与追求最优解的规划性(Deliberation) 之间的平衡

a. 反应式智能体

这类智能体对环境刺激做出近乎即时的响应,简单反应式基于模型的智能体都属于此类别。

  • 优势:速度快、计算开销小。
  • 缺陷:"短视",缺乏长远规划,反应式智能体容易陷入局部最优,难以完成需要多步骤协调的复杂任务。
b. 规划式智能体

规划式(或称审议式)智能体在行动前会进行复杂的思考和规划。它们会先利用其内部的世界模型,系统地探索未来的各种可能性,评估不同行动序列的后果,以期找到一条能够达成目标的最佳路径 。基于目标基于效用的智能体是典型的规划式智能体。

  • 优势:决策的战略性和远见,能够处理复杂的、需要长远眼光的任务
  • 缺陷:高昂的时间和计算成本;在瞬息万变的环境中,当规划式智能体还在深思熟虑时,采取行动的最佳时机可能早已过去。
c. 混合式智能体

旨在结合前两者的优点,实现时间与规划的平衡。 经典的混合式架构是分层设计:底层是快速反应模块,负责处理紧急情况和基本动作;高层是规划模块,负责处理长期规划;而现代的LLM架构则更灵活,它将一个需要长远规划的任务分解为一系列的“规划->反应”/"思考->行动->观察"的微循环,使其既能应对环境的瞬息变换,又能完成对长远目标的规划。

  • 规划:在"思考"阶段,LLM分析当前状况,规划下一步合理行动,这是个审议过程
  • 反应:在“行动"和"观察"阶段,智能体与外界环境或外部工具交互,并获得反馈
3)基于知识表示的分类

该维度探究的是智能体用以决策的知识,究竟是以何种形式存于其“思想”之中。并由此塑造了多种AI文化

a. 符号主义AI

符号:人类可读的实体(词语、概念等)

传统人工智能,核心是:智能源于对符号的逻辑操作,操作遵循严格的逻辑规则

  • 优势:透明和可解释。由于推理步骤明确,其决策过程可以被完整追溯,这在金融、医疗等高风险领域至关重要。
  • 缺陷:它依赖于一个完备的规则体系,但在充满模糊和例外的现实世界中,任何未被覆盖的新情况都可能导致系统失灵,这就是所谓的“知识获取瓶颈”。
b. 亚符号主义AI
  • 亚符号主义(或称连接主义)中:知识内隐地分布在一个由大量神经元组成的复杂网络中,是从海量数据中学习到的统计模式。神经网络和深度学习是其代表。
  • 鲁棒性(或称健壮性、强壮性):总体来说其可以用于反映一个系统在面临着内部结构或外部环境的改变时也能够维持其功能稳定运行的能力

亚符号主义AI不同于符号主义AI,它不是通过明确的规则去认识识别事物,而是通过大量的例子(比如看百万张猫的图片)来自动学习“猫”的本质特征。它自己“领悟”出那些微妙的、难以言表的模式,比如毛发的纹理、脸型的比例等。这种能力让它在图像识别、语音识别等领域远超符号主义。

  • 优势:强大的模式识别能力和对噪声数据的鲁棒性,能够轻松处理图像、声音等非结构化数据
  • 缺陷:
    1. 在纯粹的逻辑推理任务上表现不佳,有时会产生看似合理却事实错误的幻觉
    2. 亚符号主义系统通常被视为一个黑箱,它能准确地识别出图片中的猫,但却无法给出合乎逻辑的回答来解释图片中的动物为什么是猫
c. 神经符号主义AI

神经符号主义 AI,也称神经符号混合主义。该AI的目的是融合以上两个AI(符号主义AI和亚符号主义AI)的优点。诺贝尔经济学奖得主 丹尼尔·卡尼曼(Daniel Kahneman)在其著作《思考,快与慢》(Thinking, Fast and Slow)中提出的双系统理论,为我们理解神经符号主义提供了一个绝佳的类比;

  • 系统 1是缓慢、有条理、基于逻辑的审慎思维,恰如符号主义 AI 的推理过程。
  • 系统 2是快速、凭直觉、并行的思维模式,类似于亚符号主义 AI 强大的模式识别能力。

人类的智能,正源于这两个系统的协同工作。同样,一个真正鲁棒的 AI,也需要兼具二者之长。大语言模型驱动的智能体是神经符号主义的一个极佳实践范例。其内核是一个巨大的神经网络,使其具备模式识别和语言生成能力。然而,当它工作时,它会生成一系列结构化的中间步骤,如思想、计划或 API 调用,这些都是明确的、可操作的符号。通过这种方式,它实现了感知与认知、直觉与理性的初步融合。

3. 智能体的构成与运行原理

1)任务环境定义:

要理解智能体的运作原理,必须理解其所处的任务环境。在人工智能领域,通常使用PEAS模型来精确描述一个任务环境,下面以智能旅行助手来展示如何使用PEAS来描述任务环境

  • PEAS模型:分析智能体的性能度量(Performance)、环境(Environment)、执行器(Acturators)和传感器(Sensors)
维度描述
Performance在预算和时间内,最大化用户满意度和行程合理性
Environment航旅预定网站、地图服务、天气预报API等网络服务
Actuators调用API的函数、向用户界面生成和显示格式化文本
Sensors解析API返回的数据(如JSON、HTML)、读取用户输入的自然语言

贡献者

The avatar of contributor named as freeway348 freeway348

文件历史

撰写