具身智能(Embodied Intelligence)是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。具身智能的核心理念是颠覆传统人工智能的“离身性”局限,强调智能的本质必须通过身体与环境的动态互动来塑造和体现。它的科学立论是“知行合一”,认为只有通过实际的行动和交互,机器或个体才能深刻地理解和具象化场景与概念。具身智能的整体架构由感知层、决策层和行动层组成。感知层负责获取和处理环境信息,为智能体的决策和行为提供依据;决策层是具身智能的核心,需要类似人类大脑的处理能力,以满足机器人在理解指令、分解任务、规划子任务、识别物体等方面的需求;行动层则根据决策层的指令,通过智能体的物理身体实现具体的行动。具身智能的算法路径主要分为两条:一是以OpenAI与Figure合作的Figure 01为代表的分层决策模型,它通常分为策略控制系统、环境交互的控制系统和行为控制系统三层;二是以Google RT - 2为代表的端到端模型,利用一个神经网络完成从输入到感知、推理、决策和行为指令输出的全过程。具身智能的应用场景十分广泛,包括智能制造、医疗服务、居家养老、智能安防、抢险救灾、海洋作业等领域。2025年,具身智能首次被写入政府工作报告,标志着其正式进入国家战略规划,未来有望迎来更快速的发展。
|
|