返回列表 发布新帖
查看: 167|回复: 0

[人工智能] 微软开源多模态AI Agent基础模型Magma

发表于 2025-2-27 15:33:47 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
最近,微软在官网开源了多模态AI Agent基础模型——Magma。

与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据.

此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。

在实际使用上用户可以利用Magma来自动下电商订单、查询天气等日常操作,还能够自动操作实体机器人,甚至在下真实象棋时为用户提供有价值的帮助。

根据官方介绍,Magma可以帮助AI驱动的助手或机器人理解周围环境,并采取相应行动。例如,它可以帮助家用机器人学习如何整理以前从未见过的物品,或帮助虚拟助手为不熟悉的任务生成逐步的用户界面导航说明
AA1zSdw9.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2025 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.119491 second(s), 7 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表