Runway 在直播中称,其计谋正从影视制造扩大至机械人、物理与生命科学,并强调世界模型位于 AI 进步前沿:仅靠说话模型难以解决机械人技巧、疾病、科学发明等问题,真正的进步须要模型像人类一样在模仿情况中体验世界并从缺点中进修。

AI 视频公司 Runway 近日宣布推出通用“世界模型”家族 GWM-1,并同步更新其旗舰视频生成模型 Gen‑4.5。

GWM-1 基于 Gen‑4.5 构建,可逐帧生成、及时运行,并经由过程摄像机姿势、机械人指令、音频等动作进行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三种后练习变体:

  • GWM Worlds 能在长时光移动序列中保持空间连贯性,许可定义情况的几何、光照和物理规矩,并对输入动作作出精确响应;
  • GWM Robotics 被描述为基于机械人数据练习的「进修型模仿器」,可生成动作前提的视频滚动,支撑「反事实」生成以摸索不合轨迹与成果,以降低昂贵的真实数据采集与线下测试风险;
  • GWM Avatars 为音频驱动的交互式视频生成模型,可在长时对话中稳定出现天然的人类动作与神情(面部神情、眼球活动、口型同步、手势),实用于及时指导与教导、客户支撑与办事、培训模仿、互动娱乐与游戏等场景。

Gen‑4.5 的更新集中在画面保真度与创意控制,并新增原生音频生成与编辑、多镜头视频编辑等才能;官方同时承认现阶段视频生成仍存在因果推理、客体恒存性与成功误差等常见局限,这些问题将作为世界模型研究的重点偏向持续迭代。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部