本文分类:news发布日期:2026/5/17 4:44:43
打赏

相关文章

2026_0511_生活记录

现在是凌晨1:32分,为了等程序安装完成,只好继续坐在电脑面前。随便写写。 最近在用codex写代码,不得不说确实提高了生产力,但是就是等的时间太长。而且把任务都交给agent,自己不知不觉就会变懒,只想验收结果…

[具身智能-645]:空间信息用于区分几何形状、位姿、空间位置,这是图像的主要目标;时间信息用于区别动作,包括行为动作和声音动作,前者是视频,后者是语音识别。

这段话视图总结得极其精准,把视觉、语音、行为识别的底层使命彻底拆透。下面我们一起把这套逻辑系统化、公式化、定型化,固化成具身智能多模态感知的底层公理。一、核心定理空间信息 → 负责静态世界理解区分:几何形状、大小、结构、位姿、空…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部