Research Questions

这个页面是轻量问题索引。它不是新的 map 层,也不试图复述所有 source;它只记录当前 wiki 能支持的高价值研究问题,以及回答这些问题时应该进入哪些 concept/source。

World model 如何进入 robot decision?

当前判断:world model 的关键不是 future 看起来真实,而是 future representation 是否改变 downstream action、policy representation 或 evaluation signal。WorldModelsForEmbodiedAI 给出 action-conditioned latent simulator 的基本形式;WorldModelEvaluation 说明 pixel metrics 容易遗漏 physical consistency 与 task relevance;π0.7 把 world model 用作 visual subgoal generator;LDA-1B 把 world model 放进 latent dynamics pretraining。

优先阅读:WorldModelsForEmbodiedAIWorldModelTaxonomyWorldModelEvaluationLatentDynamicsActionModels

证据边界:survey 和 repo 提供 taxonomy 与 literature organization;π0.7/LDA-1B 提供具体 robot foundation model evidence,但 independent replication、real-robot failure cases 和 cross-benchmark comparison 仍不足。

Simulation benchmark 能证明 robot policy generalization 吗?

当前判断:high-fidelity simulation benchmark 更适合作为 diagnostic instrument,而不是 deployment guarantee。TaskGeneralistPolicyEvaluation 说明 RoboLab 如何通过 task library、language variants、predicates、wrong-object diagnostics 和 trajectory metrics 观察 policy behavior;SimulationSensitivityAnalysis 说明 controlled perturbations 可以定位 success/failure 的 risk factors;SimulationRealityGap 保留 real/sim validity 的限制。

优先阅读:TaskGeneralistPolicyEvaluationSimulationSensitivityAnalysisRoboLabrobolab-a-high-fidelity-simulation-benchmark-for-analysis-of-task-generalist-policiesnvlabs-robolab

证据边界:RoboLab 的 six-task real/sim verification 支持 simulation proxy 有价值,但也提示 proxy validity 会随 policy/task family 改变;benchmark score 不能单独等价于真实部署可靠性。

Contact model 和 solver 为什么会影响 learning/control?

当前判断:contact solver 不是底层可替换实现,而是会改变 forces、impulses、energy dissipation、residual 和 convergence 的 modeling choice。ContactComplementarity 给出 Signorini、Coulomb friction 和 maximum dissipation 的 rigid contact target;ContactSolvers 说明 per-contact 与 global/proximal methods 的 tradeoff;DifferentiablePhysics 说明 solver artifacts 可能污染 optimization gradients。

优先阅读:ContactModelsInRoboticsContactComplementarityContactSolversDifferentiablePhysicscontact-models-in-robotics-a-comparative-analysis

证据边界:当前 evidence 强在 controlled contact simulation benchmark;把某个 solver choice 与某个真实 robot deployment failure 直接因果绑定,还需要具体系统证据。

Heterogeneous robot data 是噪声还是资源?

当前判断:heterogeneous data 的价值取决于系统是否建模 data role。RobotContextConditioning 说明 π0.7 用 task/subtask language、metadata、control mode、speed、quality 和 subgoal images disambiguate behavior mode;LatentDynamicsActionModels 说明 LDA-1B 用 policy、forward dynamics、inverse dynamics 和 visual forecasting objectives 区分 high-quality demonstrations、low-quality trajectories 和 actionless videos。

优先阅读:RobotContextConditioningLatentDynamicsActionModelsVisionLanguageActionModelsPi07LDA1BEI30K

证据边界:π0.7 与 LDA-1B 都支持“data role matters”,但前者强调 runtime steering,后者强调 training objective routing;两者是否能组合,还没有被当前 sources 证明。

当前 wiki 最值得补哪些 source?

当前判断:下一轮 source 补充应优先解决 evidence boundary,而不是继续横向堆 title。最有价值的补充包括 independent replication、失败案例、cross-benchmark evaluation、real-robot deployment reports,以及 world model papers 的 closed-loop control evidence。

优先阅读:OverviewWorldModelEvaluationSimulationRealityGap

候选方向:

  • π0.7、LDA-1B、RoboLab 的外部复现或批判性分析。
  • 直接比较 visual subgoal world model、latent dynamics pretraining 和 classical model-based control 的 robot studies。
  • 把 contact solver choice 与 real-robot MPC/RL/differentiable optimization failure 关联起来的实证工作。
  • World model evaluation papers 中明确报告 action coupling、closed-loop success、physical consistency 和 real-time latency 的 sources。