Research Questions

这个页面是轻量问题索引。它不是新的 map 层，也不试图复述所有 source；它只记录当前 wiki 能支持的高价值研究问题，以及回答这些问题时应该进入哪些 concept/source。

World model 如何进入 robot decision？

当前判断：world model 的关键不是 future 看起来真实，而是 future representation 是否改变 downstream action、policy representation 或 evaluation signal。WorldModelsForEmbodiedAI 给出 action-conditioned latent simulator 的基本形式；WorldModelEvaluation 说明 pixel metrics 容易遗漏 physical consistency 与 task relevance；π0.7 把 world model 用作 visual subgoal generator；LDA-1B 把 world model 放进 latent dynamics pretraining。

优先阅读：WorldModelsForEmbodiedAI、WorldModelTaxonomy、WorldModelEvaluation、LatentDynamicsActionModels。

证据边界：survey 和 repo 提供 taxonomy 与 literature organization；π0.7/LDA-1B 提供具体 robot foundation model evidence，但 independent replication、real-robot failure cases 和 cross-benchmark comparison 仍不足。

Simulation benchmark 能证明 robot policy generalization 吗？

当前判断：high-fidelity simulation benchmark 更适合作为 diagnostic instrument，而不是 deployment guarantee。TaskGeneralistPolicyEvaluation 说明 RoboLab 如何通过 task library、language variants、predicates、wrong-object diagnostics 和 trajectory metrics 观察 policy behavior；SimulationSensitivityAnalysis 说明 controlled perturbations 可以定位 success/failure 的 risk factors；SimulationRealityGap 保留 real/sim validity 的限制。

优先阅读：TaskGeneralistPolicyEvaluation、SimulationSensitivityAnalysis、RoboLab、robolab-a-high-fidelity-simulation-benchmark-for-analysis-of-task-generalist-policies、nvlabs-robolab。

证据边界：RoboLab 的 six-task real/sim verification 支持 simulation proxy 有价值，但也提示 proxy validity 会随 policy/task family 改变；benchmark score 不能单独等价于真实部署可靠性。

Contact model 和 solver 为什么会影响 learning/control？

当前判断：contact solver 不是底层可替换实现，而是会改变 forces、impulses、energy dissipation、residual 和 convergence 的 modeling choice。ContactComplementarity 给出 Signorini、Coulomb friction 和 maximum dissipation 的 rigid contact target；ContactSolvers 说明 per-contact 与 global/proximal methods 的 tradeoff；DifferentiablePhysics 说明 solver artifacts 可能污染 optimization gradients。

优先阅读：ContactModelsInRobotics、ContactComplementarity、ContactSolvers、DifferentiablePhysics、contact-models-in-robotics-a-comparative-analysis。

证据边界：当前 evidence 强在 controlled contact simulation benchmark；把某个 solver choice 与某个真实 robot deployment failure 直接因果绑定，还需要具体系统证据。

Heterogeneous robot data 是噪声还是资源？

当前判断：heterogeneous data 的价值取决于系统是否建模 data role。RobotContextConditioning 说明 π0.7 用 task/subtask language、metadata、control mode、speed、quality 和 subgoal images disambiguate behavior mode；LatentDynamicsActionModels 说明 LDA-1B 用 policy、forward dynamics、inverse dynamics 和 visual forecasting objectives 区分 high-quality demonstrations、low-quality trajectories 和 actionless videos。

优先阅读：RobotContextConditioning、LatentDynamicsActionModels、VisionLanguageActionModels、Pi07、LDA1B、EI30K。

证据边界：π0.7 与 LDA-1B 都支持“data role matters”，但前者强调 runtime steering，后者强调 training objective routing；两者是否能组合，还没有被当前 sources 证明。

当前 wiki 最值得补哪些 source？

当前判断：下一轮 source 补充应优先解决 evidence boundary，而不是继续横向堆 title。最有价值的补充包括 independent replication、失败案例、cross-benchmark evaluation、real-robot deployment reports，以及 world model papers 的 closed-loop control evidence。

优先阅读：Overview、WorldModelEvaluation、SimulationRealityGap。

候选方向：

π0.7、LDA-1B、RoboLab 的外部复现或批判性分析。
直接比较 visual subgoal world model、latent dynamics pretraining 和 classical model-based control 的 robot studies。
把 contact solver choice 与 real-robot MPC/RL/differentiable optimization failure 关联起来的实证工作。
World model evaluation papers 中明确报告 action coupling、closed-loop success、physical consistency 和 real-time latency 的 sources。

Niuverse LLM Wiki

探索

Research Questions

Research Questions

World model 如何进入 robot decision？

Simulation benchmark 能证明 robot policy generalization 吗？

Contact model 和 solver 为什么会影响 learning/control？

Heterogeneous robot data 是噪声还是资源？

当前 wiki 最值得补哪些 source？

关系图谱

目录

反向链接