Niuverse LLM Wiki

标签: evaluation

此标签下有5条笔记。

  • 2026年5月13日

    Task-Generalist Policy Evaluation

    • robotics
    • evaluation
    • benchmarks
    • vla
  • 2026年4月27日

    Simulation Sensitivity Analysis

    • robotics
    • simulation
    • evaluation
    • posterior-inference
  • 2026年4月27日

    Compositional Generalization in Robotics

    • robotics
    • generalization
    • robot-foundation-models
    • evaluation
  • 2026年4月27日

    World Model Evaluation

    • embodied-ai
    • world-models
    • evaluation
    • benchmarks
    • metrics
  • 2026年4月27日

    A Comprehensive Survey on World Models for Embodied AI

    • embodied-ai
    • world-models
    • robotics
    • autonomous-driving
    • evaluation

Created with Quartz v4.5.2 © 2026

  • GitHub