Niuverse LLM Wiki

标签: benchmarks

此标签下有2条笔记。

  • 2026年5月13日

    Task-Generalist Policy Evaluation

    • robotics
    • evaluation
    • benchmarks
    • vla
  • 2026年4月27日

    World Model Evaluation

    • embodied-ai
    • world-models
    • evaluation
    • benchmarks
    • metrics

Created with Quartz v4.5.2 © 2026

  • GitHub