模式/代数:1
准备就绪
燃料剩余:800
历史最高分:0%
◀
🚀
▶
🧠 当前控制思维透视
📢 状态信息与说明
▼
点击 “🎮 人类挑战” 亲自尝试,或者点击 “▶ AI学习” 让电脑自动进化。
🎓 核心原理:在犯错中学习
尝试 (试探)
每代50只火箭同时出发,各自尝试不同的飞行策略。
每代50只火箭同时出发,各自尝试不同的飞行策略。
评估 (犯错)
撞墙或离目标远就是“犯错”。系统会根据表现给每个火箭打分。
撞墙或离目标远就是“犯错”。系统会根据表现给每个火箭打分。
调整 (优化)
系统保留表现最好的“精英”,并对其进行微调(变异),产生下一代。好的经验被继承,持续逼近最优解。
系统保留表现最好的“精英”,并对其进行微调(变异),产生下一代。好的经验被继承,持续逼近最优解。