拉取已有的人工评分。如果尚未评(或已被丢弃),返回 null。 实现应当是非阻塞的——eval runner 跑完一次后可以立即查队列状态, 没结果就标记为 Score(value: null) + rationale: "pending human review"。
Score(value: null)
rationale: "pending human review"
Future<Score?> fetchVerdict(Trial trial);