flux-pr-5316

Zod (TypeScript) · W2 · gpt-5-4

graphql-go-tools (Go)sqlparser-rs Zod (TypeScript)

W2 W1

gpt-5-3-codex gpt-5-4 gpt-5-1-codex-mini

pass

Tests passed. 4/5 commands passed. Strength: weak.

69.2% run pass rate

Tier 1

primary equivalencepassedequivalentneeds generated testsweak signal risk

pnpm build

gold passagent pass

sed -i 's/test: {/test: { testTimeout: 30000,/' vitest.config.ts

gold passagent pass

sed -i 's/test: {/test: { testTimeout: 30000,/' packages/zod/vitest.config.ts

gold passagent pass

sed -i 's/test: {/test: { testTimeout: 30000,/' packages/resolution/vitest.config.ts

gold passagent pass

pnpm test -- --maxWorkers 1 --maxConcurrency 1 --retry 2

gold failagent —

Partial score: 4/4

Publishable: yesWeak signal risk: yesCache: miss

Trajectory

unknown · partial order only

Canonical trajectory missing; showing coarse derived order only.

patch written

Patch captured

Stet captured agent.patch for this trial.

agent.patch

validation

Tests passed

validation

equivalence

Equivalence judgment

equivalent

validation

code review

Code review judgment

pass

validation

decision

Final decision

pass

validation

Quality

equivalence

equivalent

99% confidence

code review

pass · 100/100

footprint

medium (0.43)

behavioral

100.0%

cost

$0.50 · 692K

Equivalence Reasoning

stylistic

Agent implements the same core behavior as intended: `ZodMap` now exposes fluent `min`, `nonempty`, `max`, and `size` helpers wired to the correct size checks, and English locale sizing for `map` uses `"entries"` messaging. Extra map tests are additive and do not change the intended functionality.

Code Review

correctness: 4/4introduced bug risk: 4/4edge case handling: 4/4maintainability idioms: 4/4

The agent patch appears to satisfy the intended change: map schemas now expose size helper methods with appropriate localized `entries` messaging, and coverage was added for key success/failure size scenarios.

Evidencevalidation (104.1 KB)results (75.3 KB)run_metadata (1.6 KB)agent_patch (6.2 KB)summary (257.4 KB)manifest (695 B)