SlopCodeBench: Benchmarking How Coding Agents Degrade over Long-Horizon Tasks

		SlopCodeBench: Benchmarking How Coding Agents Degrade over Long-Horizon Tasks (scbench.ai)
		2 points by matt_d 22 days ago \| hide \| past \| favorite