head-to-head

StepFun: Step 3.7 Flash vs xAI: Grok Build 0.1

Side-by-side comparison of specs, pricing, benchmark scores, and task rankings. Updated 2026-06-22.

Who wins by task?

Task	StepFun: Step 3.7 Flash	xAI: Grok Build 0.1
SQL Generation	152	130
Code Review	145	126
Code Completion	129	116
Code Refactoring	143	127
Bug Fixing	154	130
Unit Test Generation	138	121
Code Documentation	132	125
Regex Writing	129	119
CI/CD Pipelines	131	117
Frontend Component Design	135	122
Data Analysis	149	124
CSV / Spreadsheet Cleanup	140	127
ETL Scripting	137	122
JSON Extraction	142	123
Bulk Data Labeling	133	121
OCR / Document Parsing	137	128
Table Extraction from PDFs	137	128
Long-Document Summarization	141	129
Short-Form Summarization	128	115
Blog Post Writing	129	118

Scores reflect capability match + benchmark data + pricing for each task. Methodology →