head-to-head

StepFun: Step 3.7 Flash vs xAI: Grok 4.3

Side-by-side comparison of specs, pricing, benchmark scores, and task rankings. Updated 2026-06-23.

Who wins by task?

Task	StepFun: Step 3.7 Flash	xAI: Grok 4.3
SQL Generation	152	158
Code Review	145	155
Code Completion	129	120
Code Refactoring	143	155
Bug Fixing	154	164
Unit Test Generation	138	144
Code Documentation	132	139
Regex Writing	129	130
CI/CD Pipelines	131	136
Frontend Component Design	135	138
Data Analysis	149	153
CSV / Spreadsheet Cleanup	140	147
ETL Scripting	137	145
JSON Extraction	142	134
Bulk Data Labeling	133	124
OCR / Document Parsing	137	141
Table Extraction from PDFs	137	141
Long-Document Summarization	141	152
Short-Form Summarization	128	120
Blog Post Writing	129	134

Scores reflect capability match + benchmark data + pricing for each task. Methodology →