Chandra OCR 2

State-of-the-art OCR model by Datalab — converts document images to markdown/HTML. Supports 90+ languages, math, tables, forms, handwriting, and complex layouts.

Model: datalab-to/chandra-ocr-2 (5B params)

Upload Document Image

Mode

ocr_layout: structured output with layout blocks. ocr: plain HTML output.

ocr_layout ocr

Max Output Tokens

1024 16384

Markdown Output

Try an example

Upload Document Image	Mode	Max Output Tokens