feat: allow tokenizer to load from GGUF metadata #3245

fffonion · 2025-12-16T06:58:15Z

Right now a subset of pipeline are supported (qwen2, llama3 style BPE, gpt2).

Example:

cargo run --example gguf-tokenizer -- --model unsloth/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_S.gguf --prompt "Hello"

To use in your code:

use candle_core::quantized::tokenizer::TokenizerFromGguf;

let content = gguf_file::Content::read(&mut reader).context("failed to load GGUF metadata")?;
let tokenizer =
        Tokenizer::from_gguf(&content).context("failed to initialize tokenizer from GGUF")?;

feat: allow tokenizer to load from GGUF metadata

5b893bf

fffonion force-pushed the tokenzier-from-gguf branch from b1976f8 to 5b893bf Compare December 16, 2025 06:59

fffonion changed the title ~~feat: allow tokenzier to load from GGUF metadata~~ feat: allow tokenizer to load from GGUF metadata Dec 16, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

feat: allow tokenizer to load from GGUF metadata #3245

feat: allow tokenizer to load from GGUF metadata #3245

Uh oh!

fffonion commented Dec 16, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

feat: allow tokenizer to load from GGUF metadata #3245

Are you sure you want to change the base?

feat: allow tokenizer to load from GGUF metadata #3245

Uh oh!

Conversation

fffonion commented Dec 16, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant