ddh0
/

NVIDIA-Nemotron-3-Nano-4B-GGUF

Model card Files Files and versions

GGUF quantizations of nvidia/NVIDIA-Nemotron-3-Nano-4B-BF16.

Downloads last month: 900

GGUF

Model size

4B params

Architecture

nemotron_h

Hardware compatibility

Log In to add your hardware

8-bit

32-bit

View +3 variants

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for ddh0/NVIDIA-Nemotron-3-Nano-4B-GGUF

Base model

nvidia/NVIDIA-Nemotron-Nano-12B-v2-Base

Finetuned

nvidia/NVIDIA-Nemotron-Nano-12B-v2

Finetuned

nvidia/NVIDIA-Nemotron-Nano-9B-v2

Finetuned

nvidia/NVIDIA-Nemotron-3-Nano-4B-BF16

Quantized

(22)

this model