ekurtic
/

Llama-3.1-8B-Instruct-kvattn-fp8-attn_head_layer1_4q2kv

compressed-tensors

Model card Files Files and versions

Llama-3.1-8B-Instruct-kvattn-fp8-attn_head_layer1_4q2kv

326 MB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

ekurtic's picture

Upload folder using huggingface_hub

f882d67 verified 3 months ago