ai-sage
/

GigaChat3.1-10B-A1.8B-GGUF

Text Generation

Mixture of Experts

Model card Files Files and versions

Resources

View closed (0)

Performance report for Q6_k on RTX 3090 and RTX 4090D

#6 opened 21 days ago by

Thanks! This model (Q4) runs at 110 t/s on my RTX 3060 12gb (llama-server, no MTP)

#5 opened 25 days ago by

Works at LM Studio, deserves a like

#4 opened 25 days ago by

Нет информации по качеству квантов

#3 opened 26 days ago by

В ollama сообщает, что не доступен tool calling

#2 opened 26 days ago by

плюс медведь жена и миска пельмени

#1 opened 26 days ago by