15 3 2

Kyle Sayers

kylesayrs

https://github.com/kylesayrs

AI & ML interests

Accelerating ML inference @ Red Hat

Recent Activity

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

published a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

View all activity

Organizations

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

2B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

2B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

2B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

2B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-qmod

5B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-qmod

5B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-gptq

5B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-gptq

5B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-gptq

2B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-gptq

2B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-qmod

2B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-qmod

2B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-qmod

5B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-qmod

5B • Updated about 6 hours ago

updated a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-gptq

5B • Updated about 6 hours ago

published a model about 6 hours ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-gptq

5B • Updated about 6 hours ago

updated a model 1 day ago

inference-optimization/Meta-Llama-3-8B-Instruct-W4A16_actorder_group

2B • Updated 1 day ago • 17

published a model 1 day ago

inference-optimization/Meta-Llama-3-8B-Instruct-W4A16_actorder_group

2B • Updated 1 day ago • 17

updated a model about 1 month ago

inference-optimization/Llama-3.1-8B-Instruct-NVFP4-DDP8

5B • Updated Mar 18 • 4

published a model about 1 month ago

inference-optimization/Llama-3.1-8B-Instruct-NVFP4-DDP8

5B • Updated Mar 18 • 4

Kyle Sayers

AI & ML interests

Recent Activity

Organizations

kylesayrs's activity