jiwon9703/Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

Gemma4-26B-A4B 기반 한국어 Reasoning SFT 모델. Claude Opus 4.6 distilled 한국어 reasoning 데이터 12K로 학습. LR 5e-5, alpha=2×r.

모델 정보

항목	내용
Base Model	unsloth/gemma-4-26B-A4B-it
학습 방법	LoRA SFT (Unsloth + TRL)
프레임워크	transformers, peft
라이센스	Apache 2.0

학습 데이터

Jongsim/claude-opus-4.6-reasoning-12k-ko-filtered-v2

사용법

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7")
tokenizer = AutoTokenizer.from_pretrained("jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7")

vLLM 서빙

vllm serve jiwon9703/Gemma4-26B-A4B-Korean-SFT-v7 --max-model-len 8192 --reasoning-parser gemma4

Downloads last month: 42

Safetensors

Model size

26B params

Tensor type

BF16

Model tree for jiwon9703/Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

Base model

google/gemma-4-26B-A4B-it

Finetuned

unsloth/gemma-4-26B-A4B-it

Finetuned

(9)

this model

jiwon9703
/

Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

jiwon9703/Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

모델 정보

학습 데이터

사용법

vLLM 서빙

Model tree for jiwon9703/Gemma4-26B-A4B-Korean-Opus-4.6-Distilled

Dataset used to train jiwon9703/Gemma4-26B-A4B-Korean-Opus-4.6-Distilled