TOk-Atsuru commited on
Commit
4d7c26a
·
verified ·
1 Parent(s): d400889

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +6 -1
README.md CHANGED
@@ -86,7 +86,12 @@ Thinking モードを有効にすると、より高い精度を得られます
86
 
87
  ## 手法について
88
 
89
- GOBA-AI-Labs 独自の言語認識 expert 最適化パイプラインを使用しています。従来の均一な MoE pruning とは異なり、言語ごとの expert 寄与度を分析し、対象言語(日本語)の品質を最大限保護しながら圧縮を実現します。
 
 
 
 
 
90
 
91
  ## 引用
92
 
 
86
 
87
  ## 手法について
88
 
89
+ GOBA-AI-Labs 独自の言語認識 expert 最適化パイプラインを使用しています。
90
+
91
+ - **Calibration ベースの重要度スコアリング**: 多言語テキスト(日本語・英語・コード・数学)を実際に推論し、各 expert の活性化パターンから重要度を実測します。静的な重み分析と比較して大幅に高精度な重要度ランキングを実現
92
+ - **言語特化 expert の自動検出と保護**: MoE routing パターンの言語間差分分析により、日本語品質に寄与する expert を自動的に同定し、pruning 対象から保護します
93
+ - **レイヤー適応型 expert 割り当て**: 各レイヤーの品質寄与度に基づき、レイヤーごとに最適な expert 数を動的に決定します。均一な pruning と比較して品質保持率が大幅に向上
94
+ - **Thinking モード対応**: Thinking ON/OFF 両方で評価済み。Thinking ON では MMLU +5pp、日本語品質 90% を達成
95
 
96
  ## 引用
97