AwesomeInterpretability
/

llada-mask-topk-sae

+{
+  "tokens_unmasked_evaluated": 2624920.0,
+  "dream_weighted_loss_clean(unmask)": 8.96004144888225,
+  "dream_weighted_loss_sae(unmask)": 8.672447160294409,
+  "delta_lm_loss(unmask)": -0.287594288587842,
+  "weighting": "unmask-only CE weighted by 1/(1 - t), first token excluded",
+  "t_min": 0.05,
+  "t_max": 0.5,
+  "fixed_t": null,
+  "max_len": 2048,
+  "batch_size_text": 8,
+  "io": "out",
+  "heldout_dataset": "common-pile/comma_v0.1_training_dataset",
+  "skip_first_n_examples": 500000
+}