cassandra-anon commited on 2 days ago

Commit

c7eab6d

verified ·

1 Parent(s): 6a3e113

Upload CASSANDRA cassandra-bce-tram2 weights and metadata (anonymous CCS 2026 artifact)

Browse files

Files changed (33) hide show

seeds/seed-123/DONE +1 -0
seeds/seed-123/config.json +59 -0
seeds/seed-123/eval.json +11 -0
seeds/seed-123/model.safetensors +3 -0
seeds/seed-123/seed.txt +1 -0
seeds/seed-123/seed_probs.npz +3 -0
seeds/seed-123/special_tokens_map.json +37 -0
seeds/seed-123/tokenizer.json +0 -0
seeds/seed-123/tokenizer_config.json +55 -0
seeds/seed-123/train_config.json +15 -0
seeds/seed-123/vocab.txt +0 -0
seeds/seed-42/DONE +1 -0
seeds/seed-42/config.json +59 -0
seeds/seed-42/eval.json +11 -0
seeds/seed-42/model.safetensors +3 -0
seeds/seed-42/seed.txt +1 -0
seeds/seed-42/seed_probs.npz +3 -0
seeds/seed-42/special_tokens_map.json +37 -0
seeds/seed-42/tokenizer.json +0 -0
seeds/seed-42/tokenizer_config.json +55 -0
seeds/seed-42/train_config.json +15 -0
seeds/seed-42/vocab.txt +0 -0
seeds/seed-456/DONE +1 -0
seeds/seed-456/config.json +59 -0
seeds/seed-456/eval.json +11 -0
seeds/seed-456/model.safetensors +3 -0
seeds/seed-456/seed.txt +1 -0
seeds/seed-456/seed_probs.npz +3 -0
seeds/seed-456/special_tokens_map.json +37 -0
seeds/seed-456/tokenizer.json +0 -0
seeds/seed-456/tokenizer_config.json +55 -0
seeds/seed-456/train_config.json +15 -0
seeds/seed-456/vocab.txt +0 -0

seeds/seed-123/DONE ADDED Viewed

	@@ -0,0 +1 @@


1	+ 123

seeds/seed-123/config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "architecture": "LabelAttentionClassifier",
+  "encoder_model_name": "ibm-research/CTI-BERT",
+  "num_labels": 50,
+  "hidden_size": 768,
+  "labels": [
+    "T1003.001",
+    "T1005",
+    "T1012",
+    "T1016",
+    "T1021.001",
+    "T1027",
+    "T1033",
+    "T1036.005",
+    "T1041",
+    "T1047",
+    "T1053.005",
+    "T1055",
+    "T1056.001",
+    "T1057",
+    "T1059.003",
+    "T1068",
+    "T1070.004",
+    "T1071.001",
+    "T1072",
+    "T1074.001",
+    "T1078",
+    "T1082",
+    "T1083",
+    "T1090",
+    "T1095",
+    "T1105",
+    "T1106",
+    "T1110",
+    "T1112",
+    "T1113",
+    "T1140",
+    "T1190",
+    "T1204.002",
+    "T1210",
+    "T1218.011",
+    "T1219",
+    "T1484.001",
+    "T1518.001",
+    "T1543.003",
+    "T1547.001",
+    "T1548.002",
+    "T1552.001",
+    "T1557.001",
+    "T1562.001",
+    "T1564.001",
+    "T1566.001",
+    "T1569.002",
+    "T1570",
+    "T1573.001",
+    "T1574.002"
+  ],
+  "dropout": 0.1
+}

seeds/seed-123/eval.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "chose": "ema",
+  "tau_0.5": {
+    "doc_f1": 0.7196976724707009,
+    "macro_f1": 0.5765183923131331,
+    "micro_f1": 0.6347363328495405,
+    "n_pred_sents": 849,
+    "n_scored_docs": 30,
+    "n_skipped_empty_docs": 1
+  }
+}

seeds/seed-123/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e6f6d4d3a76272de79c7d5ff0f26c2a23522983fbcc31bbdd73671063a8d321
+size 497946220

seeds/seed-123/seed.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ 123

seeds/seed-123/seed_probs.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:abf4f0a0136c81145f6186e40edfb16e0a3baa37d6ab512ec78f19fcd2ba19cb
+size 1268517

seeds/seed-123/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

seeds/seed-123/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

seeds/seed-123/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

seeds/seed-123/train_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "recipe": "bce",
+  "dataset": "tram2",
+  "encoder": "ibm-research/CTI-BERT",
+  "max_len": 512,
+  "lr": 2e-05,
+  "batch_size": 16,
+  "epochs": 30,
+  "pos_weight": 5.0,
+  "val_size": 0.2,
+  "llrd_decay": 0.85,
+  "ema_decay": 0.999,
+  "tau": 0.5,
+  "fp16": true
+}

seeds/seed-123/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

seeds/seed-42/DONE ADDED Viewed

	@@ -0,0 +1 @@


1	+ 42

seeds/seed-42/config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "architecture": "LabelAttentionClassifier",
+  "encoder_model_name": "ibm-research/CTI-BERT",
+  "num_labels": 50,
+  "hidden_size": 768,
+  "labels": [
+    "T1003.001",
+    "T1005",
+    "T1012",
+    "T1016",
+    "T1021.001",
+    "T1027",
+    "T1033",
+    "T1036.005",
+    "T1041",
+    "T1047",
+    "T1053.005",
+    "T1055",
+    "T1056.001",
+    "T1057",
+    "T1059.003",
+    "T1068",
+    "T1070.004",
+    "T1071.001",
+    "T1072",
+    "T1074.001",
+    "T1078",
+    "T1082",
+    "T1083",
+    "T1090",
+    "T1095",
+    "T1105",
+    "T1106",
+    "T1110",
+    "T1112",
+    "T1113",
+    "T1140",
+    "T1190",
+    "T1204.002",
+    "T1210",
+    "T1218.011",
+    "T1219",
+    "T1484.001",
+    "T1518.001",
+    "T1543.003",
+    "T1547.001",
+    "T1548.002",
+    "T1552.001",
+    "T1557.001",
+    "T1562.001",
+    "T1564.001",
+    "T1566.001",
+    "T1569.002",
+    "T1570",
+    "T1573.001",
+    "T1574.002"
+  ],
+  "dropout": 0.1
+}

seeds/seed-42/eval.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "chose": "ema",
+  "tau_0.5": {
+    "doc_f1": 0.737768527094809,
+    "macro_f1": 0.5876626130480045,
+    "micro_f1": 0.6471153846153846,
+    "n_pred_sents": 841,
+    "n_scored_docs": 30,
+    "n_skipped_empty_docs": 1
+  }
+}

seeds/seed-42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d647df9dba0a3b64f63ae9ef66d598cbd04a54d2542d06aca6b93725c6268ab
+size 497946220

seeds/seed-42/seed.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ 42

seeds/seed-42/seed_probs.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7ecfcb3c1f88b8c0d7ffe2a81955fa989bd5bf74d986876473ca5c6aa03b2c9
+size 1271273

seeds/seed-42/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

seeds/seed-42/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

seeds/seed-42/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

seeds/seed-42/train_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "recipe": "bce",
+  "dataset": "tram2",
+  "encoder": "ibm-research/CTI-BERT",
+  "max_len": 512,
+  "lr": 2e-05,
+  "batch_size": 16,
+  "epochs": 30,
+  "pos_weight": 5.0,
+  "val_size": 0.2,
+  "llrd_decay": 0.85,
+  "ema_decay": 0.999,
+  "tau": 0.5,
+  "fp16": true
+}

seeds/seed-42/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

seeds/seed-456/DONE ADDED Viewed

	@@ -0,0 +1 @@


1	+ 456

seeds/seed-456/config.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+  "architecture": "LabelAttentionClassifier",
+  "encoder_model_name": "ibm-research/CTI-BERT",
+  "num_labels": 50,
+  "hidden_size": 768,
+  "labels": [
+    "T1003.001",
+    "T1005",
+    "T1012",
+    "T1016",
+    "T1021.001",
+    "T1027",
+    "T1033",
+    "T1036.005",
+    "T1041",
+    "T1047",
+    "T1053.005",
+    "T1055",
+    "T1056.001",
+    "T1057",
+    "T1059.003",
+    "T1068",
+    "T1070.004",
+    "T1071.001",
+    "T1072",
+    "T1074.001",
+    "T1078",
+    "T1082",
+    "T1083",
+    "T1090",
+    "T1095",
+    "T1105",
+    "T1106",
+    "T1110",
+    "T1112",
+    "T1113",
+    "T1140",
+    "T1190",
+    "T1204.002",
+    "T1210",
+    "T1218.011",
+    "T1219",
+    "T1484.001",
+    "T1518.001",
+    "T1543.003",
+    "T1547.001",
+    "T1548.002",
+    "T1552.001",
+    "T1557.001",
+    "T1562.001",
+    "T1564.001",
+    "T1566.001",
+    "T1569.002",
+    "T1570",
+    "T1573.001",
+    "T1574.002"
+  ],
+  "dropout": 0.1
+}

seeds/seed-456/eval.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "chose": "ema",
+  "tau_0.5": {
+    "doc_f1": 0.7559180497441368,
+    "macro_f1": 0.5936221164387891,
+    "micro_f1": 0.6527117031398668,
+    "n_pred_sents": 855,
+    "n_scored_docs": 30,
+    "n_skipped_empty_docs": 1
+  }
+}

seeds/seed-456/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1410844bba28e54988fd50b807174d8f5e810d471822a033a4d55bb5e1bee797
+size 497946220

seeds/seed-456/seed.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ 456

seeds/seed-456/seed_probs.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a72153ab715392c1cdaf879955daec7101408e9c22a113c32924bc62c0b5607
+size 1271246

seeds/seed-456/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

seeds/seed-456/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

seeds/seed-456/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

seeds/seed-456/train_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "recipe": "bce",
+  "dataset": "tram2",
+  "encoder": "ibm-research/CTI-BERT",
+  "max_len": 512,
+  "lr": 2e-05,
+  "batch_size": 16,
+  "epochs": 30,
+  "pos_weight": 5.0,
+  "val_size": 0.2,
+  "llrd_decay": 0.85,
+  "ema_decay": 0.999,
+  "tau": 0.5,
+  "fp16": true
+}

seeds/seed-456/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff