jialicheng
/

unlearn_samsum_t5-large_neggrad_4_42

Generated from Trainer

Eval Results (legacy)

Model card Files Files and versions

unlearn_samsum_t5-large_neggrad_4_42 / trainer_state.json

jialicheng's picture

Upload folder using huggingface_hub

01375c6 verified 6 months ago

3.48 kB

	{
	"best_metric": 0.6603000000000001,
	"best_model_checkpoint": "text_gen/unlearn/checkpoint/t5-large/neggrad/4.0/samsum_42/checkpoint-219",
	"epoch": 5.0,
	"eval_steps": 500,
	"global_step": 365,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"df_rougeL": 35.3727,
	"epoch": 1.0,
	"eval_gen_len": 19.8515625,
	"eval_loss": 1.6698297262191772,
	"eval_rouge1": 42.7849,
	"eval_rouge2": 20.7407,
	"eval_rougeL": 35.446,
	"eval_rougeLsum": 39.589,
	"eval_runtime": 349.4427,
	"eval_samples_per_second": 2.341,
	"eval_steps_per_second": 0.037,
	"eval_unlearn_overall_rougeL": 0.5366499999999981,
	"step": 73,
	"test_rougeL": 35.446,
	"unlearn_overall_rougeL": 0.5366499999999981,
	"unlearn_time": -1
	},
	{
	"df_rougeL": 12.4648,
	"epoch": 2.0,
	"eval_gen_len": 9.197916666666666,
	"eval_loss": 7.590928554534912,
	"eval_rouge1": 13.9304,
	"eval_rouge2": 3.6865,
	"eval_rougeL": 12.3627,
	"eval_rougeLsum": 13.2181,
	"eval_runtime": 638.2368,
	"eval_samples_per_second": 1.282,
	"eval_steps_per_second": 0.02,
	"eval_unlearn_overall_rougeL": 0.44894999999999996,
	"step": 146,
	"test_rougeL": 12.3627,
	"unlearn_overall_rougeL": 0.44894999999999996,
	"unlearn_time": -1
	},
	{
	"df_rougeL": 2.9036,
	"epoch": 3.0,
	"eval_gen_len": 2.96484375,
	"eval_loss": 87.1946029663086,
	"eval_rouge1": 3.236,
	"eval_rouge2": 0.0575,
	"eval_rougeL": 3.2242,
	"eval_rougeLsum": 3.229,
	"eval_runtime": 65.884,
	"eval_samples_per_second": 12.416,
	"eval_steps_per_second": 0.197,
	"eval_unlearn_overall_rougeL": 0.6603000000000001,
	"step": 219,
	"test_rougeL": 3.2242,
	"unlearn_overall_rougeL": 0.6603000000000001,
	"unlearn_time": -1
	},
	{
	"df_rougeL": 0.9739,
	"epoch": 4.0,
	"eval_gen_len": 2.12109375,
	"eval_loss": 144.74517822265625,
	"eval_rouge1": 0.8156,
	"eval_rouge2": 0.0074,
	"eval_rougeL": 0.8256,
	"eval_rougeLsum": 0.8157,
	"eval_runtime": 58.5107,
	"eval_samples_per_second": 13.98,
	"eval_steps_per_second": 0.222,
	"eval_unlearn_overall_rougeL": 0.42585,
	"step": 292,
	"test_rougeL": 0.8256,
	"unlearn_overall_rougeL": 0.42585,
	"unlearn_time": -1
	},
	{
	"df_rougeL": 0.6594,
	"epoch": 5.0,
	"eval_gen_len": 2.0377604166666665,
	"eval_loss": 160.100341796875,
	"eval_rouge1": 0.6105,
	"eval_rouge2": 0.0,
	"eval_rougeL": 0.6166,
	"eval_rougeLsum": 0.6071,
	"eval_runtime": 57.912,
	"eval_samples_per_second": 14.125,
	"eval_steps_per_second": 0.224,
	"eval_unlearn_overall_rougeL": 0.4786,
	"step": 365,
	"test_rougeL": 0.6166,
	"unlearn_overall_rougeL": 0.4786,
	"unlearn_time": -1
	},
	{
	"epoch": 5.0,
	"step": 365,
	"total_flos": 4443124453244928.0,
	"train_loss": -37.45592626284247,
	"train_runtime": 2431.0267,
	"train_samples_per_second": 1.211,
	"train_steps_per_second": 0.15
	}
	],
	"logging_steps": 1000,
	"max_steps": 365,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 5,
	"save_steps": 500,
	"total_flos": 4443124453244928.0,
	"train_batch_size": 8,
	"trial_name": null,
	"trial_params": null
	}