metagpt

This is a merge of pre-trained language models created using mergekit.

Merge Details

Merge Method

This model was merged using the MetaGPT merge method using Qwen/Qwen2.5-1.5B as a base.

Models Merged

The following models were included in the merge:

Configuration

The following YAML configuration was used to produce this model:

# MetaGPT
base_model: Qwen/Qwen2.5-1.5B
models:
  - model: Qwen/Qwen2.5-1.5B-Instruct
  - model: Qwen/Qwen2.5-Math-1.5B
  - model: Qwen/Qwen2.5-Coder-1.5B
merge_method: metagpt
dtype: float16
tokenizer:
  source: union

Downloads last month: 3

Safetensors

Model size

2B params

Tensor type

F16

Model tree for lejelly/metagpt-qwen2.5-1.5B-instrcut-math-code

Qwen/Qwen2.5-1.5B

Qwen/Qwen2.5-1.5B-Instruct

Qwen/Qwen2.5-Coder-1.5B

Qwen/Qwen2.5-Math-1.5B

Merge model

this model

Paper for lejelly/metagpt-qwen2.5-1.5B-instrcut-math-code

MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic

Paper • 2406.11385 • Published Jun 17, 2024