Text Generation
Transformers
Safetensors
Russian
English
llama
conversational
text-generation-inference

Vikhr-YandexGPT-5-Lite-8B-it

Π˜Π½ΡΡ‚Ρ€ΡƒΠΊΡ‚ΠΈΠ²Π½Π°Ρ модСль Π½Π° основС YandexGPT-5-Lite-8B-pretrain, обучСнная Π½Π° русскоязычном датасСтС GrandMaster-PRO-MAX ΠΈ Grounded-RAG-RU-v2 с использованиСм SFT.

Quatized variants:

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ:

ΠŸΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ / Try now:

Open In Colab

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅:

Vikhr-YandexGPT-5-Lite-8B-it Π±Ρ‹Π»Π° создана с использованиСм ΠΌΠ΅Ρ‚ΠΎΠ΄Π° SFT (Supervised Fine-Tuning).

Π˜Π½ΡΡ‚Ρ€ΡƒΠΊΡ‚ΠΈΠ²Π½Π°Ρ SFT Ρ‡Π°ΡΡ‚ΡŒ

Для SFT этапа обучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΡ‹ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΈΠ»ΠΈ большой (150ΠΊ инструкций) инструктивный синтСтичСский датасСт Vikhrmodels/GrandMaster-PRO-MAX. Π•Π³ΠΎ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ являСтся встроСный CoT (Chain-Of-Thought), для сбора ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΌΡ‹ использовали ΠΌΠΎΠ΄ΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΠΌΠ΅Ρ‚ для gpt-4-turbo, подробности Π² ΠΊΠ°Ρ€Ρ‚ΠΎΡ‡ΠΊΠ΅ датасСта.

ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ RAG Grounding, ΠΌΡ‹ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ синтСтичСский датасСт - Vikhrmodels/Grounded-RAG-RU-v2 (50k Π΄ΠΈΠ°Π»ΠΎΠ³ΠΎΠ²), Π΅Π³ΠΎ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ сборки достаточно слоТный для ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΎΠ³ΠΎ описания ΠΈ ΠΏΠΎΠ»Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎΠ± этом Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π² Π΅Π³ΠΎ ΠΊΠ°Ρ€Ρ‚ΠΎΡ‡ΠΊΠ΅.

ΠšΠΎΠ½Ρ„ΠΈΠ³ обучСния

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π° для запуска:

from transformers import AutoModelForCausalLM, AutoTokenizer

# Load the model and tokenizer
model_name = "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Prepare the input text
input_text = "Напиши ΠΊΡ€Π°Ρ‚ΠΊΠΎΠ΅ описаниС Ρ„ΠΈΠ»ΡŒΠΌΠ° Назад Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅Π΅."

messages = [
    {"role": "user", "content": input_text},
]

# Tokenize and generate text
input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
output = model.generate(
    input_ids,
    max_length=1512,
    temperature=0.7,
)

# Decode and print result
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)

ΠžΡ‚Π²Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ:

"Назад Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅Π΅" (Π°Π½Π³Π». "Back to the Future") β€” это амСриканский Π½Π°ΡƒΡ‡Π½ΠΎ-фантастичСский Ρ„ΠΈΠ»ΡŒΠΌ, Π²Ρ‹ΠΏΡƒΡ‰Π΅Π½Π½Ρ‹ΠΉ Π² 1985 Π³ΠΎΠ΄Ρƒ. РСТиссёром ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹ выступил Π ΠΎΠ±Π΅Ρ€Ρ‚ ЗСмСкис, Π° сцСнарий написал Π‘ΠΎΠ± Π“Π΅ΠΉΠ». Π“Π»Π°Π²Π½Ρ‹Π΅ Ρ€ΠΎΠ»ΠΈ исполнили Майкл Π”ΠΆ. Ѐокс, ΠšΡ€ΠΈΡΡ‚ΠΎΡ„Π΅Ρ€ Π›Π»ΠΎΠΉΠ΄ ΠΈ Π›ΠΈΠ° Вомпсон.

Ѐильм рассказываСт ΠΈΡΡ‚ΠΎΡ€ΠΈΡŽ ΠœΠ°Ρ€Ρ‚ΠΈ МакЀлая, ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠ³ΠΎ подростка ΠΈΠ· 1985 Π³ΠΎΠ΄Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ случайно ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ‚ Π² 1955 Π³ΠΎΠ΄ благодаря ΠΈΠ·ΠΎΠ±Ρ€Π΅Ρ‚Π΅Π½ΠΈΡŽ своСго Π΄Ρ€ΡƒΠ³Π°-ΡƒΡ‡Π΅Π½ΠΎΠ³ΠΎ, Π΄ΠΎΠΊΡ‚ΠΎΡ€Π° Π­ΠΌΠΌΠ΅Ρ‚Ρ‚Π° Π‘Ρ€Π°ΡƒΠ½Π°. ΠœΠ°Ρ€Ρ‚ΠΈ оказываСтся Π² ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΌ, Π³Π΄Π΅ ΠΎΠ½ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Π΄ΠΎΠΊΡ‚ΠΎΡ€Ρƒ Π‘Ρ€Π°ΡƒΠ½Ρƒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π² Ρ‚ΠΎ врСмя Π±Ρ‹Π» ΠΌΠΎΠ»ΠΎΠ΄Ρ‹ΠΌ ΠΈ Π½Π°ΠΈΠ²Π½Ρ‹ΠΌ, изобрСсти ΠΌΠ°ΡˆΠΈΠ½Ρƒ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ.

Π’ процСссС своих ΠΏΡ€ΠΈΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠΉ ΠœΠ°Ρ€Ρ‚ΠΈ встрСчаСт ΠΌΠΎΠ»ΠΎΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡ‚ΠΎΡ€Π° Π‘Ρ€Π°ΡƒΠ½Π° ΠΈ Π΅Π³ΠΎ сСмью, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π²Π»ΡŽΠ±Π»ΡΠ΅Ρ‚ΡΡ Π² Π΄Π΅Π²ΡƒΡˆΠΊΡƒ, которая Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅ΠΌ станСт Π΅Π³ΠΎ ΠΌΠ°Ρ‚Π΅Ρ€ΡŒΡŽ. ΠœΠ°Ρ€Ρ‚ΠΈ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ошибки ΠΏΡ€ΠΎΡˆΠ»ΠΎΠ³ΠΎ, Π½ΠΎ ΠΈ ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ катастрофу, которая ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π±ΡƒΠ΄ΡƒΡ‰Π΅Π΅.

Ѐильм ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» мноТСство Π½Π°Π³Ρ€Π°Π΄ ΠΈ стал ΠΊΡƒΠ»ΡŒΡ‚ΠΎΠ²Ρ‹ΠΌ, ΠΏΠΎΡ€ΠΎΠ΄ΠΈΠ² Π΄Π²Π° сиквСла ΠΈ мноТСство ΠΌΠ΅ΠΌΠΎΠ² ΠΈ Ρ†ΠΈΡ‚Π°Ρ‚, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄ΠΎ сих ΠΏΠΎΡ€ популярны.

Как Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с RAG

Роль documents прСдставляСт ΠΈΠ· сСбя список словарСй с описаниСм ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², с ΠΏΡ€ΠΈΠΌΠ½Π΅Π½ΠΈΠ΅ΠΌ json.dumps(array, ensure_ascii=False) (см. ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π½ΠΈΠΆΠ΅).
ΠšΠΎΠ½Ρ‚Π΅Π½Ρ‚ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ прСдставлСн Π² 3 Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°Ρ…: Markdown, HTML, Plain Text. ΠšΠΎΠ½Ρ‚Π΅Π½Ρ‚ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° - ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ‡Π°Π½ΠΊΠΎΠΌ тСкста Π΄Π»ΠΈΠ½ΠΎΠΉ Π΄ΠΎ 4ΠΊ символов.

[
  {
    "doc_id": (0..5),
    "title": "(null or str)",
    "content": "(html or markdown or plain text)"
  }
]

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ³ΠΎ использования с OpenAI-like API

Запуск vLLM сСрвСра: vllm serve --dtype half --max-model-len 32000 -tp 1 Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it --api-key token-abc123

GROUNDED_SYSTEM_PROMPT = "Your task is to answer the user's questions using only the information from the provided documents. Give two answers to each question: one with a list of relevant document identifiers and the second with the answer to the question itself, using documents with these identifiers."
documents = [
  {
    "doc_id": 0,
    "title": "Π“Π»ΠΎΠ±Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΡ‚Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅: Π»Π΅Π΄Π½ΠΈΠΊΠΈ",
    "content": "Π—Π° послСдниС 50 Π»Π΅Ρ‚ объСм Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² Π² ΠΌΠΈΡ€Π΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ»ΡΡ Π½Π° 30%"
  },
  {
    "doc_id": 1,
    "title": "Π“Π»ΠΎΠ±Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΡ‚Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅: Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ моря",
    "content": "Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ ΠΌΠΈΡ€ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠΊΠ΅Π°Π½Π° повысился Π½Π° 20 см с 1880 Π³ΠΎΠ΄Π° ΠΈ ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅Ρ‚ расти Π½Π° 3,3 ΠΌΠΌ Π² Π³ΠΎΠ΄"
  }
]
sample_history = [
    {'role': 'system', 'content': GROUNDED_SYSTEM_PROMPT}, 
    {'role': 'documents', 'content': json.dumps(documents, ensure_ascii=False)},
    {'role': 'user', 'content': 'Π“Π»ΠΎΠ°Π±Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΡ‚Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅'}
]
relevant_indexes = llm_client.chat.completions.create(
    model=llm_model,
    messages=sample_history,
    temperature=0.0,
    max_tokens=2048
).choices[0].message.content
print('Using documents: ' + relevant_indexes + '\n----')
final_answer = llm_client.chat.completions.create(
    model=llm_model,
    messages=sample_history + [{'role': 'assistant', 'content': relevant_indexes}],
    temperature=0.3,
    max_tokens=2048
).choices[0].message.content
print(final_answer)

ΠžΡ‚Π²Π΅Ρ‚ послС выполнСния ΠΊΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π³Π»ΡΠ΄Π΅Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ‚Π°ΠΊ:

Using documents: {"relevant_doc_ids": [0, 1]}

Π“Π»ΠΎΠ±Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΏΠΎΡ‚Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ – это долгосрочноС ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠ΅ срСднСй Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹ атмосфСры ΠΈ ΠΎΠΊΠ΅Π°Π½ΠΎΠ² Π—Π΅ΠΌΠ»ΠΈ. Π­Ρ‚ΠΎ явлСниС ΠΈΠΌΠ΅Π΅Ρ‚ мноТСство послСдствий для нашСй ΠΏΠ»Π°Π½Π΅Ρ‚Ρ‹, ΠΈ срСди Π½ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Π΄Π΅Π»ΠΈΡ‚ΡŒ Π΄Π²Π° ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… аспСкта, основанных Π½Π° доступных ΠΌΠ½Π΅ Π΄Π°Π½Π½Ρ‹Ρ…:

  1. УмСньшСниС объСма Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ²: Π—Π° послСдниС 50 Π»Π΅Ρ‚ Π½Π°Π±Π»ΡŽΠ΄Π°Π΅Ρ‚ΡΡ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ сокращСниС объСма Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΏΠΎ всСму ΠΌΠΈΡ€Ρƒ. Богласно Π΄Π°Π½Π½Ρ‹ΠΌ, объСм Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ»ΡΡ Π½Π° 30%. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ связано с таяниСм Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΈΠ·-Π·Π° ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€, Ρ‡Ρ‚ΠΎ являСтся ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² глобального потСплСния.

  2. ΠŸΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠ΅ уровня моря: Π£Ρ€ΠΎΠ²Π΅Π½ΡŒ ΠΌΠΈΡ€ΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠΊΠ΅Π°Π½Π° Ρ‚Π°ΠΊΠΆΠ΅ увСличиваСтся, Ρ‡Ρ‚ΠΎ связано с таяниСм Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΈ лСдяных ΠΏΠΎΠΊΡ€ΠΎΠ²ΠΎΠ², Π° Ρ‚Π°ΠΊΠΆΠ΅ с Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΠ΅ΠΌ Π²ΠΎΠ΄Ρ‹ ΠΏΡ€ΠΈ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΠΈ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹. Π‘ 1880 Π³ΠΎΠ΄Π° ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ моря повысился Π½Π° 20 сантимСтров, ΠΈ этот процСсс продолТаСтся, с Π΅ΠΆΠ΅Π³ΠΎΠ΄Π½Ρ‹ΠΌ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ Π½Π° 3,3 ΠΌΠΈΠ»Π»ΠΈΠΌΠ΅Ρ‚Ρ€Π°.

Π­Ρ‚ΠΈ измСнСния ΠΈΠΌΠ΅ΡŽΡ‚ ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Π΅ послСдствия для экосистСм, ΠΊΠ»ΠΈΠΌΠ°Ρ‚Π° ΠΈ чСловСчСского общСства. ВаяниС Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡŽ уровня моря, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ Π·Π°Ρ‚ΠΎΠΏΠ»Π΅Π½ΠΈΡŽ ΠΏΡ€ΠΈΠ±Ρ€Π΅ΠΆΠ½Ρ‹Ρ… Ρ‚Π΅Ρ€Ρ€ΠΈΡ‚ΠΎΡ€ΠΈΠΉ ΠΈ островов, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΊ измСнСнию Π²ΠΎΠ΄Π½Ρ‹Ρ… рСсурсов ΠΈ климатичСских ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ relevant_indexes (JSON), ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ нашла Π»ΠΈ модСль ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… ΠΈΠ»ΠΈ Π½Π΅Ρ‚, ΠΎΠ½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½Π° Π²ΠΎΠ·Π²Ρ€Π°ΡˆΠ°Ρ‚ΡŒ пустой массив Ссли Π΅Π΅ Π½Π΅Ρ‚ ΠΈ Π² Ρ‚Π°ΠΊΠΎΠΌ случаС ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΡ‚Π²Π΅Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π½Π΅ смогла Π½Π°ΠΉΡ‚ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ Π² Π±Π°Π·Π΅ Π·Π½Π°Π½ΠΈΠΉ (ΠΏΡ€ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Π²Ρ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΎΡ‚Π²Π΅Ρ‚Π°).

ΠΡŽΠ°Π½ΡΡ‹ ΠΈ ограничСния

  • МодСль ΠΈΠΌΠ΅Π΅Ρ‚ Π½ΠΈΠ·ΠΊΠΈΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ бСзопасности ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² ΠΈ Π½Π°Ρ†Π΅Π»Π΅Π½Π° Π½Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ΅ ΠΈ ΠΏΠΎΠ»Π½ΠΎΠ΅ Π²Ρ‹ΠΏΠΎΠ»Π΅Π½Π½ΠΈΠ΅ инструкций, ΠΈΠΌΠ΅ΠΉΡ‚Π΅ это Π²Π²ΠΈΠ΄Ρƒ ΠΏΡ€ΠΈ использовании ΠΈ тСстируйтС ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ. Частично это исправляСтся систСмными ΠΏΡ€ΠΎΠΌΠΏΡ‚Π°ΠΌΠΈ ΠΈ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ указаниями ΠΎ ваТности бСзопасности Π² ΠΏΡ€ΠΎΠΌΠΏΡ‚Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ.
  • БистСмныС ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹ Π½Π΅ ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Ρ‹ для описаниС пСрсонаТСй, ΠΌΡ‹ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… для спСцификации стиля ΠΎΡ‚Π²Π΅Ρ‚Π° (Π²Ρ€ΠΎΠ΄Π΅ "answer only in json format"). ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΏΠΈΡΠ°Ρ‚ΡŒ ΠΈΡ… Π½Π° английском языкС, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Ρ‚Π°ΠΊ Π±Ρ‹Π»ΠΎ Π² датасСтС, ΠΎΡ‚ использования английского Π² систСмных ΠΏΡ€ΠΎΠΌΡ‚ΠΏΠ°Ρ… Π½Π΅ зависит язык ΠΎΡ‚Π²Π΅Ρ‚Π°.
  • RAG Ρ€Π΅ΠΆΠΈΠΌ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ наличия систСмного ΠΏΡ€ΠΎΠΌΠΏΡ‚Π° GROUNDED_SYSTEM_PROMPT описаного Π² сСкции Как Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с RAG. Π’Π°ΠΊ ΠΆΠ΅ ΠΈΠ½ΠΎΠ³Π΄Π° модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π΄ΠΎΠ±Π°Π²Π»ΡΡ‚ΡŒ ΠΎΠ±Ρ‰ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈΠ· своих Π·Π½Π°Π½ΠΈΠΉ Π² ΠΎΡ‚Π²Π΅Ρ‚ ΠΊ Ρ‚ΠΎΠΉ, Ρ‡Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ….
  • МодСль Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ с Π½ΠΈΠ·ΠΊΠΎΠΉ Ρ‚Π΅ΠΌΠΏΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€ΠΎΠΉ (0.1-0.5), Π° Ρ‚Π°ΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ top_k (30-50), ΠΏΡ€ΠΈ Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ 1.0 Π±Ρ‹Π»ΠΈ Π·Π°ΠΌΠ΅Ρ‡Π΅Π½Ρ‹ случайныС Π΄Π΅Ρ„Π΅ΠΊΡ‚Ρ‹ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ.

Авторы

@inproceedings{nikolich2024vikhr,
  title={Vikhr: Advancing Open-Source Bilingual Instruction-Following Large Language Models for Russian and English},
  author={Aleksandr Nikolich and Konstantin Korolev and Sergei Bratchikov and Nikolay Kompanets and Igor Kiselev and Artem Shelmanov},
  booktitle={Proceedings of the 4th Workshop on Multilingual Representation Learning (MRL) @ EMNLP-2024},
  year={2024},
  publisher={Association for Computational Linguistics},
  url={https://arxiv.org/pdf/2405.13929}
}
Downloads last month
41
Safetensors
Model size
8B params
Tensor type
BF16
Β·
Inference Providers NEW
Input a message to start chatting with Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it.

Model tree for Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it

Finetuned
(16)
this model
Finetunes
1 model
Quantizations
8 models

Datasets used to train Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it

Spaces using Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it 3

Paper for Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it