Instructions to use Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoTokenizer, AutoModelForMultimodalLM tokenizer = AutoTokenizer.from_pretrained("Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it") model = AutoModelForMultimodalLM.from_pretrained("Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it") messages = [ {"role": "user", "content": "Who are you?"}, ] inputs = tokenizer.apply_chat_template( messages, add_generation_prompt=True, tokenize=True, return_dict=True, return_tensors="pt", ).to(model.device) outputs = model.generate(**inputs, max_new_tokens=40) print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:])) - Inference
- Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- vLLM
How to use Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it
- SGLang
How to use Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it with Docker Model Runner:
docker model run hf.co/Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it
Vikhr-YandexGPT-5-Lite-8B-it
ΠΠ½ΡΡΡΡΠΊΡΠΈΠ²Π½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ YandexGPT-5-Lite-8B-pretrain, ΠΎΠ±ΡΡΠ΅Π½Π½Π°Ρ Π½Π° ΡΡΡΡΠΊΠΎΡΠ·ΡΡΠ½ΠΎΠΌ Π΄Π°ΡΠ°ΡΠ΅ΡΠ΅ GrandMaster-PRO-MAX ΠΈ Grounded-RAG-RU-v2 Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ SFT.
Quatized variants:
ΠΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ:
- π ΠΡΠ½ΠΎΠ²Π°: YandexGPT-5-Lite-8B-pretrain
- πΎ ΠΠ°ΡΠ°ΡΠ΅Ρ / Dataset: GrandMaster-PRO-MAX, Grounded-RAG-RU-v2
- π·πΊ Π‘ΠΏΠ΅ΡΠΈΠ°Π»ΠΈΠ·Π°ΡΠΈΡ: RU
- π ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ°: Bilingual RU/EN
ΠΠΎΠΏΡΠΎΠ±ΠΎΠ²Π°ΡΡ / Try now:
ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅:
Vikhr-YandexGPT-5-Lite-8B-it Π±ΡΠ»Π° ΡΠΎΠ·Π΄Π°Π½Π° Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄Π° SFT (Supervised Fine-Tuning).
ΠΠ½ΡΡΡΡΠΊΡΠΈΠ²Π½Π°Ρ SFT ΡΠ°ΡΡΡ
ΠΠ»Ρ SFT ΡΡΠ°ΠΏΠ° ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΡ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΈΠ»ΠΈ Π±ΠΎΠ»ΡΡΠΎΠΉ (150ΠΊ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ) ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠ²Π½ΡΠΉ ΡΠΈΠ½ΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π΄Π°ΡΠ°ΡΠ΅Ρ Vikhrmodels/GrandMaster-PRO-MAX. ΠΠ³ΠΎ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡΡ ΡΠ²Π»ΡΠ΅ΡΡΡ Π²ΡΡΡΠΎΠ΅Π½ΡΠΉ CoT (Chain-Of-Thought), Π΄Π»Ρ ΡΠ±ΠΎΡΠ° ΠΊΠΎΡΠΎΡΠΎΠ³ΠΎ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π»ΠΈ ΠΌΠΎΠ΄ΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΠΏΡΠΎΠΌΠ΅Ρ Π΄Π»Ρ gpt-4-turbo, ΠΏΠΎΠ΄ΡΠΎΠ±Π½ΠΎΡΡΠΈ Π² ΠΊΠ°ΡΡΠΎΡΠΊΠ΅ Π΄Π°ΡΠ°ΡΠ΅ΡΠ°.
ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, Π΄Π»Ρ ΡΠΎΠ³ΠΎ ΡΡΠΎΠ±Ρ ΡΠ΄Π΅Π»Π°ΡΡ RAG Grounding, ΠΌΡ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΈΠ»ΠΈ Π΄ΡΡΠ³ΠΎΠΉ ΡΠΈΠ½ΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π΄Π°ΡΠ°ΡΠ΅Ρ - Vikhrmodels/Grounded-RAG-RU-v2 (50k Π΄ΠΈΠ°Π»ΠΎΠ³ΠΎΠ²), Π΅Π³ΠΎ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ ΡΠ±ΠΎΡΠΊΠΈ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠ»ΠΎΠΆΠ½ΡΠΉ Π΄Π»Ρ ΠΊΠΎΡΠΎΡΠΊΠΎΠ³ΠΎ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΠΈ ΠΏΠΎΠ»ΡΠΎΠ±Π½Π΅Π΅ ΠΎΠ± ΡΡΠΎΠΌ Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΏΡΠΎΡΠΈΡΠ°ΡΡ Π² Π΅Π³ΠΎ ΠΊΠ°ΡΡΠΎΡΠΊΠ΅.
ΠΡΠΈΠΌΠ΅Ρ ΠΊΠΎΠ΄Π° Π΄Π»Ρ Π·Π°ΠΏΡΡΠΊΠ°:
from transformers import AutoModelForCausalLM, AutoTokenizer
# Load the model and tokenizer
model_name = "Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# Prepare the input text
input_text = "ΠΠ°ΠΏΠΈΡΠΈ ΠΊΡΠ°ΡΠΊΠΎΠ΅ ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ ΡΠΈΠ»ΡΠΌΠ° ΠΠ°Π·Π°Π΄ Π² Π±ΡΠ΄ΡΡΠ΅Π΅."
messages = [
{"role": "user", "content": input_text},
]
# Tokenize and generate text
input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
output = model.generate(
input_ids,
max_length=1512,
temperature=0.7,
)
# Decode and print result
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
ΠΡΠ²Π΅Ρ ΠΌΠΎΠ΄Π΅Π»ΠΈ:
"ΠΠ°Π·Π°Π΄ Π² Π±ΡΠ΄ΡΡΠ΅Π΅" (Π°Π½Π³Π». "Back to the Future") β ΡΡΠΎ Π°ΠΌΠ΅ΡΠΈΠΊΠ°Π½ΡΠΊΠΈΠΉ Π½Π°ΡΡΠ½ΠΎ-ΡΠ°Π½ΡΠ°ΡΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΠΈΠ»ΡΠΌ, Π²ΡΠΏΡΡΠ΅Π½Π½ΡΠΉ Π² 1985 Π³ΠΎΠ΄Ρ. Π Π΅ΠΆΠΈΡΡΡΡΠΎΠΌ ΠΊΠ°ΡΡΠΈΠ½Ρ Π²ΡΡΡΡΠΏΠΈΠ» Π ΠΎΠ±Π΅ΡΡ ΠΠ΅ΠΌΠ΅ΠΊΠΈΡ, Π° ΡΡΠ΅Π½Π°ΡΠΈΠΉ Π½Π°ΠΏΠΈΡΠ°Π» ΠΠΎΠ± ΠΠ΅ΠΉΠ». ΠΠ»Π°Π²Π½ΡΠ΅ ΡΠΎΠ»ΠΈ ΠΈΡΠΏΠΎΠ»Π½ΠΈΠ»ΠΈ ΠΠ°ΠΉΠΊΠ» ΠΠΆ. Π€ΠΎΠΊΡ, ΠΡΠΈΡΡΠΎΡΠ΅Ρ ΠΠ»ΠΎΠΉΠ΄ ΠΈ ΠΠΈΠ° Π’ΠΎΠΌΠΏΡΠΎΠ½.
Π€ΠΈΠ»ΡΠΌ ΡΠ°ΡΡΠΊΠ°Π·ΡΠ²Π°Π΅Ρ ΠΈΡΡΠΎΡΠΈΡ ΠΠ°ΡΡΠΈ ΠΠ°ΠΊΠ€Π»Π°Ρ, ΠΎΠ±ΡΡΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄ΡΠΎΡΡΠΊΠ° ΠΈΠ· 1985 Π³ΠΎΠ΄Π°, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠ»ΡΡΠ°ΠΉΠ½ΠΎ ΠΏΠΎΠΏΠ°Π΄Π°Π΅Ρ Π² 1955 Π³ΠΎΠ΄ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ ΠΈΠ·ΠΎΠ±ΡΠ΅ΡΠ΅Π½ΠΈΡ ΡΠ²ΠΎΠ΅Π³ΠΎ Π΄ΡΡΠ³Π°-ΡΡΠ΅Π½ΠΎΠ³ΠΎ, Π΄ΠΎΠΊΡΠΎΡΠ° ΠΠΌΠΌΠ΅ΡΡΠ° ΠΡΠ°ΡΠ½Π°. ΠΠ°ΡΡΠΈ ΠΎΠΊΠ°Π·ΡΠ²Π°Π΅ΡΡΡ Π² ΠΏΡΠΎΡΠ»ΠΎΠΌ, Π³Π΄Π΅ ΠΎΠ½ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΌΠΎΡΡ Π΄ΠΎΠΊΡΠΎΡΡ ΠΡΠ°ΡΠ½Ρ, ΠΊΠΎΡΠΎΡΡΠΉ Π² ΡΠΎ Π²ΡΠ΅ΠΌΡ Π±ΡΠ» ΠΌΠΎΠ»ΠΎΠ΄ΡΠΌ ΠΈ Π½Π°ΠΈΠ²Π½ΡΠΌ, ΠΈΠ·ΠΎΠ±ΡΠ΅ΡΡΠΈ ΠΌΠ°ΡΠΈΠ½Ρ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ.
Π ΠΏΡΠΎΡΠ΅ΡΡΠ΅ ΡΠ²ΠΎΠΈΡ ΠΏΡΠΈΠΊΠ»ΡΡΠ΅Π½ΠΈΠΉ ΠΠ°ΡΡΠΈ Π²ΡΡΡΠ΅ΡΠ°Π΅Ρ ΠΌΠΎΠ»ΠΎΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΎΡΠ° ΠΡΠ°ΡΠ½Π° ΠΈ Π΅Π³ΠΎ ΡΠ΅ΠΌΡΡ, Π° ΡΠ°ΠΊΠΆΠ΅ Π²Π»ΡΠ±Π»ΡΠ΅ΡΡΡ Π² Π΄Π΅Π²ΡΡΠΊΡ, ΠΊΠΎΡΠΎΡΠ°Ρ Π² Π±ΡΠ΄ΡΡΠ΅ΠΌ ΡΡΠ°Π½Π΅Ρ Π΅Π³ΠΎ ΠΌΠ°ΡΠ΅ΡΡΡ. ΠΠ°ΡΡΠΈ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ ΠΈΡΠΏΡΠ°Π²ΠΈΡΡ ΠΎΡΠΈΠ±ΠΊΠΈ ΠΏΡΠΎΡΠ»ΠΎΠ³ΠΎ, Π½ΠΎ ΠΈ ΠΏΡΠ΅Π΄ΠΎΡΠ²ΡΠ°ΡΠΈΡΡ ΠΊΠ°ΡΠ°ΡΡΡΠΎΡΡ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΌΠΎΠΆΠ΅Ρ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ Π±ΡΠ΄ΡΡΠ΅Π΅.
Π€ΠΈΠ»ΡΠΌ ΠΏΠΎΠ»ΡΡΠΈΠ» ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ Π½Π°Π³ΡΠ°Π΄ ΠΈ ΡΡΠ°Π» ΠΊΡΠ»ΡΡΠΎΠ²ΡΠΌ, ΠΏΠΎΡΠΎΠ΄ΠΈΠ² Π΄Π²Π° ΡΠΈΠΊΠ²Π΅Π»Π° ΠΈ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΠΌΠ΅ΠΌΠΎΠ² ΠΈ ΡΠΈΡΠ°Ρ, ΠΊΠΎΡΠΎΡΡΠ΅ Π΄ΠΎ ΡΠΈΡ ΠΏΠΎΡ ΠΏΠΎΠΏΡΠ»ΡΡΠ½Ρ.
ΠΠ°ΠΊ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ RAG
Π ΠΎΠ»Ρ documents ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΠΈΠ· ΡΠ΅Π±Ρ ΡΠΏΠΈΡΠΎΠΊ ΡΠ»ΠΎΠ²Π°ΡΠ΅ΠΉ Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ΠΌ ΠΊΠΎΠ½ΡΠ΅Π½ΡΠ° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², Ρ ΠΏΡΠΈΠΌΠ½Π΅Π½ΠΈΠ΅ΠΌ json.dumps(array, ensure_ascii=False) (ΡΠΌ. ΠΏΡΠΈΠΌΠ΅Ρ Π½ΠΈΠΆΠ΅).
ΠΠΎΠ½ΡΠ΅Π½Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ Π² 3 ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
ΡΠΎΡΠΌΠ°ΡΠ°Ρ
: Markdown, HTML, Plain Text. ΠΠΎΠ½ΡΠ΅Π½Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° - ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΡΠ°Π½ΠΊΠΎΠΌ ΡΠ΅ΠΊΡΡΠ° Π΄Π»ΠΈΠ½ΠΎΠΉ Π΄ΠΎ 4ΠΊ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ².
[
{
"doc_id": (0..5),
"title": "(null or str)",
"content": "(html or markdown or plain text)"
}
]
ΠΡΠΈΠΌΠ΅Ρ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Ρ OpenAI-like API
ΠΠ°ΠΏΡΡΠΊ vLLM ΡΠ΅ΡΠ²Π΅ΡΠ°: vllm serve --dtype half --max-model-len 32000 -tp 1 Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it --api-key token-abc123
GROUNDED_SYSTEM_PROMPT = "Your task is to answer the user's questions using only the information from the provided documents. Give two answers to each question: one with a list of relevant document identifiers and the second with the answer to the question itself, using documents with these identifiers."
documents = [
{
"doc_id": 0,
"title": "ΠΠ»ΠΎΠ±Π°Π»ΡΠ½ΠΎΠ΅ ΠΏΠΎΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅: Π»Π΅Π΄Π½ΠΈΠΊΠΈ",
"content": "ΠΠ° ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ 50 Π»Π΅Ρ ΠΎΠ±ΡΠ΅ΠΌ Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² Π² ΠΌΠΈΡΠ΅ ΡΠΌΠ΅Π½ΡΡΠΈΠ»ΡΡ Π½Π° 30%"
},
{
"doc_id": 1,
"title": "ΠΠ»ΠΎΠ±Π°Π»ΡΠ½ΠΎΠ΅ ΠΏΠΎΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅: Π£ΡΠΎΠ²Π΅Π½Ρ ΠΌΠΎΡΡ",
"content": "Π£ΡΠΎΠ²Π΅Π½Ρ ΠΌΠΈΡΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠΊΠ΅Π°Π½Π° ΠΏΠΎΠ²ΡΡΠΈΠ»ΡΡ Π½Π° 20 ΡΠΌ Ρ 1880 Π³ΠΎΠ΄Π° ΠΈ ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅Ρ ΡΠ°ΡΡΠΈ Π½Π° 3,3 ΠΌΠΌ Π² Π³ΠΎΠ΄"
}
]
sample_history = [
{'role': 'system', 'content': GROUNDED_SYSTEM_PROMPT},
{'role': 'documents', 'content': json.dumps(documents, ensure_ascii=False)},
{'role': 'user', 'content': 'ΠΠ»ΠΎΠ°Π±Π»ΡΠ½ΠΎΠ΅ ΠΏΠΎΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅'}
]
relevant_indexes = llm_client.chat.completions.create(
model=llm_model,
messages=sample_history,
temperature=0.0,
max_tokens=2048
).choices[0].message.content
print('Using documents: ' + relevant_indexes + '\n----')
final_answer = llm_client.chat.completions.create(
model=llm_model,
messages=sample_history + [{'role': 'assistant', 'content': relevant_indexes}],
temperature=0.3,
max_tokens=2048
).choices[0].message.content
print(final_answer)
ΠΡΠ²Π΅Ρ ΠΏΠΎΡΠ»Π΅ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ ΠΊΠΎΠ΄Π° Π±ΡΠ΄Π΅Ρ Π²ΡΠ³Π»ΡΠ΄Π΅ΡΡ ΠΏΡΠΈΠΌΠ΅ΡΠ½ΠΎ ΡΠ°ΠΊ:
Using documents: {"relevant_doc_ids": [0, 1]}
ΠΠ»ΠΎΠ±Π°Π»ΡΠ½ΠΎΠ΅ ΠΏΠΎΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅ β ΡΡΠΎ Π΄ΠΎΠ»Π³ΠΎΡΡΠΎΡΠ½ΠΎΠ΅ ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠ΅Π΄Π½Π΅ΠΉ ΡΠ΅ΠΌΠΏΠ΅ΡΠ°ΡΡΡΡ Π°ΡΠΌΠΎΡΡΠ΅ΡΡ ΠΈ ΠΎΠΊΠ΅Π°Π½ΠΎΠ² ΠΠ΅ΠΌΠ»ΠΈ. ΠΡΠΎ ΡΠ²Π»Π΅Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π΅Ρ ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΠ²ΠΈΠΉ Π΄Π»Ρ Π½Π°ΡΠ΅ΠΉ ΠΏΠ»Π°Π½Π΅ΡΡ, ΠΈ ΡΡΠ΅Π΄ΠΈ Π½ΠΈΡ ΠΌΠΎΠΆΠ½ΠΎ Π²ΡΠ΄Π΅Π»ΠΈΡΡ Π΄Π²Π° ΠΊΠ»ΡΡΠ΅Π²ΡΡ Π°ΡΠΏΠ΅ΠΊΡΠ°, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΡ Π½Π° Π΄ΠΎΡΡΡΠΏΠ½ΡΡ ΠΌΠ½Π΅ Π΄Π°Π½Π½ΡΡ :
Π£ΠΌΠ΅Π½ΡΡΠ΅Π½ΠΈΠ΅ ΠΎΠ±ΡΠ΅ΠΌΠ° Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ²: ΠΠ° ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ 50 Π»Π΅Ρ Π½Π°Π±Π»ΡΠ΄Π°Π΅ΡΡΡ Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΠ΅ ΠΎΠ±ΡΠ΅ΠΌΠ° Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΏΠΎ Π²ΡΠ΅ΠΌΡ ΠΌΠΈΡΡ. Π‘ΠΎΠ³Π»Π°ΡΠ½ΠΎ Π΄Π°Π½Π½ΡΠΌ, ΠΎΠ±ΡΠ΅ΠΌ Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΡΠΌΠ΅Π½ΡΡΠΈΠ»ΡΡ Π½Π° 30%. ΠΡΠΎ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΡΠ²ΡΠ·Π°Π½ΠΎ Ρ ΡΠ°ΡΠ½ΠΈΠ΅ΠΌ Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΈΠ·-Π·Π° ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΡ ΡΠ΅ΠΌΠΏΠ΅ΡΠ°ΡΡΡ, ΡΡΠΎ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² Π³Π»ΠΎΠ±Π°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΏΠΎΡΠ΅ΠΏΠ»Π΅Π½ΠΈΡ.
ΠΠΎΠ²ΡΡΠ΅Π½ΠΈΠ΅ ΡΡΠΎΠ²Π½Ρ ΠΌΠΎΡΡ: Π£ΡΠΎΠ²Π΅Π½Ρ ΠΌΠΈΡΠΎΠ²ΠΎΠ³ΠΎ ΠΎΠΊΠ΅Π°Π½Π° ΡΠ°ΠΊΠΆΠ΅ ΡΠ²Π΅Π»ΠΈΡΠΈΠ²Π°Π΅ΡΡΡ, ΡΡΠΎ ΡΠ²ΡΠ·Π°Π½ΠΎ Ρ ΡΠ°ΡΠ½ΠΈΠ΅ΠΌ Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΈ Π»Π΅Π΄ΡΠ½ΡΡ ΠΏΠΎΠΊΡΠΎΠ²ΠΎΠ², Π° ΡΠ°ΠΊΠΆΠ΅ Ρ ΡΠ°ΡΡΠΈΡΠ΅Π½ΠΈΠ΅ΠΌ Π²ΠΎΠ΄Ρ ΠΏΡΠΈ ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΠΈ ΡΠ΅ΠΌΠΏΠ΅ΡΠ°ΡΡΡΡ. Π‘ 1880 Π³ΠΎΠ΄Π° ΡΡΠΎΠ²Π΅Π½Ρ ΠΌΠΎΡΡ ΠΏΠΎΠ²ΡΡΠΈΠ»ΡΡ Π½Π° 20 ΡΠ°Π½ΡΠΈΠΌΠ΅ΡΡΠΎΠ², ΠΈ ΡΡΠΎΡ ΠΏΡΠΎΡΠ΅ΡΡ ΠΏΡΠΎΠ΄ΠΎΠ»ΠΆΠ°Π΅ΡΡΡ, Ρ Π΅ΠΆΠ΅Π³ΠΎΠ΄Π½ΡΠΌ ΡΠ²Π΅Π»ΠΈΡΠ΅Π½ΠΈΠ΅ΠΌ Π½Π° 3,3 ΠΌΠΈΠ»Π»ΠΈΠΌΠ΅ΡΡΠ°.
ΠΡΠΈ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΡ ΠΈΠΌΠ΅ΡΡ ΡΠ΅ΡΡΠ΅Π·Π½ΡΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΠ²ΠΈΡ Π΄Π»Ρ ΡΠΊΠΎΡΠΈΡΡΠ΅ΠΌ, ΠΊΠ»ΠΈΠΌΠ°ΡΠ° ΠΈ ΡΠ΅Π»ΠΎΠ²Π΅ΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΠ΅ΡΡΠ²Π°. Π’Π°ΡΠ½ΠΈΠ΅ Π»Π΅Π΄Π½ΠΈΠΊΠΎΠ² ΠΏΡΠΈΠ²ΠΎΠ΄ΠΈΡ ΠΊ ΠΏΠΎΠ²ΡΡΠ΅Π½ΠΈΡ ΡΡΠΎΠ²Π½Ρ ΠΌΠΎΡΡ, ΡΡΠΎ ΠΌΠΎΠΆΠ΅Ρ ΠΏΡΠΈΠ²Π΅ΡΡΠΈ ΠΊ Π·Π°ΡΠΎΠΏΠ»Π΅Π½ΠΈΡ ΠΏΡΠΈΠ±ΡΠ΅ΠΆΠ½ΡΡ ΡΠ΅ΡΡΠΈΡΠΎΡΠΈΠΉ ΠΈ ΠΎΡΡΡΠΎΠ²ΠΎΠ², Π° ΡΠ°ΠΊΠΆΠ΅ ΠΊ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΡ Π²ΠΎΠ΄Π½ΡΡ ΡΠ΅ΡΡΡΡΠΎΠ² ΠΈ ΠΊΠ»ΠΈΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΡ ΠΏΠ°ΡΡΠ΅ΡΠ½ΠΎΠ².
ΠΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΎΡΠ²Π΅Ρ ΠΌΠΎΠ΄Π΅Π»ΠΈ relevant_indexes (JSON), ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡΡ Π½Π°ΡΠ»Π° Π»ΠΈ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°Ρ
ΠΈΠ»ΠΈ Π½Π΅Ρ, ΠΎΠ½Π° ΠΎΠ±ΡΡΠ΅Π½Π° Π²ΠΎΠ·Π²ΡΠ°ΡΠ°ΡΡ ΠΏΡΡΡΠΎΠΉ ΠΌΠ°ΡΡΠΈΠ² Π΅ΡΠ»ΠΈ Π΅Π΅ Π½Π΅Ρ ΠΈ Π² ΡΠ°ΠΊΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΠΎΠ½Π° Π±ΡΠ΄Π΅Ρ ΠΎΡΠ²Π΅ΡΠ°ΡΡ, ΡΡΠΎ Π½Π΅ ΡΠΌΠΎΠ³Π»Π° Π½Π°ΠΉΡΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ Π² Π±Π°Π·Π΅ Π·Π½Π°Π½ΠΈΠΉ (ΠΏΡΠΈ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ Π²ΡΠΎΡΠΎΠ³ΠΎ ΠΎΡΠ²Π΅ΡΠ°).
ΠΡΠ°Π½ΡΡ ΠΈ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡ
- ΠΠΎΠ΄Π΅Π»Ρ ΠΈΠΌΠ΅Π΅Ρ Π½ΠΈΠ·ΠΊΠΈΠΉ ΡΡΠΎΠ²Π΅Π½Ρ Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡΠΈ ΠΎΡΠ²Π΅ΡΠΎΠ² ΠΈ Π½Π°ΡΠ΅Π»Π΅Π½Π° Π½Π° ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎΠ΅ ΠΈ ΠΏΠΎΠ»Π½ΠΎΠ΅ Π²ΡΠΏΠΎΠ»Π΅Π½Π½ΠΈΠ΅ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ, ΠΈΠΌΠ΅ΠΉΡΠ΅ ΡΡΠΎ Π²Π²ΠΈΠ΄Ρ ΠΏΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ ΠΈ ΡΠ΅ΡΡΠΈΡΡΠΉΡΠ΅ ΡΠ°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎ. Π§Π°ΡΡΠΈΡΠ½ΠΎ ΡΡΠΎ ΠΈΡΠΏΡΠ°Π²Π»ΡΠ΅ΡΡΡ ΡΠΈΡΡΠ΅ΠΌΠ½ΡΠΌΠΈ ΠΏΡΠΎΠΌΠΏΡΠ°ΠΌΠΈ ΠΈ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠΌΠΈ ΡΠΊΠ°Π·Π°Π½ΠΈΡΠΌΠΈ ΠΎ Π²Π°ΠΆΠ½ΠΎΡΡΠΈ Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡΠΈ Π² ΠΏΡΠΎΠΌΠΏΡΠ΅ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ.
- Π‘ΠΈΡΡΠ΅ΠΌΠ½ΡΠ΅ ΠΏΡΠΎΠΌΠΏΡΡ Π½Π΅ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½Ρ Π΄Π»Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠ΅ΠΉ, ΠΌΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΈΡ Π΄Π»Ρ ΡΠΏΠ΅ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΡΡΠΈΠ»Ρ ΠΎΡΠ²Π΅ΡΠ° (Π²ΡΠΎΠ΄Π΅ "answer only in json format"). ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, ΠΆΠ΅Π»Π°ΡΠ΅Π»ΡΠ½ΠΎ, ΠΏΠΈΡΠ°ΡΡ ΠΈΡ Π½Π° Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠΌ ΡΠ·ΡΠΊΠ΅, ΡΠ°ΠΊ ΠΊΠ°ΠΊ ΡΠ°ΠΊ Π±ΡΠ»ΠΎ Π² Π΄Π°ΡΠ°ΡΠ΅ΡΠ΅, ΠΎΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠ³ΠΎ Π² ΡΠΈΡΡΠ΅ΠΌΠ½ΡΡ ΠΏΡΠΎΠΌΡΠΏΠ°Ρ Π½Π΅ Π·Π°Π²ΠΈΡΠΈΡ ΡΠ·ΡΠΊ ΠΎΡΠ²Π΅ΡΠ°.
- RAG ΡΠ΅ΠΆΠΈΠΌ ΡΡΠ΅Π±ΡΠ΅Ρ ΠΎΠ±ΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ Π½Π°Π»ΠΈΡΠΈΡ ΡΠΈΡΡΠ΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡΠΎΠΌΠΏΡΠ°
GROUNDED_SYSTEM_PROMPTΠΎΠΏΠΈΡΠ°Π½ΠΎΠ³ΠΎ Π² ΡΠ΅ΠΊΡΠΈΠΈ ΠΠ°ΠΊ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ RAG. Π’Π°ΠΊ ΠΆΠ΅ ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΠΎΠ΄Π΅Π»Ρ ΠΌΠΎΠΆΠ΅Ρ Π΄ΠΎΠ±Π°Π²Π»ΡΡΡ ΠΎΠ±ΡΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΈΠ· ΡΠ²ΠΎΠΈΡ Π·Π½Π°Π½ΠΈΠΉ Π² ΠΎΡΠ²Π΅Ρ ΠΊ ΡΠΎΠΉ, ΡΡΠΎ Π΅ΡΡΡ Π² Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°Ρ . - ΠΠΎΠ΄Π΅Π»Ρ Π»ΡΡΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Ρ Π½ΠΈΠ·ΠΊΠΎΠΉ ΡΠ΅ΠΌΠΏΡΠ΅ΡΠ°ΡΡΡΠΎΠΉ (0.1-0.5), Π° ΡΠ°ΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ top_k (30-50), ΠΏΡΠΈ ΡΠ΅ΠΌΠΏΠ΅ΡΠ°ΡΡΡΠ΅ 1.0 Π±ΡΠ»ΠΈ Π·Π°ΠΌΠ΅ΡΠ΅Π½Ρ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΠ΅ Π΄Π΅ΡΠ΅ΠΊΡΡ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ.
ΠΠ²ΡΠΎΡΡ
- Sergei Bratchikov, NLP Wanderer, Vikhr Team
- Nikolay Kompanets, LakoMoor, Vikhr Team
- Konstantin Korolev, Vikhr Team
- Aleksandr Nikolich, Vikhr Team
@inproceedings{nikolich2024vikhr,
title={Vikhr: Advancing Open-Source Bilingual Instruction-Following Large Language Models for Russian and English},
author={Aleksandr Nikolich and Konstantin Korolev and Sergei Bratchikov and Nikolay Kompanets and Igor Kiselev and Artem Shelmanov},
booktitle={Proceedings of the 4th Workshop on Multilingual Representation Learning (MRL) @ EMNLP-2024},
year={2024},
publisher={Association for Computational Linguistics},
url={https://arxiv.org/pdf/2405.13929}
}
- Downloads last month
- 41
Model tree for Vikhrmodels/Vikhr-YandexGPT-5-Lite-8B-it
Base model
yandex/YandexGPT-5-Lite-8B-pretrain