Spaces:

akra35567
/

OLLAMA

Build error

App Files Files Community

OLLAMA / app.py

akra35567

Update app.py

6df2c32 verified 6 months ago

raw

history blame

3.66 kB

	# app.py — V23 — QWEN2.5:0.5B + PROMPT DINÂMICO (SINTAXE CORRIGIDA)
	import subprocess
	import time
	import requests
	import json
	import datetime
	from flask import Flask, request, jsonify
	from loguru import logger
	from database import Database

	app = Flask(__name__)
	OLLAMA_URL = "http://localhost:11434"
	db = Database()

	# MODELO LEVE, PORTUGUÊS, FINE-TUNEÁVEL
	MODEL_NAME = "qwen2.5:0.5b-instruct-q4_0"

	def check_ollama():
	try:
	return requests.get(f"{OLLAMA_URL}/api/tags", timeout=10).status_code == 200
	except:
	return False

	def start_ollama():
	subprocess.Popen(["ollama", "serve"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

	@app.route("/api/generate", methods=['POST'])
	def generate():
	if not check_ollama():
	return jsonify({'resposta': 'Epá, tô acordando... espera 10s!'}), 503

	data = request.get_json() or {}
	mensagem = data.get('mensagem', '').strip()
	usuario = data.get('usuario', 'anonimo')
	numero = data.get('numero', 'anonimo')

	if not mensagem:
	return jsonify({'error': 'mensagem obrigatória'}), 400

	# === PUXA DO BANCO ===
	ctx = db.carregar_contexto(numero)
	tom = db.detectar_tom(numero, mensagem)

	# Gírias do usuário
	girias = db.recuperar_girias_usuario(numero)
	if not girias:
	girias = ["epá", "kandando", "bué", "kota"]

	# Abreviações do usuário
	abrevs = db.recuperar_abreviacoes_usuario(numero)
	if not abrevs:
	abrevs = {"p'ra": "para", "pq": "porque", "tfx": "tudo fixe"}

	# Aprende novas
	for abrev, completa in abrevs.items():
	if abrev in mensagem.lower():
	db.aprender_abreviacao(numero, abrev, completa)
	for g in girias:
	if g in mensagem.lower():
	db.aprender_giria(numero, g)

	# === PROMPT DINÂMICO (CORRIGIDO) ===
	now = datetime.datetime.now().strftime('%d/%m %H:%M')
	hist_text = '\n'.join([f"Usuário: {h[0]}\nAkira: {h[1]}" for h in ctx["historico"]])

	# CORREÇÃO: Separar o f-string do \n
	historico_block = ""
	if hist_text:
	historico_block = f"### Histórico ###\n{hist_text}\n\n"

	prompt = f"""Você é Akira, angolana debochada.
	Fala com gírias: {', '.join(girias)}
	Abreviações: {', '.join(abrevs.keys())}
	Tom: {tom}
	Data/hora: {now}
	### Usuário: {usuario} ({numero}) ###
	{historico_block}### Mensagem ###
	{mensagem}
	Akira:"""

	# === GERA COM QWEN2.5:0.5B ===
	payload = {
	"model": MODEL_NAME,
	"prompt": prompt,
	"stream": False,
	"options": {
	"temperature": 0.9,
	"num_predict": 256,
	"top_k": 40,
	"top_p": 0.9
	}
	}

	try:
	resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=90)
	resposta = resp.json().get("response", "").strip() or "Epá, kandando bué!"

	# SALVA NO BANCO
	db.salvar_mensagem(usuario, mensagem, resposta, numero)
	novo_hist = ctx["historico"] + [[mensagem, resposta]]
	db.salvar_contexto(numero, novo_hist, girias, tom)

	return jsonify({'resposta': resposta})

	except Exception as e:
	logger.error(f"Erro Ollama: {e}")
	return jsonify({'resposta': 'Epá, tô off... tenta de novo!'}), 500

	if __name__ == "__main__":
	logger.info(f"AKIRA V23 — RODANDO COM {MODEL_NAME}")
	start_ollama()
	for i in range(60):
	if check_ollama():
	logger.info("Ollama pronto!")
	break
	logger.info("Aguardando Ollama...")
	time.sleep(2)
	else:
	logger.error("Ollama não respondeu após 2min!")
	app.run(host="0.0.0.0", port=7860)