FernandoValencia
/

XLM-RoBERTa_prostata_bs8

Token Classification

named-entity-recognition

Eval Results (legacy)

Model card Files Files and versions

XLM-RoBERTa_prostata_bs8 / README.md

FernandoValencia's picture

FernandoValencia

📝 Añadir README para modelo XLM-RoBERTa

465a9f1 verified 11 months ago

|

history blame contribute delete

2.06 kB

	---
	language: es
	datasets: custom
	metrics:
	- f1
	- precision
	- recall
	- accuracy
	tags:
	- ner
	- named-entity-recognition
	- xlm-roberta
	- transformers
	- cancer
	- salud
	- huggingface
	model-index:
	- name: XLM-RoBERTa NER - Cáncer de Próstata (batch_size=8)
	results:
	- task:
	name: Named Entity Recognition
	type: token-classification
	dataset:
	name: Custom dataset - formato BIO
	type: medical
	description: \|
	Dataset especializado en anotaciones BIO sobre cáncer de próstata en español.
	metrics:
	- name: F1
	type: f1
	value: 0.9660
	- name: Precision
	type: precision
	value: 0.9640
	- name: Recall
	type: recall
	value: 0.9680
	- name: Accuracy
	type: accuracy
	value: 0.9943
	---

	# Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata

	Este modelo se basa en [xlm-roberta-large](https://huggingface.co/xlm-roberta-large) y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata.

	## 🧠 Tarea

	Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata.

	## 📊 Rendimiento en conjunto de prueba

	\| Métrica \| Valor \|
	\|-------------\|-----------\|
	\| F1-score \| 0.9660 \|
	\| Precision \| 0.9640 \|
	\| Recall \| 0.9680 \|
	\| Accuracy \| 0.9943 \|

	## ⚙️ Uso rápido

	```python
	from transformers import AutoTokenizer, AutoModelForTokenClassification

	model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")
	tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8")

	text = "El paciente fue diagnosticado con cáncer de próstata"
	tokens = tokenizer(text, return_tensors="pt", truncation=True)
	outputs = model(**tokens)
	```