| --- |
| language: es |
| datasets: custom |
| metrics: |
| - f1 |
| - precision |
| - recall |
| - accuracy |
| tags: |
| - ner |
| - named-entity-recognition |
| - xlm-roberta |
| - transformers |
| - cancer |
| - salud |
| - huggingface |
| model-index: |
| - name: XLM-RoBERTa NER - Cáncer de Próstata (batch_size=8) |
| results: |
| - task: |
| name: Named Entity Recognition |
| type: token-classification |
| dataset: |
| name: Custom dataset - formato BIO |
| type: medical |
| description: | |
| Dataset especializado en anotaciones BIO sobre cáncer de próstata en español. |
| metrics: |
| - name: F1 |
| type: f1 |
| value: 0.9660 |
| - name: Precision |
| type: precision |
| value: 0.9640 |
| - name: Recall |
| type: recall |
| value: 0.9680 |
| - name: Accuracy |
| type: accuracy |
| value: 0.9943 |
| --- |
| |
| # Modelo XLM-RoBERTa para Reconocimiento de Entidades Nombradas en Cáncer de Próstata |
|
|
| Este modelo se basa en [xlm-roberta-large](https://huggingface.co/xlm-roberta-large) y ha sido ajustado para la tarea de NER (Reconocimiento de Entidades Nombradas) sobre un dataset en español con etiquetas BIO enfocadas en cáncer de próstata. |
|
|
| ## 🧠 Tarea |
|
|
| Reconocimiento de entidades biomédicas relacionadas con el diagnóstico, pruebas y condiciones clínicas del cáncer de próstata. |
|
|
| ## 📊 Rendimiento en conjunto de prueba |
|
|
| | Métrica | Valor | |
| |-------------|-----------| |
| | F1-score | 0.9660 | |
| | Precision | 0.9640 | |
| | Recall | 0.9680 | |
| | Accuracy | 0.9943 | |
|
|
| ## ⚙️ Uso rápido |
|
|
| ```python |
| from transformers import AutoTokenizer, AutoModelForTokenClassification |
| |
| model = AutoModelForTokenClassification.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") |
| tokenizer = AutoTokenizer.from_pretrained("FernandoValencia/XLM-RoBERTa_prostata_bs8") |
| |
| text = "El paciente fue diagnosticado con cáncer de próstata" |
| tokens = tokenizer(text, return_tensors="pt", truncation=True) |
| outputs = model(**tokens) |
| ``` |