PRODUCTO

NexusMedical

Sistema RAG (Retrieval-Augmented Generation) para imagen médica. Búsqueda híbrida con BiomedCLIP + BM25 + Vector Search sobre datasets clínicos DICOM.

Demo en Vivo Arquitectura (MD)
NexusMedical Streamlit Demo
🟢 Demo en vivo disponible — Haz clic para abrir Streamlit
52K+

Imágenes procesadas (LIDC + COVID-AR)

4

Datasets clínicos (TCIA)

512

Dimensiones embedding (BiomedCLIP)

100%

Local / On-premise (sin cloud)

ARQUITECTURA

Pipeline completo: ingesta → búsqueda → respuesta

Desde archivos DICOM crudos hasta respuestas clínicas con fuentes verificables. Todo ejecutado localmente con modelos open-source.

NexusMedical Architecture
Descargar ARCHITECTURE_RAG.md completo

STACK TECNOLÓGICO

7 componentes. Cero APIs de pago.

BiomedCLIP

Embeddings de imagen entrenados con 15M pares médicos de PubMed. 512 dimensiones. Mucho mejor que CLIP genérico para radiología.

BM25 + Vector Search

Búsqueda híbrida: BM25 para keywords exactas + Vector Search para significado semántico. Fusión con RRF (Reciprocal Rank Fusion).

Cross-Encoder

Re-evaluación de resultados con modelo Cross-Encoder (ms-marco-MiniLM-L-6-v2). Mejora precisión un 10-20% sobre búsqueda base.

LLaVA (VLM)

Visual Language Model que ve imágenes y genera descripciones clínicas. Complementa BiomedCLIP: busca con vectores, describe con LLaVA.

LLaMA 3 (Ollama)

LLM local via Ollama. Sintetiza resultados, explica hallazgos y genera respuestas con fuentes verificables. Sin APIs de pago.

scispaCy NER

NER biomédico (Allen AI): detecta enfermedades, fármacos y entidades UMLS. SpaCy genérico no detecta "pneumonia" — scispaCy sí.

DATASETS

Datos clínicos reales de TCIA

DatasetTamañoDICOMsPNGsEstado
COVID-19-AR19 GB31,93531,547
LIDC-IDRI16 GB26,83320,871
CMB-LCA96 GBDescargando
COVID-19-NY-SBU144 GBDescargando

CÓMO FUNCIONA

Búsqueda inteligente en 3 pasos

PASO 1

Ingesta DICOM

Los archivos DICOM se convierten a PNG, se extraen metadatos clínicos y se generan embeddings con BiomedCLIP (imagen) y MiniLM (texto).

PASO 2

Búsqueda Híbrida

Tu query se procesa con NER médico, se busca por BM25 (keywords) y Vector Search (semántico), se fusionan con RRF y se re-rankean con Cross-Encoder.

PASO 3

Respuesta con IA

LLaVA describe las imágenes encontradas y LLaMA3 sintetiza una respuesta clínica con fuentes verificables. Todo local, sin APIs de pago.

COSTES

100% local. Sin facturas de API.

ComponenteNuestra soluciónCloud API equivalente
LLMLLaMA3 (Ollama) — $0GPT-4: $30/1M tok
EmbeddingsBiomedCLIP + MiniLM — $0OpenAI Ada: $0.10/1M tok
RerankerCross-Encoder (HF) — $0Cohere: $2/1K queries
VLMLLaVA (Ollama) — $0GPT-4V: $10/1K images
Coste mensual~€10 (electricidad)€70 — €400+

¿Quieres buscar imágenes médicas con IA?

Prueba la demo en vivo o descarga la arquitectura completa.

Abrir Demo Streamlit Descargar Arquitectura Contacto