Un codificador de torre dual de 400M parámetros para tareas de clasificación de imágenes médicas, recuperación e inferencia de cero disparos.
MedSigLIP MedSigLIP es un codificador de torre dual ligero de 400M parámetros (visión + texto) que soporta imágenes de 448×448 y entradas de texto de hasta 64 tokens. Lanzado el 9 de julio de 2025, como parte del proyecto Health AI Developer Foundations de Google.
El modelo está entrenado en datos diversos de imágenes médicas incluyendo radiografías de tórax, dermatología, oftalmología, preparaciones patológicas y escáneres CT/MRI junto con sus informes correspondientes. También se incluyen imágenes naturales para mantener las capacidades de generalización.
MedSigLIP está específicamente diseñado para tareas de clasificación eficiente en datos, clasificación de cero disparos y recuperación semántica de imágenes. Para tareas de generación de texto, Google recomienda usar MedGemma en su lugar.
Health AI Developer Foundations
2025-07-09 UTC
Construido sobre la base SigLIP con especialización médica
Arquitectura de torre dual con codificadores de visión y texto
Procesamiento de imágenes médicas de alta resolución
Comprensión de texto médico e informes
Imágenes médicas + informes + imágenes naturales
Optimizado para tareas de clasificación y recuperación
Entrene clasificadores con datos médicos etiquetados mínimos usando representaciones preentrenadas
Clasifique imágenes médicas sin entrenamiento específico de tarea usando descripciones de texto
Encuentre imágenes médicas relevantes usando consultas en lenguaje natural
Para tareas de generación de texto, use MedGemma en su lugar
Rendimiento competitivo en tareas de imágenes médicas
Las métricas de rendimiento varían según el dominio médico específico y la configuración de la tarea. Consulte la tarjeta oficial del modelo para benchmarks detallados.
Get started with MedSigLIP in your projects
Download MedSigLIP from the official repository or use via API
# Example: Loading MedSigLIP
from transformers import AutoModel, AutoProcessor
model = AutoModel.from_pretrained("google/medsiglip")
processor = AutoProcessor.from_pretrained("google/medsiglip")
Format medical images (448×448) and text descriptions (≤64 tokens)
Choose from classification, zero-shot inference, or retrieval applications
Official links and community resources
Complete documentation and API reference
Detailed model specifications and performance metrics
Code examples, notebooks, and implementation guides
Complete HAI-DEF project overview
Industry analysis of MedGemma and MedSigLIP release
In-depth coverage of Google's healthcare AI initiatives
Choose the right model for your use case
Lightweight Encoder
Classification, retrieval, and embedding tasks
Generative Models
Text generation, conversation, and complex reasoning
Important considerations for medical AI deployment
MedSigLIP is a research model and is not intended for direct clinical decision-making. All medical AI applications require proper validation, regulatory compliance, and human oversight.
Thorough testing and validation needed before clinical deployment
Ensure compliance with local healthcare regulations and standards
Medical professionals must review and validate all AI-generated outputs
Follow HIPAA and other privacy regulations when handling medical data