Um codificador de torre dupla de 400M parâmetros para tarefas de classificação de imagens médicas, recuperação e inferência zero-shot.
MedSigLIP MedSigLIP é um codificador de torre dupla leve de 400M parâmetros (visão + texto) que suporta imagens 448×448 e entradas de texto de até 64 tokens. Lançado em 9 de julho de 2025, como parte do projeto Health AI Developer Foundations do Google.
O modelo é treinado em dados diversos de imagem médica incluindo raios-X do tórax, dermatologia, oftalmologia, lâminas de patologia e exames CT/MRI junto com seus relatórios correspondentes. Imagens naturais também são incluídas para manter as capacidades de generalização.
MedSigLIP é especificamente projetado para tarefas de classificação eficiente em dados, classificação zero-shot e recuperação semântica de imagens. Para tarefas de geração de texto, o Google recomenda usar MedGemma em vez disso.
Health AI Developer Foundations
2025-07-09 UTC
Construído sobre a base SigLIP com especialização médica
Arquitetura de torre dupla com codificadores de visão e texto
Processamento de imagens médicas de alta resolução
Compreensão de texto médico e relatórios
Imagens médicas + relatórios + imagens naturais
Otimizado para tarefas de classificação e recuperação
Treine classificadores com dados médicos rotulados mínimos usando representações pré-treinadas
Classifique imagens médicas sem treinamento específico da tarefa usando descrições de texto
Encontre imagens médicas relevantes usando consultas em linguagem natural
Para tarefas de geração de texto, use MedGemma em vez disso
Desempenho competitivo em tarefas de imagem médica
As métricas de desempenho variam por domínio médico específico e configuração da tarefa. Consulte o cartão oficial do modelo para benchmarks detalhados.
Get started with MedSigLIP in your projects
Download MedSigLIP from the official repository or use via API
# Example: Loading MedSigLIP
from transformers import AutoModel, AutoProcessor
model = AutoModel.from_pretrained("google/medsiglip")
processor = AutoProcessor.from_pretrained("google/medsiglip")
Format medical images (448×448) and text descriptions (≤64 tokens)
Choose from classification, zero-shot inference, or retrieval applications
Official links and community resources
Complete documentation and API reference
Detailed model specifications and performance metrics
Code examples, notebooks, and implementation guides
Complete HAI-DEF project overview
Industry analysis of MedGemma and MedSigLIP release
In-depth coverage of Google's healthcare AI initiatives
Choose the right model for your use case
Lightweight Encoder
Classification, retrieval, and embedding tasks
Generative Models
Text generation, conversation, and complex reasoning
Important considerations for medical AI deployment
MedSigLIP is a research model and is not intended for direct clinical decision-making. All medical AI applications require proper validation, regulatory compliance, and human oversight.
Thorough testing and validation needed before clinical deployment
Ensure compliance with local healthcare regulations and standards
Medical professionals must review and validate all AI-generated outputs
Follow HIPAA and other privacy regulations when handling medical data