Koder dwuwieżowy z 400M parametrami do zadań klasyfikacji obrazów medycznych, wyszukiwania i wnioskowania zero-shot.
MedSigLIP MedSigLIP to lekki koder dwuwieżowy z 400M parametrami (wizja + tekst), który obsługuje obrazy 448×448 i wejścia tekstowe do 64 tokenów. Wydany 9 lipca 2025 roku jako część projektu Health AI Developer Foundations Google.
Model jest trenowany na różnorodnych danych obrazowania medycznego, w tym zdjęciach rentgenowskich klatki piersiowej, dermatologii, okulistyce, preparatach patologicznych i skanach CT/MRI wraz z odpowiadającymi im raportami. Obrazy naturalne są również uwzględnione w celu utrzymania zdolności generalizacji.
MedSigLIP jest specjalnie zaprojektowany do zadań klasyfikacji efektywnej pod względem danych, klasyfikacji zero-shot i semantycznego wyszukiwania obrazów. Do zadań generowania tekstu Google zaleca używanie MedGemma.
Health AI Developer Foundations
2025-07-09 UTC
Zbudowany na fundamencie SigLIP ze specjalizacją medyczną
Architektura dwuwieżowa z koderami wizji i tekstu
Przetwarzanie obrazów medycznych wysokiej rozdzielczości
Rozumienie tekstu medycznego i raportów
Obrazy medyczne + raporty + obrazy naturalne
Zoptymalizowany do zadań klasyfikacji i wyszukiwania
Trenuj klasyfikatory z minimalnymi oznaczonymi danymi medycznymi używając wstępnie wytrenowanych reprezentacji
Klasyfikuj obrazy medyczne bez treningu specyficznego dla zadania używając opisów tekstowych
Znajdź odpowiednie obrazy medyczne używając zapytań w języku naturalnym
Do zadań generowania tekstu użyj MedGemma
Konkurencyjna wydajność w zadaniach obrazowania medycznego
Metryki wydajności różnią się w zależności od konkretnej dziedziny medycznej i konfiguracji zadania. Zobacz oficjalną kartę modelu dla szczegółowych benchmarków.
Get started with MedSigLIP in your projects
Download MedSigLIP from the official repository or use via API
# Example: Loading MedSigLIP
from transformers import AutoModel, AutoProcessor
model = AutoModel.from_pretrained("google/medsiglip")
processor = AutoProcessor.from_pretrained("google/medsiglip")
Format medical images (448×448) and text descriptions (≤64 tokens)
Choose from classification, zero-shot inference, or retrieval applications
Official links and community resources
Complete documentation and API reference
Detailed model specifications and performance metrics
Code examples, notebooks, and implementation guides
Complete HAI-DEF project overview
Industry analysis of MedGemma and MedSigLIP release
In-depth coverage of Google's healthcare AI initiatives
Choose the right model for your use case
Lightweight Encoder
Classification, retrieval, and embedding tasks
Generative Models
Text generation, conversation, and complex reasoning
Important considerations for medical AI deployment
MedSigLIP is a research model and is not intended for direct clinical decision-making. All medical AI applications require proper validation, regulatory compliance, and human oversight.
Thorough testing and validation needed before clinical deployment
Ensure compliance with local healthcare regulations and standards
Medical professionals must review and validate all AI-generated outputs
Follow HIPAA and other privacy regulations when handling medical data