의료 이미지 분류, 검색, 제로샷 추론 작업을 위해 설계된 4억 매개변수 듀얼 타워 인코더입니다.
MedSigLIP MedSigLIP은 448×448 이미지와 최대 64토큰의 텍스트 입력을 지원하는 경량 4억 매개변수 듀얼 타워 인코더(비전 + 텍스트)입니다. 2025년 7월 9일 Google의 Health AI Developer Foundations 프로젝트의 일부로 출시되었습니다.
이 모델은 흉부 X선, 피부과, 안과, 병리 슬라이드, CT/MRI 스캔과 해당 보고서를 포함한 다양한 의료 이미징 데이터로 훈련되었습니다. 일반화 능력을 유지하기 위해 자연 이미지도 포함되어 있습니다.
MedSigLIP은 데이터 효율적 분류, 제로샷 분류, 의미론적 이미지 검색 작업을 위해 특별히 설계되었습니다. 텍스트 생성 작업의 경우 Google은 MedGemma 사용을 권장합니다.
Health AI Developer Foundations
2025-07-09 UTC
의료 전문화된 SigLIP 기반 아키텍처
비전과 텍스트 인코더를 포함한 듀얼 타워 아키텍처
고해상도 의료 이미지 처리
의료 텍스트 및 보고서 이해
의료 이미지 + 보고서 + 자연 이미지
분류 및 검색 작업에 최적화
사전 훈련된 표현을 사용하여 최소한의 라벨링된 의료 데이터로 분류기 훈련
작업별 훈련 없이 텍스트 설명을 사용하여 의료 이미지 분류
자연어 쿼리를 사용하여 관련 의료 이미지 찾기
텍스트 생성 작업의 경우 MedGemma를 사용하세요
의료 이미징 작업에서 경쟁력 있는 성능
성능 지표는 특정 의료 도메인과 작업 구성에 따라 다릅니다. 자세한 벤치마크는 공식 모델 카드를 참조하세요.
프로젝트에서 MedSigLIP 시작하기
공식 저장소에서 MedSigLIP을 다운로드하거나 API를 통해 사용
# 예시: MedSigLIP 로딩
from transformers import AutoModel, AutoProcessor
model = AutoModel.from_pretrained("google/medsiglip")
processor = AutoProcessor.from_pretrained("google/medsiglip")
의료 이미지(448×448)와 텍스트 설명(≤64토큰) 포맷
분류, 제로샷 추론 또는 검색 애플리케이션 중 선택
공식 링크 및 커뮤니티 리소스
완전한 문서 및 API 참조
상세한 모델 사양 및 성능 지표
코드 예제, 노트북 및 구현 가이드
완전한 HAI-DEF 프로젝트 개요
MedGemma 및 MedSigLIP 출시에 대한 업계 분석
Google의 헬스케어 AI 이니셔티브에 대한 심층 보도
사용 사례에 적합한 모델 선택
경량 인코더
분류, 검색 및 임베딩 작업
생성 모델
텍스트 생성, 대화 및 복잡한 추론
의료 AI 배포를 위한 중요한 고려사항
MedSigLIP은 연구 모델이며 직접적인 임상 의사결정을 위한 것이 아닙니다. 모든 의료 AI 애플리케이션에는 적절한 검증, 규제 준수 및 인간의 감독이 필요합니다.
임상 배포 전 철저한 테스트 및 검증 필요
지역 의료 규정 및 표준 준수 보장
의료 전문가가 모든 AI 생성 출력을 검토하고 검증해야 함
의료 데이터 처리 시 HIPAA 및 기타 개인정보 보호 규정 준수