4 億參數的雙塔編碼器,專為醫療影像分類、檢索和零樣本推理任務設計。
MedSigLIP MedSigLIP 是一個輕量級的 4 億參數雙塔編碼器(視覺 + 文字),支援 448×448 影像和最多 64 標記的文字輸入。於 2025 年 7 月 9 日發布,是 Google 健康 AI 開發者基礎專案的一部分。
該模型在多樣化的醫療影像資料上進行訓練,包括胸片、皮膚科、眼科、病理切片和 CT/MRI 掃描及其相應報告。還包含自然影像以保持泛化能力。
MedSigLIP 專門設計用於資料高效分類、零樣本分類和語義影像檢索任務。對於文字生成任務,Google 建議使用 MedGemma。
健康 AI 開發者基礎
2025-07-09 UTC
基於 SigLIP 基礎架構的醫療專業化
雙塔架構,包含視覺和文字編碼器
高解析度醫療影像處理
醫療文字和報告理解
醫療影像 + 報告 + 自然影像
針對分類和檢索任務最佳化
使用預訓練表示,用最少的標記醫療資料訓練分類器
使用文字描述對醫療影像進行分類,無需特定任務訓練
使用自然語言查詢尋找相關醫療影像
對於文字生成任務,請使用 MedGemma
在醫療影像任務中表現出色
效能指標因具體醫療領域和任務配置而異。詳細基準測試請參考官方模型卡。
在您的專案中開始使用 MedSigLIP
從官方儲存庫下載 MedSigLIP 或透過 API 使用
# 範例:載入 MedSigLIP
from transformers import AutoModel, AutoProcessor
model = AutoModel.from_pretrained("google/medsiglip")
processor = AutoProcessor.from_pretrained("google/medsiglip")
格式化醫療影像(448×448)和文字描述(≤64 標記)
從分類、零樣本推理或檢索應用中選擇
官方連結和社群資源
MedGemma 和 MedSigLIP 發布的產業分析
Google 醫療 AI 計畫的深度報導
為您的用例選擇合適的模型
輕量級編碼器
分類、檢索和嵌入任務
生成式模型
文字生成、對話和複雜推理
醫療 AI 部署的重要考量事項
MedSigLIP 是一個研究模型,不適用於直接的臨床決策。所有醫療 AI 應用都需要適當的驗證、監管合規和人工監督。
臨床部署前需要徹底測試和驗證
確保符合當地醫療法規和標準
醫療專業人員必須審查和驗證所有 AI 生成的輸出
處理醫療資料時遵循 HIPAA 和其他隱私法規