
由 Dr7.ai 醫療AI平台驅動
體驗HealthBench Hard全球第一的醫療AI。百川M3透過SPAR工作流推理實現嚴肅臨床諮詢,藉由事實感知強化學習達到業界最低3.5%幻覺率。
體驗SPAR驅動的臨床推理和全球最低幻覺率的嚴肅醫療諮詢
嚴肅醫療諮詢
無限存取全球第一的醫療AI,體驗SPAR工作流推理、最低幻覺率和企業級臨床決策支援。
Baichuan-M3 是一個2350億參數的醫療AI模型,從根本上重新定義了臨床決策支援的效能上限。基於Qwen3架構建構,透過領域特定強化學習訓練,百川M3在HealthBench Hard上排名第一,在複雜醫學推理方面超越GPT-5.2-High。
與預設給出安全但無用建議的通用聊天機器人不同,百川M3實現了SPAR(分段流水線強化學習)演算法,將臨床諮詢分解為四個認知階段,每個階段都有專門的獎勵模型,模擬人類醫學訓練過程。
透過事實感知強化學習達到業界最低3.5%幻覺率,以及確保安全優先臨床溝通的SCAN原則,百川M3代表了從被動聊天到嚴肅臨床諮詢的範式轉變。
2026年發布
開源Apache 2.0授權,支援W4量化,可在消費級GPU上部署
專為嚴肅臨床諮詢設計的先進能力
SPAR四階段臨床工作流(病史採集→鑑別診斷→實驗室檢測→最終診斷)
SCAN原則實現(安全、清晰、關聯、導航)
事實感知強化學習實現業界最低3.5%幻覺率
主動臨床詢問與追問(非被動聊天)
多輪診斷推理與證據追蹤
循證治療建議與引用
支援HIPAA/GDPR合規私有化部署
W4量化支援消費級GPU部署(雙RTX 4090)
百川M3在權威醫療AI基準測試中取得頂尖成績
全球第一,在複雜醫學推理上超越GPT-5.2-High
諮詢品質領先第二名12.4分
透過事實感知RL實現所有醫療LLM中最低
綜合醫療AI基準分數
分段流水線強化學習
與傳統RLHF僅在最後提供回饋不同,SPAR將臨床諮詢分解為四個階段,每個階段都有獨立的獎勵模型:
完整性與相關性
遺漏風險因素會被懲罰,提出澄清問題會獲得獎勵
邏輯一致性
必須生成與症狀一致的病情,優先考慮機率和嚴重性
效率與必要性
根據建議檢測的成本效益和診斷價值進行評估
準確性與證據
根據與前期階段收集證據的一致性進行加權
確保專業臨床標準的行為框架:
立即風險評估——「胸部劇痛」觸發緊急協議
精確的臨床語言,不使用模糊的AI套話
主動挖掘資訊,像真正的醫生一樣提出追問
每次諮詢都以可執行的下一步建議結束
整合到生成過程中的即時驗證迴圈:
將回應拆分為單個可驗證的事實
對照權威醫學知識庫檢查每個聲明
平衡任務獎勵與事實獎勵,訓練過程中逐步增加準確性懲罰
透過SPAR工作流協助醫療專業人員進行循證臨床推理、鑑別診斷和治療建議。
透過主動詢問進行全面病史採集,在醫生會診前準備結構化的患者檔案。
支援醫生進行會診前準備、文件記錄和多步驟診斷推理與證據追蹤。
開始使用全球第一的醫療AI
百川M3可透過Dr7.ai API、Hugging Face(Apache 2.0)以及企業醫療私有化部署選項取得。
將百川M3整合到您的醫療應用、臨床工作流或研究平台中。
靈活部署,從雲端API到消費級GPU,支援W4量化。
所有百川M3輸出在臨床使用前應由合格的醫療專業人員驗證。該模型旨在輔助而非替代醫學判斷。
確保符合當地醫療法規(HIPAA、GDPR等),並在臨床環境中部署醫療AI前取得必要的審批。
了解百川M3在嚴肅醫療諮詢領域領先的原因
嚴肅醫療諮詢AI
嚴肅臨床諮詢、CDSS、患者入院、醫學研究
通用與考試導向模型
通用醫學問答、考試準備、廣泛知識檢索
關於百川M3的常見問題
SPAR(分段流水線強化學習)將臨床諮詢分解為四個認知階段——病史採集、鑑別診斷、實驗室檢測和最終診斷——每個階段都有專門的獎勵模型。這解決了傳統RLHF中的「信用分配問題」,即對話結束時的回饋無法區分哪些具體行為導致了成功。SPAR確保模型在每個階段都正確推理,而不僅僅是最後猜對答案。
百川M3使用事實感知強化學習,包含三個元件:(1)原子聲明分解將回應拆分為單個可驗證的事實,(2)線上驗證對照權威醫學知識庫檢查每個聲明,(3)動態獎勵聚合平衡流暢性與事實準確性,隨著訓練成熟逐步增加錯誤懲罰。這實現了業界最低的3.5%幻覺率。
是的,百川M3在Apache 2.0授權下發布,提供完全透明度以及定製、微調和私有部署的能力。模型權重可在Hugging Face上取得,模型支援W4量化以便在消費級硬體(如雙RTX 4090 GPU)上部署。
可以!透過W4量化,百川M3可以在約48GB顯存(雙RTX 4090或類似配置)上執行。企業部署推薦8×24GB GPU(約120GB)以獲得優秀的吞吐量。完整FP16需要>400GB顯存用於研究和訓練目的。
百川M3在HealthBench Hard上超越GPT-5.2-High(44.4 vs 更低分數),證明了針對SPAR的專業醫學訓練在複雜臨床推理上優於通用規模。此外,百川M3提供開源可用性、私有部署選項和最低幻覺率——這些對於準確性和資料主權至關重要的醫療應用來說是關鍵因素。