Purpose: Surgical workflow recognition enables context-aware assistance and skill assessment in computer-assisted interventions. Despite recent advances, current methods suffer from two critical challenges: prediction jitter across consecutive frames and poor discrimination of ambiguous phases. This paper aims to develop a stable framework by selectively propagating reliable historical information and explicitly modeling uncertainty for hard sample enhancement. Methods: We propose a dual-pathway framework DSTED with Reliable Memory Propagation (RMP) and Uncertainty-Aware Prototype Retrieval (UPR). RMP maintains temporal coherence by filtering and fusing high-confidence historical features through multi-criteria reliability assessment. UPR constructs learnable class-specific prototypes from high-uncertainty samples and performs adaptive prototype matching to refine ambiguous frame representations. Finally, a confidence-driven gate dynamically balances both pathways based on prediction certainty. Results: Our method achieves state-of-the-art performance on AutoLaparo-hysterectomy with 84.36% accuracy and 65.51% F1-score, surpassing the second-best method by 3.51% and 4.88% respectively. Ablations reveal complementary gains from RMP (2.19%) and UPR (1.93%), with synergistic effects when combined. Extensive analysis confirms substantial reduction in temporal jitter and marked improvement on challenging phase transitions. Conclusion: Our dual-pathway design introduces a novel paradigm for stable workflow recognition, demonstrating that decoupling the modeling of temporal consistency and phase ambiguity yields superior performance and clinical applicability.


翻译:目的:手术工作流识别可为计算机辅助介入手术提供情境感知支持与技能评估。尽管近期研究取得进展,现有方法仍面临两个关键挑战:连续帧间的预测抖动及模糊手术阶段的判别困难。本文旨在通过选择性传播可靠历史信息并显式建模不确定性以增强困难样本,构建一个稳定的识别框架。方法:我们提出双通路框架DSTED,包含可靠记忆传播模块与不确定性感知原型检索模块。RMP模块通过多准则可靠性评估筛选并融合高置信度历史特征,以保持时序连贯性。UPR模块从高不确定性样本中构建可学习的类别特定原型,并执行自适应原型匹配以优化模糊帧的表征。最后,置信度驱动门控根据预测确定性动态平衡双通路输出。结果:本方法在AutoLaparo-hysterectomy数据集上取得最优性能,准确率达84.36%,F1分数达65.51%,分别超越次优方法3.51%与4.88%。消融实验表明RMP与UPR分别带来2.19%与1.93%的性能增益,且二者结合产生协同效应。深入分析证实本方法显著降低了时序抖动,并在挑战性阶段过渡场景中取得明显改善。结论:我们的双通路设计为稳定工作流识别引入了新范式,证明解耦时序一致性建模与阶段模糊性处理能够获得更优性能及临床适用性。

0
下载
关闭预览

相关内容

【CVPR2023】DynamicDet:目标检测的统一动态架构
专知会员服务
26+阅读 · 2023年4月15日
用于识别任务的视觉 Transformer 综述
专知会员服务
75+阅读 · 2023年2月25日
使用CNN生成图像先验实现场景的盲图像去模糊
统计学习与视觉计算组
10+阅读 · 2018年6月14日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员