版权所有@杭州高谱成像技术有限公司 浙ICP备19040412号-2 网站地图
Design By: Yushangweb
新闻资讯
高谱成像助力山东大学等团队构建头颈癌显微高光谱病理基准数据集,突破医学组织切片智能分类难题

发布时间:2026-06-05

近日,由山东大学、齐鲁医院、德国慕尼黑工业大学、西安电子科技大学等单位联合完成的学术论文 《HSPath-Bench: A microscopic hyperspectral dataset and local-global learning network for histopathological classification》 正式公开发布。该研究首次构建了面向头颈癌免疫组化(IHC)与原位杂交(ISH)切片的显微高光谱公开基准数据集 HSPath-Bench,并提出了创新的最大质量波段选择(M²BS)算法与自适应局部‑全局特征融合(ALGFF)网络,在极少量标注样本下实现了病理组织的高精度分类。

杭州高谱成像技术有限公司(HHIT)自主研发的 HY-5010-S 显微高光谱成像系统,为本研究所有高光谱数据的采集提供了核心软硬件支撑,再次验证了国产高端光谱仪器在生命科学前沿研究中的关键价值。


01
图片
研究背景


高光谱成像能够捕获组织切片在数百个连续波段上的光谱信息,为生物细胞分析和医学病理诊断提供了超越传统RGB图像的”光谱指纹“级分辨能力。然而,该技术在医学显微领域落地仍面临三大瓶颈:

1. 数据极度稀缺:至今没有一个公开的、带有像素级精细标注的显微高光谱病理数据集,严重制约了算法开发与公平对比。


2. 光谱冗余与噪声:高光谱数据波段多、相关性强,且采集过程中存在暗电流、光源不均等噪声,直接使用会导致“休斯现象”(维度灾难),降低分类精度。


3. 标注成本高昂:病理专家手工逐像素标注耗时极长,深度学习方法在少量训练样本下容易过拟合,泛化能力差。

为了打通从“先进传感”到“智能诊断”的最后一公里,研究团队与高谱成像紧密合作,从数据采集、算法设计到实验验证,完成了一次系统性的创新突破。


02
图片
核心贡献


2.1 发布 HSPath-Bench 数据集


ScreenShot_2026-05-28_164401_052.png


团队采集了43例头颈鳞癌患者的组织切片,涵盖 EGFR、P16、P53、P63、EBER 五种关键分子标记物,经过严格病理专家双重标注与仲裁,构建了包含 60万+像素级精标注样本的高光谱数据集。每个样本均提供:

  • 400-1000nm 范围内 300个连续光谱波段

  • 像素级的三类染色强度标注(强阳性、弱阳性、阴性)以及上皮/间质区域划分

  • 校准后的光谱透射率数据(附暗电流与空白参考校正)

HSPath-Bench 是目前国际领先的、多类别、像素级标注的显微高光谱病理数据集,为后续算法研究与行业基准测试提供了宝贵的“标尺”。

2.2 提出 M²BS 波段选择算法

针对高光谱波段冗余问题,研究团队创新性地提出 最大质量波段选择(M²BS) 算法。不同于传统仅考虑方差或互信息的方法,M²BS 通过最大化平行多面体体积来评估波段组合的代表性,在有效去冗余的同时最大程度保留判别信息,显著降低了后续网络的计算负担。

ScreenShot_2026-05-28_170302_156.png



2.3 设计 ALGFF 自适应局部‑全局融合网络

为了兼顾显微组织的局部细节纹理全局空间上下文,论文设计了 ALGFF(Adaptive Local‑Global Feature Fusion) 模块,核心创新包括:

ScreenShot_2026-05-28_170336_612.png

  • 空间‑光谱注意力(SS):在编码器‑解码器结构中强化对关键光谱特征的响应。

  • Swin Transformer 与 CNN 自适应融合:通过通道级动态权重,平衡窗口自注意力(建模长程依赖)与卷积操作(捕获局部精细结构)。

  • 无补丁(patch‑free)全图处理:避免了传统滑窗造成的感受野受限与计算冗余。


03
图片
实验结果


3.1 极稀疏标注下显著优于当前主流算法

在每类仅使用 5个像素 作为训练样本的极端条件下,所提方法在10张测试图像上的总体分类精度(OA)达到 61% – 90%,平均准确率(AA)与 Kappa 系数均显著超越十种主流方法(包括 SVM、随机森林、1D/2D CNN、Transformer、FPGA、SSDGL 等)。

ScreenShot_2026-05-28_170528_373.png

部分典型结果:

  • EGFR-17:OA 86.6%(第二名80.7%)

  • P16-03:OA 83.6%(第二名78.3%)

  • EBER-01:OA 78.8%(第二名68.8%)

  • P53-01:AA 86.6%(第二名82.7%)

3.2 训练样本增加时性能持续提升

当训练样本增加到每类50像素时,精度相比5像素条件平均提升 6–16个百分点;增加至100像素时仍有小幅稳定增长,表明模型具有良好的数据扩展性,不会因样本增多而饱和。

3.3 消融实验验证各模块贡献

  • 移除 SS 模块(替换为普通卷积):分类精度下降2–10个百分点,尤其在复杂核染色的 P53 数据集上下降近10%。

  • 移除 ALGFF 模块(仅保留单分支):平均精度下降1–2个百分点。

  • 结合 M²BS + SS + ALGFF 的完整模型在所有测试集上均取得最优或次优结果。

3.4 可视化分类图对比

论文提供了每种方法在各类切片上的分类伪彩图。可以看到:

ScreenShot_2026-05-28_170805_129.png

  • 仅用光谱信息(像素级方法)会产生大量椒盐噪声,边界模糊。

  • 基于固定尺寸补丁的方法(2DCNN、2DFormer)在阳性细胞散在分布的区域容易漏检或误判。

  • 本方法生成的分类图最接近专家标注的真值,尤其在 EGFR 胞膜连续阳性与 EBER 核阳性混合区域表现突出。


04
图片
高谱成像


在该研究中,所有高光谱病理切片图像均使用杭州高谱成像技术有限公司的 HY-5010-S 显微高光谱成像系统采集。

图片.png

HY-5010-S 具备400–1000 nm光谱范围、优于2.8 nm的光谱分辨率、推扫式成像与暗电流/空白双重校正,为研究团队提供了高信噪比、高一致性的光谱数据,是 HSPath-Bench 数据集高标注质量的硬件保障。

高谱成像致力于为生命科学与精准医学提供先进的光谱视觉解决方案,此次与顶尖临床、科研团队的合作,再次证明了国产高光谱仪器能够支撑国际前沿研究,并有望在未来推动显微高光谱技术向临床病理常规应用转化。

论文链接:

https://doi.org/10.1016/j.optlastec.2025.114413

光谱数据集地址:

https://github.com/zhangchenglong1116/HSPath-Bench



05
图片
展望未来


HSPath-Bench 数据集的发布和 ALGFF 网络的成功验证,为显微高光谱病理图像分析开辟了新的道路。后续工作将围绕:

1. 扩展数据集至更多癌种(胃癌、肺癌、乳腺癌等)与更多分子标记物。

2. 探索全切片高光谱成像(Whole‑Slide Imaging)与实时拼接技术。

3. 开发虚拟染色、术中快速病理等创新应用。

我们相信,在高质量数据与强大算法的共同驱动下,高光谱成像技术将从实验室走向诊室,为精准医疗贡献独特的“光谱力量”。


如需了解高谱成像高光谱相机的详细参数、应用案例,或希望与我们讨论合作,欢迎通过以下方式联系:


电话:153-0581-1932

邮箱:san.li@hhitgroup.com

官网:www.hhitgroup.com

杭州高谱成像技术有限公司


留言

如果您想与我们取得联系,请填写下面的表格,以便您的查询可以直接联系到适合的联系人。
电话
0571-83729176
手机
15305811932 (微信同号)
邮箱
sales@hhitgroup.com
地址
浙江省杭州市西湖区转塘街道云栖小镇海思科创园总部园区2幢503室

版权所有@杭州高谱成像技术有限公司 浙ICP备19040412号-2 网站地图

Design By: Yushangweb