
大幕开启
2019 年 9 月 21 日,广州,第二届全国眼科人工智能大会主会场。
大会开幕不久,主持人欣喜地向大家宣布,业内首个《AI 眼底彩照标注》团体标准正式启动,业内大咖云集站台。该标准由灵医智惠和中山大学中山眼科中心牵头、多位专家参与、前后历时一年多制定而成,将面向产、学、研、用各界同仁广泛吸纳成员单位。这意味着,蒙眼狂奔多时的人工智能眼底筛查行业里,终于有人开始直面数据标准这一块绕不过去的硬骨头;这也意味着,这个凝聚着多位专家心血的标准将会正式普惠行业,整个行业也迎来了标准化发展的里程碑,这引来满堂喝采和与会人员的普遍赞许。
启动仪式专家合影小眼睛,大世界。我国有近 6.5 亿眼疾风险人群,却只有 3.6 万名眼科医生,大多数眼疾可以在早期通过眼底筛查被发现,从而早诊早治、摆脱致盲风险。但由于巨大的医生缺口,多数患者在基层得不到相应的眼健康服务,这使得人工智能与眼底筛查的结合-AI 眼底筛查行业充满了想象,许多公司蜂拥而至。
众所周知,人工智能算法的大树需要大量优质数据来灌溉,AI 眼底筛查领域亦然。然而现实是眼底彩照数据的质量参差不齐,真正能够用于算法训练的高质量数据极少,这不光是一两家企业的难题,也是整个行业的一大心病。然而如果要去获得统一的优质数据,就需要一个所有标注医生都遵循的标准,这是一个非常难的过程,其难点在于需要权威医生领衔制定、在于需要让医生和人工智能算法都识别和认同,这是一个所有行业参与者都想做但都很难去做的事情。
同时,在行业需求的推动下,几乎所有公司都在追求尽可能快地将人工智能产品进行落地,以速度换取生长空间,少有人真正停下来去思考「如何获取优质数据」这个难题,毕竟这带来的可能是落地速度的放缓甚至停滞,是一件看上去多少有点「得不偿失」甚至需要很大勇气的事情。
灵医智惠与中山大学中山眼科中心却真的做了,堂吉诃德式地挑战「数据标准」这一硬骨头。
一:严苛催生标准
将视野拉回到大约一年半以前,百度成立 AI 医疗品牌「灵医智惠」,将 AI 眼底筛查作为其核心业务大力布局。灵医智惠团队从成立之初就以「AI 医疗的核心在医疗」为准则:人工智能技术再强,不懂医疗逻辑和场景也是徒劳,于是早早地与眼科领域权威——中山大学中山眼科中心展开深度合作。中山眼科中心的张秀兰教授,是我国乃至全球顶尖的青光眼专家,在 30 多年的眼科临床、科研工作中,见到许多由于缺乏早期筛查渠道而延误治疗的患者,因此张教授对人工智能入场眼底筛查充满期待,投入了极大的热忱到合作当中。在她的推荐下,全国眼底病知名专家、中山眼科特需中心主任张少冲教授,也携旗下专家团队加入这一工作。两位张教授的牵头,确保覆盖了眼底病和视神经疾病的相关工作的权威性。
中山眼科中心与灵医智惠的团队为了获取最优质的原始数据尽心竭力:从获得原始眼底彩照开始,就通过大浪淘沙般层层筛选的机制,淘汰掉曝光不足或曝光过度的数据,只留下一部分质量尚可的数据进入标注环节;到了标注阶段,团队更是设计了非常严苛的数据标注流程,每一张图片都需要先由三名医生进行标注,只有三个人结果一致,数据才能进入训练库供算法学习。首批参与标注的四十多名眼科医生都由张教授组织选拔,均曾在中山眼科中心进行过规范培训,有十多年丰富的专业临床经验。「标准流程「加上」顶级专家」指向理想的结果似乎是水到渠成的,整个合作团队都在憧憬着优质的人工智能眼底筛查产品能够快速出炉,服务行业。
这个时候,问题却不经意地出现了。
首先是数据标注产出率不如人意,可用标注数据的数量与预期值相差太大。平均十张图片经过标注只有两张能够通过上面所述的多人标注流程,对于青光眼这个比率更低,甚至不足百分之一;其次,是人工智能算法专家与医生之间产生了沟通的困难。医生觉得已经给算法专家描述地足够清楚了,算法专家却还是觉得有些东西无法定量描述且不利于设计对应的人工智能算法,经常出现双方就一个问题讨论到面红耳赤的情况。
速度还是质量?张教授选择了后者。此时她果断叫停了合作小组浩大的工作,召集大家一起反复讨论,组织层层排查,发现了问题根结所在。
首先在于医生对于疾病看法的不一致。不同的标注医生,由于临床科研背景、师从对象、经手病例、所处地域不同,积累的对疾病的经验看法是不同的,导致面对同样的眼底照片,得出的结果往往不太一样。在这样的情况下,数据标注速度自然被拖累。另外,医生与算法专家之间的分歧也找到了原因,算法专家理所当然地以为应当从人工智能算法的角度出发去规定医生所得出的结果,而医生也理所当然地以为人工智能算法能够无条件地遵循临床医学规范、指南学会自己所有的经验,两个行业的理念在这里发生了矛盾。
「医疗是关乎人民最基本的健康权的行业,所有 AI 医疗的尝试都应该非常谨慎,以非常严苛和专业的态度去做,容不得半点虚假,只有真真正正的医生团队和算法团队双方都认同的产品才能上线,灵医智惠就算一个点都不落地,也不愿意用不好的产品去换取落地速度」,灵医智惠总经理黄艳回忆起那个时候说过的话。
「做一个我们自己团队的好的标准吧,真正去推动这件难的事情」,张教授这个时候提出了一个掷地有声的方案。「有了标准,医生之间的差异可以被统一到同样的思路上来,算法专家和医生之间的 gap 也能够被弥合,真正在同样的框架下讨论问题。」
说干就干,在张秀兰教授的邀请下,新加坡国家眼科中心院长 Prof. Aung Tin、中山大学中山眼科中心的张少冲教授、魏雁涛教授、刘炳乾教授等业内知名专家放弃了难得的休息日,齐聚一起搭建标准框架,并组织标注医生与灵医智惠算法、产品团队进行闭门讨论。
业内首次,没有前人的经验可以借鉴;理念不同,很有可能鸡同鸭讲;一个既要让所有背景不同的医生认同,又要让医生和算法专家都懂的「好的标准」的诞生,注定是一个艰难而逐步磨合的过程。
「这里应该是 1DD,怎么能是 2DD 呢?」、「怎么能够把这个认定为出血,这个机器怎么可能认识?」、「血管怎么改变才叫屈膝?」、「什么叫做 kinking?」,「这个颜色是过曝还是苍白?」会议室的参考资料堆积如山,充满了这样激烈的讨论。
每天忙于推动眼科最顶尖科研、每天面对全球最疑难病例的专家们,面对这样一个「小小」的「看似不起眼」的标准,却亲自一笔一画和标注医生、算法团队一起,从最基本的定义、范围开始讨论和撰写。讨论持续到 2019 年 5 月份,《AI 眼底彩照标注》标准草稿终于有了雏形。与会医生和技术人员对草稿初稿进行了进一步完善,专家团队又对初稿展开多轮审核、校对和推敲,最终属于灵医智惠和中山眼科中心的《AI 眼底彩照标注》企业标准出炉,并在「中华医学会第二十四次全国眼科学术大会」上发布。
该标准针对糖尿病视网膜病变、青光眼、黄斑区病变、高风险近视性病变四大病种,从标注、转诊规则、标注流程等方方面面进行了详尽的定义。而且,对于「年龄相关性黄斑病变」的标注进行了延展并重新定义,将其扩大至「黄斑区病变」,以更符合实际应用中的转诊目的。此外,为了确保标准能够准确执行、被更多标注医生使用,专家组还针对每一种体征和描述,找到了多张「正例」和「负例」的参考图片作为附录,以直观的图片来配合文字描述,确保标准中的信息能准确传达。
「企业标准的正式发布,代表着灵医智惠每一张眼底彩照的标注,都严格遵照这个凝聚专家、医生、技术人员匠心的准绳,更规范、更高效地促进人工智能在眼科方面的临床研究和产业实践,而且我们也很愿意把这样一个标准分享给整个行业,去推动整个行业的规范化发展「,灵医智惠总经理黄艳说到。
二:使命担负升级
企业标准对于灵医智惠意义重大,但毕竟影响力有限,其他行业同仁依然困扰于数据质量低的问题。灵医智惠因而决心把企业标准推向更广阔的行业范围,让更多企业、医院、研究者受益于一个统一、规范的数据标注标准。第一步,就是将企业标准升级为团体标准。
回到故事的开头,在 9 月 21 号第二届全国眼科人工智能大会主会场现场,亚太青光眼协会理事、中山大学中山眼科中心临床研究中心主任张秀兰教授应邀作为启动会代表进行了致辞,中国信息通信研究院高级业务主管、WHO-ITU 医疗健康人工智能焦点组副主席许珊、中山大学中山眼科中心特需医疗中心主任张少冲教授、中国医药教育协会智能医学专委会副主任委员兼秘书长杨卫华、国家千人计划专家南方科技大学计算机科学与工程系刘江教授、华南理工大学计算中心主任谭明奎教授等多位监管、科研、医学界的专家共同出席启动仪式,对《AI 眼底彩照标注》从企业标准升级为团体标准进行了大力支持,并分别从自身所处领域出发,解读该事件的行业意义、社会意义。
专家解读标准意义「行业发展,标准先行,没有标准哪里来的好的数据,没有好的数据哪里来的真正可用好用的人工智能算法,中山眼科中心和灵医智惠愿意把我们的成果贡献出来,希望更多的人能用上,也希望更多的人参与进来」,张秀兰教授谈到。
WHO-ITU 医疗健康人工智能焦点组许珊副主席这样解读标准的意义:「标准化是促进行业健全发展的重要手段之一,从标准化角度来看,AI 医疗整个行业还是比较新的,能从数据质量的角度啃下这块硬骨头,标准化的启动意义非常重大。灵医智惠在眼科数据质控领域的先驱探索,将为其他医疗人工智能专科领域提供宝贵的经验,我们也愿意为该标准的国际化提供持续的助力。」
作为企业标准升级为团体标准的依托方,中国医药教育协会智能医学专委会秘书长杨卫华教授此次非常积极地参与到升级过程中来。杨教授曾参与多个医学数据库的建设工作,他对《AI 眼底彩照标注》标准给出了积极正面的评价。「标准在我看来是非常必要的,标准是所有 AI 研究合作方交流的通用专业语言,有了这个桥梁,彼此才能对 AI 研究起步有一致的看法。此次升级的团体标准,将会促进眼科 AI 科研的加速,并可能有助于推进眼科 AI 研究思路的升级」,这是对业内首个相关标准的进一步肯定和赞赏。
南方科技大学的刘江教授从科研角度谈了自己的看法:「我们其实七八年前在从事 AI 眼底筛查这个行业科研的时候,就发现了问题的困难。我分享一个小故事,那时候找了 650 个病患样本去标注杯盘的边界,但就是这么一个简简单单的事情,我们花了整整半年的时间,还没有达成完全的一致,真正标注出来已经是一年后了,那个时候就在想,要是有一个标准大家都去遵循,那得多好,所以今天非常高兴,看到灵医智惠推出这个标准,这样的大公司,从这么细致这么不起眼的点去入手,非常不容易」。
最后,孚视医疗 CEO 朱英林作为眼科 AI 行业应用的代表,说出了自己的看法。「我们是做糖网移动筛查的企业,每天有数千的样本量需要进行阅片,我们自己的医生根本不够,我也很担心我们的医生质量到底行不行,心里没底。这时候我们知道了灵医智惠在做 AI 眼底筛查标注标准的事情,我有一种解放的感觉,二话不说就选择加入。有了这样的标准,我对于真正有效的基层早筛工作心里更有底气了」。
不同于有些其他的发布,喧嚣过后赚个名声无人收场,这一次的眼底数据团体标准启动后,多位专家针对这个标准进行了专业评审,相信大家的心都是一样的,希望这个标准真真正正地能够让更多的人所接受。
有底气的不仅仅是孚视,短短两天时间,申请加入团体标准的机构就多达 50 多家,覆盖医院、体检机构、移动筛查公司、人工智能算法公司等。
三:从国内走向国际
除了国内板块的更快推广,标准的国际化也是一个重要命题。「从企标升级为团标,是在更大范围内取得了更多专家的共识,这不是一个结束,而是一个新的起点;从企标到团标,到行标,到国标,乃至国际标准的标准化路径下我们非常欢迎并期望看到更多的「中国声音」,在全球层面与更多国际专家一起共同推动行业健康有序发展。目前国际上特别关注算法评估与基准数据集的建立,而基准数据集的建立过程中中,绕不开的是数据质控标准,相信这次的眼底彩照标注就是一个很好的开端,填补相关领域的空白」。许珊表示。
AI 医疗是 AI 领域的火爆赛道之一,然而由于医疗固有的严谨属性,强大的 AI 技术不代表真正理解医疗场景,快速的落地应用也不一定切实满足医生的需求,许多公司野心勃勃而来,却发现 AI 与医疗的融合远比想象困难得多。灵医智惠始终秉持「循证 AI 赋能基层医疗」的愿景,坚信唯有脚踏实地、用一丝不苟的专业态度对待「医疗」的每一个环节、每一个要素,才能让 AI 医疗真正惠民。数据标注标准的建立,就是灵医智惠「用心治数、更懂医疗「的缩影之一。灵医智惠总经理黄艳表示,「这个标准更像是抛砖引玉,我们会继续推进和协助眼科多模态数据标准的建设,甚至会扩展至其他疾病领域的相关标准,打造贴合广泛的基层应用场景的产品,以专业严谨的态度去赋能整个行业的向前规范发展。」标准化之路漫漫,灵医智惠将继续悉心听取各界专家的建议和期望,不断推动标准规范的建设,以严谨、专业的态度携手各界同仁引领和完善未来的眼科 AI 医疗生态。
桥梁都已经铺好了,终点还会远吗?



