中国科学院院士张钹:利用深度学习解决实际问题通常不需要专业知识

作者:王晓行 2017-07-10 14:00

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}
企业数据由提供支持
查看

张钹,出生于1935年,福建福清人,计算机科学与技术专家。中国科学院院士,教授,博士生导师。曾任计算机系学术委员会主任,智能技术与系统国家重点实验室主任,中国自动化学会机器人专业委员会副主任及智能控制专业委员会主任。

主要从事人工智能理论、人工神经网络、遗传算法、分形和小波等理论研究;以及把上述理论应用于模式识别、知识工程、智能机器人与智能控制等领域的应用技术研究。


2017年7月3日,“清华大学未来医学影像高峰论坛”在清华大学召开,中国科学院院士张钹以《人工智能与医学影像识别》为题发表了演讲,本文对其精彩内容进行了整编。

 

IMG_1794 (2).JPG

张钹


人工智能并没有传说中那么神奇。不仅代替不了医生,即使在无人驾驶领域也还有很长的路要走。这不是说,我反对搞无人车,而是说要把实情告诉大众:在复杂路况下目前的无人车还不可能无人。大家都知道,美国、德国等国家和地区,法律上规定,自动驾驶车上马路必须要有一个司机。


这说明人工智能虽然可以帮助人类解决很多问题,但是面对复杂的环境,它还有待进步。在医学影像领域人工智能又能解决什么样的问题,哪些问题暂时还解决不了。


深度学习知其然而不知其所以然


想了解人工智能就要先知道深度学习。早在六七十年代,就出现所谓的人工神经网络(实际是一种算法)。我们从图像和语音里头抽取出它的特征,用这个算法将这些特征进行分类,或者把它映射到某一个空间去。


这个算法开始没有得到很大的应用,因为你必须要对应用到的问题有深入的理解,才能知道抽取什么样的特点,也就是说你必须具有一定的应用领域的专业知识,才能够做好这个事。后来这个算法发展成为大家熟知的深度学习。所谓的深度学习只是把神经网络的层次加深了,研究人员没有想到的是,这么一个“加深”,算法却有了“天翻地覆”的变化。


这个变化是什么?首先是性能的提高出乎大家的意料。同样的网络,只是把它的层次数目增加了,图像与语音识别的性能就可以提高两位数的百分点


另外,深度网络能自动提取特征,不需人工参与。我们过去研究图像或语音,必须对它有一定的认识,即知其然又知其所以然。比如我们识别一个人物张三,以前要人工提取特征,我们需要告诉机器“张三”的脸长得怎么样,他的特征是什么。可是我们说不清楚我们是如何识别张三的,因此难以确定提取何种特征。


有了深度学习,这个问题就迎刃而解了,只要提供足够多的张三的照片就可以了,因为机器可以从学习训练中自动提取所需的特征。因此有了深度学习就可以解决一大堆“知其然而不知其所以然”的问题将深度学习应用到某个领域不需要研究人员掌握许多该领域的专业知识。这既是深度学习的优点也是很大的缺点


 我们先讲它的优点,不需要专业知识,因此什么人都可以使用深度学习,只要将数据输给深度网络,它会自动抽取特征并进行识别。这就使深度学习得到广泛的应用,有三件事对大众的影响很大。一个是图像识别,在IMAGENET上微软的图像识别软件性能超过人类。第二个是语音识别,百度的单句语音识别软件的正确率超过人类。


还有一个大家都知道的是阿法尔狗打败人类围棋冠军。过去计算机超过人的地方有很多,比如数值计算,大家都认为理所当然,因为计算机就是做计算的嘛。但是在语音、图像识别、下棋等方面超过人类,却给大家带来很大的震动。因为这三件事都是人类最拿手的,没想到却被机器超过去。原因何在?我想源自以下三个方面:数据、计算资源和人工智能算法。


高质量数据是基础


我们先讲数据。刚才讲深度学习是一种大众工具,任何人只要掌握了高质量和大数量的数据,就有可能做出比别人好的成果。举一个例子,我有一位博士生创业,利用医学图像诊断疾病,特别是糖网病(据动脉网了解,该公司是致远慧图,公司CTO丁大勇的导师是张钹)。


他跟四十几位医生合作标注了近四十万的图像数据。因为数据量大,所以他做的工作就比别人好。一般情况下糖网检查结果区分为无糖尿病视网膜病变、轻度无需后续深度检查治疗、需后续深度检查治疗这三个级别。


致远慧图按照糖网的国际分级分为无糖尿病视网膜病变、轻度、中度、重度NPDR、PDR这5个类别,清楚的标明患者眼底的微血管瘤、视网膜内出血、硬渗出等病变,使得检查结果更具针对性。区分有无糖网病,是否需要做后续的深度检查,这个工作好做,但是要想细分为5个等级,或者把病灶标注出来,就不好做了。


重要的困难是深度学习如何与专业知识结合


深度学习算法一般无需专业知识,只能够通过标注来把专业知识传递给算法,而标注只是说明被检查者有没有病,只是呈现“是非”结果。最多标注一下病灶位置,无法告诉算法病变的原因等专业知识。怎样解决这个问题?


动脉网对此采访了致远慧图CEO孙宇辉,他表示为了将系统做的更加符合医生的临床需求,他们也在不断的恶补医学眼底的知识,这样在和医学专家交流的时候才可以提出有价值的问题


因为专家对于某些基础问题,会直接跳过,不是因为不重要,而是太简单。如果此时自己不知道这些知识,就容易遗漏。同样的专家有时候也会了解一些IT的知识。归根结底是一个学科交融的需要。


第二个例子,今年的数据科学杯竞赛奖金很高,一百万美金,第一名是50万美金。这次比赛一共有1700个团队参加,主办方给出的医学影像,包括1600个训练样本和500个测试样本,全部没有标注,目标是判定测试集中哪些是肺癌样本。最后是由清华三名博士生组成的团队取到了第一名。其中重要的原因是他们曾经在医学院接触过神经科学,对医学图像有高度的兴趣,他们把算法与应用场景密切地结合起来。


 缺乏专业知识会给深度学习带来怎样的后果?应用深度学习解决医学图像识别(或其他医学问题)都面临一个重要问题,高质量的数据总是缺少的,比如说,用质量很高的眼底图像训练眼底糖网病筛查系统。


但现实临床中的眼低图像却参差不齐,其结果是高质量的眼底图像可以识别,低质量的就不行。因为深度学习中没有专业知识,其结果是不可解释的,因此医生并不知道系统哪里出了问题,技术人员也会一头雾水。这就提出一个问题,即深度学习如何与专业知识结合,以达到可解释与可理解的要求,这是今后进一步要做的工作。


清华大学未来医学影像高峰论坛是由清华大学医学院、清华大学清华-青岛数据科学研究院主办,清华大学医学院未来医学影像实验室承办,汇聚人工智能领域的知名学者、顶级医院临床科学家、数据科学领域专家、医学影像技术领域翘楚共同探讨医学影像、人工智能与大数据等技术在临床医学研究中的热点问题和未来发展方向。


论坛中,清华大学医学院未来医学影像实验室启动“AI+MI”项目,联合顶尖临床医院,整合医学影像资源建立数据库,结合清华大学深厚的人工智能算法、高性能计算、大规模存储的工程资源,建立心脑血管疾病、神经退行性疾病和呼吸系统疾病的基于人工智能的医学影像研究,期待更多合作伙伴的加入。


如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。


注:文中如果涉及企业数据,均由受访者向分析师提供并确认。如果您有资源对接,联系报道项目,可以点击链接填写基本信息,我们将尽快与您联系。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

分享

微信扫描二维码分享文章

企业
对接
商务
合作
用户
反馈