人工智能与大数据:要让马儿跑得好,就要把草吃得饱
时间:2019-11-20 12:43:31 热度:37.1℃ 作者:网络
我“小济医生”作为人工智能机器人,经常会遇到别人问我:”你怎么这么厉害呀?乳腺B超图片里的问题,肿瘤啊结节啊什么的,你都能找到,还能分级,你这本事怎么来的?”
我们人工智能(AI)这些年确实很火爆,国家出了很多力度很大的政策,如支持用人工智能进行乳腺癌筛查等,商界往里投的钱也巨多,这个领域是独角兽的一大产地。人工智能的“能”再厉害,它的“智”也不是从天而降的,而是源于大数据。可以说,是大数据成就了这一轮人工智能热潮。
从功能和用途角度看,最近几年人工智能在自然语言处理和机器视觉这两个领域取得了突破性进展。自然语言处理,主要是指各种语言的相互翻译,例如英译汉、汉译英、日语翻译英语、英语翻译日语等等。小伙伴们现在出国旅游,已经可以不必担心牛头不对马嘴的语言障碍,只要下载个语言翻译APP,就能解决大部分的沟通问题。这些APP就是机器翻译的典型案例,其反应的迅速而准确的程度,在5年前还是不可想象的。
机器视觉应用的例子很多,如自动驾驶技术,能够像人类一样识别出图像中的障碍物、行人、车辆乃至黄线斑马线等,然后执行减速、避让等操作。在医学上,各种相关的应用也在不断出现,让机器去判别医疗影像中的各种疾病问题,造福于人类健康。
那为什么现在的人工智能离不开大数据呢?参加过高考、中考的小伙伴都知道,要想取得高分,是要海量刷题的。当翻译的要想提高自己的水平,就得多听多说多练,没有谁能一觉醒来就能获得神功。英汉翻译软件就是以千万计的英汉句子文章实例为基础,不断地进行海量的数据训练,数据越多,练得越勤,机器翻译软件就会越来越准。
相比之下,机器视觉的难度系数更大,毕竟语言数据还是结构性的,技术上比较好处理,而世间万物外形千差万别,其影像是在数据上是非结构性的,差异很大。电脑又不能象人脑那样天生就能对采样进行归纳演绎,找共性作判断,就更得拼命刷练习。在我“小济医生”的专业领域里,除了要能识别良性和恶性肿瘤,还要弄清楚乳腺里结节增生等问题,把它们区分开来,所以我必须在练习中玩命地看,把自己神经网络系统练好。
人工智能虽然属于典型的技术密集型,但在准备草料的起步阶段,它却是劳动密集型的,高大上的逼格并不突出。要研发一个人工智能系统,一开始就要聘用大量的人手来对需要辨别的对象作标注,如告诉电脑,这红的是苹果,绿的也是苹果,大的是,小的也是……
我小济所处理的医疗影像数据,专业难度就更高了,毕竟主要针对的是肿瘤,而不是小学生都能标注的饺子云吞,出了事可不是闹着玩的。在研发我的尚医云团队里,就有专门的影像医师队伍来处理数以万计的超声图像,把里头的各种乳腺问题标出来,供我学习;另外,在我训练的过程中,他们还对原来系统中不足的地方作调整,优化算法。现在,我小济对乳腺癌判别的准确率已经和专家不相上下了。
另外,我在工作中,处理的不是静态的图片,而是动态视频,等于每秒看几十张图片 。相较于抽样阅图,这对患者的检查更彻底,效果更理想。当然,对于研发人员来说,这涉及更复杂的数据传输速度和计算速度的问题,难度又增大了。为了女性的健康,我们的程序猿烧更多的脑,都是应该的。
将来除了乳腺癌,“小济医生”我还会往围绕着超声设备,研发针对更多癌症的筛查模型,研如甲状腺等。人工智能就是为了让人类生活变得更健康更幸福而服务的,小济会为此不懈努力!
助医者 济苍生
We serve those who heal the world