全文共字,预计学习时长16分钟
图源:unsplash人工智能是这个时代的箴言,技术专家、学者、记者和风险投资家都在歌颂AI。不过,就像一些从专业学术领域延伸到日常生活中的短语一样,“人工智能”一词的使用也引起巨大的争议。
但这并不是通常情况中由于“大众无法理解科学家”而造成的争议,其实,科学家和大众一样感到困惑。一想到这个时代正在兴起一种可与人类匹敌的数字智能,所有人都很兴奋,但同时也会感到害怕,这会分散我们的注意力。
这是当今时代背景下一个特殊的故事,它涉及到人、计算机、数据和生与死的决定,并非人们对硅基智能的幻想。
14年前,笔者的亲戚怀孕后在做超声波检查。房间里的遗传学家指着胎儿心脏周围的一些白点:“这些都是唐氏综合症的迹象,而胎儿患病的风险已达二十分之一。”接着,她说可以通过羊膜穿刺术发现胎儿是否真的有先天遗传变异的唐氏综合症。但是羊膜穿刺术是有风险的,在手术中胎儿死亡率大约是1/。
作为一名统计学家,笔者很想弄清楚这些数字的根据和来源。十年前,英国做过一项统计研究,这些代表钙积累的白点,实际上被认定是唐氏综合症的预测因子。但同时我也发现,我们测试的成像系统每平方英寸像素比英国分析使用的系统多几百个。
我告诉遗传学家,我认为这些白点可能是假阳性——它们只是“白噪音”。她说:“这就是几年前唐氏综合症的诊断激增的原因,那时新电脑刚刚到货。”
他们最终没有做羊膜穿刺术,几个月后,一个健康的女孩出生了。但这件事让我很惶恐——粗略估计,全世界有几千人在同一天接受了这个诊断,其中许多人选择了羊膜穿刺,许多婴儿不必要地死去。这种情况每天都在发生,直到有一天bug被修复。
这个故事暴露的问题与我个人的医疗保健无关——这关乎一个医疗系统,通过评估不同地点和时间的变量和结果,进行统计分析,并利用其他地方和不同时间的研究结果。
这样的问题不仅和分析数据本身有关,还和研究数据库研究人员