分类
约翰霍普金斯大学新闻

Connecting the dots

凯里·普里贝(Carey Priebe)曾与希望减轻外科护士压力的医院、试图改善乳房x线照片的癌症研究人员以及绘制脑细胞之间联系图谱的神经科学家合作。他展示了卫星是如何发现火星上的火山的,并为执法部门提供了新的工具来打击人口贩子、影子金融网络和公司诈骗。

这位身材健壮、身高6英尺3英寸(约1.83米)的怀特廷工程学院(Whiting School of Engineering)应用数学与统计学教授,有着中西部人的冷静态度,灰色的马尾和白色的山羊胡子,他声称自己在这些领域里没有任何专长。但他在所有这些领域都帮助过专业人士。

他的专长是利用统计学和图论分析人、神经元、组织等各种网络。图论是一门数学学科,可以把问题简化为对点和连接点的线的研究。

图论可以追溯到18世纪,在很长一段时间里,它的实际应用有限。在当今的网络世界,这种高度抽象的数学已经成为定义、预测和比较各种事物的强大工具。这一理论帮助了机器学习和人工智能的发展,推动了Facebook和谷歌等科技巨头的崛起。

虽然Priebe只是在他的领域工作的许多人中的一个,但是他的同事和以前的学生说,他的工作以其解决现实世界问题的严谨的理论方法脱颖而出。

他在《科学与自然》杂志上发表过文章,并在伦敦的艾伦·图灵研究所和剑桥的艾萨克·牛顿数学科学研究所获得过奖学金。他已经收到了美国国家科学基金会资助,美国国立卫生研究院、美国国防高级研究计划局和微软,曾与约翰霍普金斯大学应用物理实验室的网络问题以及与剑桥大学的一个团队理解大脑的连接。

虽然他是一名数学统计学家,但他说自己通常不与数字打交道。他拥有信息技术和计算统计学的博士学位,但他大部分时间都把编写计算机程序的重任留给别人。统计问题是用公式表示的,但他也没有花很多时间写公式。为什么他要这样做?他知道许多统计问题的答案,但没有正式地解决它们。

他获得过教学奖项,但他说他主要是以身作则。

“在像霍普金斯这样的研究型大学,真正选择好的问题是很重要的。”凯里Priebe

他说:“我很难向学生解释,也很难向他们传授我的工作,只能让他们坐在那里,看着我如何做事,看看我是如何挑问题的。”“在像霍普金斯这样的研究型大学,真正选择好的问题是很重要的。”

Priebe以前的一些学生说他是一个有创造力和一丝不苟的科学家,他们中的一些人已经在工业和学术界获得了有声望的工作。

克里斯托弗·怀特(Christopher White)于2009年获得了约翰·霍普金斯大学(Johns Hopkins university)的电子工程博士学位,现在领导着微软的一个科学家团队。他说,2020年他手下的四名夏季实习生负责扩大Priebe在网络安全、搜索引擎和组织管理等领域的工作。

“凯里所做的,就是为政府和企业创造解决重大问题的方法,而且他是用严格的数学方法来做的,”怀特说,他资助了Priebe的一些研究。“他真正关心的是工作是否严谨、可重复性和相关性。”

拥有实验心理学博士和心理语言学硕士学位的Glen Coppersmith从2004年在东北大学读研究生时就开始与Priebe共事,四年后他搬到巴尔的摩在约翰霍普金斯大学与Priebe共事。这两家公司仍在合作。

拥有一家分析心理和行为数据的公司的Coppersmith说:“他有一种美丽的方式来看待看起来非常不同的问题,并找到解决问题的共同途径。”“他会提出这些伟大的理论,而我则会在现实世界中检验它们。我仍然对他提出的问题感到惊讶。”

Carey Priebe

图片来源:约翰霍普金斯大学的Mike Ciesielski

在几年前访问他在爱荷华州的家乡时,Priebe试图向他的祖父解释他以什么为生。当时,他正在分析卫星图像,以帮助发现火星上的死火山。

“火星上的火山?”他的祖父怀疑地问。“你哥哥在肉类加工厂工作。你什么时候能找到一份真正的工作?”

解决难题

Priebe出生并成长于爱荷华州的农业小镇Lone Rock,目前人口为141人,他的祖父在那里拥有镇上唯一的现代市场和超级加油站。普里比在高中时自称是运动员,他曾梦想在美国橄榄球联盟(NFL)工作。

到了西点军校后,他参加了橄榄球队的选拔,结果被选为第7名。他几乎没有机会参加大学比赛,更不用说参加NFL了,于是他把注意力集中在了数学上,两年后为了奖学金转到了普渡大学。后来,他被位于圣地亚哥的海军研究与开发实验室雇佣,并支付了研究生院的学费。当时,海军支付了与计算机科学相关的研究的学费,但没有支付math
2的学费,这就是他最终获得计算统计学博士学位的原因。

“我记得开车兜风的时候,我哥哥对我说,计算机科学太简单了,数学太难了,所以我就打算这么做。”

Priebe说他在1994年到约翰霍普金斯大学担任应用数学与统计系的助理教授之前就担心自己不够优秀。约翰·霍普金斯在罗伦克备受尊敬,因为很久以前,当他的祖母到梅奥诊所寻求癌症治疗时,那里的医生把她转到了约翰·霍普金斯。

她没有去巴尔的摩,可能是因为预后不佳,在他出生前就死于疾病。但是Priebe说,在Lone Rock的很多人仍然非常尊重这个机构。

约翰霍普金斯仍然被认为是梅奥诊所处理疑难病例的地方,他说,“梅奥诊所是上帝检查的地方。”

安然的邮件

Priebe的一个重大项目始于2004年,当时向公众提供了一个包含60万份安然公司高管往来邮件的数据库,这家能源贸易巨头于2001年倒闭。

在当时美国历史上最大的公司破产案中,投资者损失了740亿美元,安然公司成为腐败和会计欺诈的象征。

科学家们怀疑,他们可以使用算法,从电子邮件交流模式和这些信息中使用的词语,了解一个组织是如何运作的。在此之前,没有可供研究的庞大的、真实的电子邮件流量档案。安然丑闻就是一个例子。

2001年春天,Priebe与约翰霍普金斯大学的研究科学家Youngser Park和军事研究与发展实验室的两名科学家一起绘制了员工之间的交流模式,以标记出“潜在的信息事件”。

该团队发现,在5月份的一个星期内,也就是公司倒闭前七个月,安然电子邮件的模式发生了改变。总体流量下降,高管开始通过下属的账户发送电子邮件,一些员工更改了电子邮件地址,这表明出了问题。

这项工作引起了轰动:《纽约时报》在2005年5月的一篇关于Priebe公司的报道中,发布了一张有关该公司数据的信息图表。在几个月后的一次会议上提交的一篇论文中,他和他的合著者写道,2001年5月的事件可能与几乎同时执行的内幕交易有关。

Carey Priebe at home on his horse farm

图片来源:约翰霍普金斯大学的Mike Ciesielski

检察官后来要求Priebe在安然案中作为专家证人出庭作证,但是他经常拒绝这样的提议并拒绝了。安然的两名高管最终被判犯有证券和电信欺诈罪,并被判入狱。

跟踪贩子

2010年代初,时任DARPA项目经理的克里斯托弗·怀特(Christopher White)在阿富汗与军方合作,致力于在对抗叛乱分子的战斗中使用数据。他打电话给Priebe,问他是否可以用他的统计技巧来追踪叛乱组织的资金流向。

怀特说,这项工作非常成功,Priebe的方法后来被美国财政部用于帮助识别和打击国际洗钱网络。

后来,怀特和他的团队开始研究破坏性交易的方法。性交易在每年1500亿美元的全球人口贩卖行业中占了很大一部分。从2013年开始的两年时间里,他们收集了6000万份在线广告、聊天、论坛和全球范围内的性服务邀约。

作为项目的一部分,白色让Priebe和约翰霍普金斯团队写一个算法来自动搜索31000的广告性服务,尝试确定涉嫌贩卖组织隐藏在数据,和等级组织的大小,越大的理论操作更有组织的和重要的。

在2015年发表于《应用统计学年鉴》(Annals of Applied Statistics)的一篇论文中,Priebe的团队描述了他们的算法如何搜索匹配电话号码和回邮地址的广告,并将它们分成不同的组。他们列出了一份最大的嫌疑人贩子的名单,标明了他们可能会被现场调查人员跟踪。

怀特说,由于Priebe的团队和其他人的工作,纽约地区检察官办公室在过去几年里将性交易的起诉案件从每年大约30起增加到了300起。他说,检察官利用这些数据来追查更大的案件,包括针对国际人贩子的案件。

跳舞的苍蝇

当Priebe在做反人口贩卖项目的时候,他和他以前的另一个学生,约翰斯·霍普金斯大学的神经科学家Joshua Vogelstein被要求用他们的专业知识来研究神经科学最大的问题之一:神经元的活动模式是如何产生行为的?

霍华德休斯医学研究所(Howard Hughes Medical Institute)的一个研究小组在果蝇幼虫的大脑中找到了大约200个控制学习和记忆的神经元,并在这些神经元中插入了基因,使它们在暴露在光线下时会发出信号。他们的目标是将特定的神经元与它们所触发的运动联系起来。

一台高分辨率摄像机记录了37,780只苍蝇对闪光的反应,但将由此产生的扭曲、转弯和抽搐分类成不同的、连贯的类别是一个巨大的挑战。因此,由玛塔·兹拉蒂克和阿尔伯特·卡多纳领导的休斯团队向约翰·霍普金斯大学的普里比、福格斯坦和帕克寻求帮助。

“凯里真的很擅长把事情简单化。拥有一个可能奏效的复杂想法是相对容易的。要想有一个简单的可行的想法就难得多了。”Joshua vogelstein助理教授,生物医学工程系

科学家们设计了一种算法,将幼虫的录像动作分为三大类和29种具体行为,包括弓着身子、摆动和转圈圈。当约翰·霍普金斯和休斯的研究成果于2014年发表在《科学》杂志上时,它成为了世界各地的头条新闻。路透社宣布:“飞行大脑‘图谱’打开了连接人类神经元与行为的大门。”

2017年,Priebe、Vogelstein和zlti – cardona实验室(现在在剑桥大学)在《自然》杂志上发表了一篇论文,提出了第一个精细的幼虫大脑中200个学习和记忆神经元的接线图。随后,约翰霍普金斯大学的研究人员帮助绘制了果蝇幼虫大脑2400个神经元的突触、轴突和树突之间的连接图。他们希望在今年的某个时候发表这项研究。

项目的一部分包括将幼体大脑一侧的每个神经元与另一侧的孪生神经元进行匹配。大多数苍蝇幼虫的脑细胞被认为有一个双胞胎;匹配它们可以帮助回答一些问题,比如左右脑有多少自然变化。但直到最近,配对还必须手工完成,而且进展缓慢。于是Priebe和Vogelstein开始寻找捷径。

他们决定使用一个开源的计算机程序来生成一个潜在匹配的粗略列表,然后通过他们开发的神经匹配算法来过滤结果。早期的测试很有希望。Priebe说,这项技术可以将匹配神经元所需的时间从几周或几个月缩短到几个小时。

生物医学工程助理教授Vogelstein称Priebe为“我的导师”。

他说:“当我们在一起工作时,他为我们的合作真正增加的一个价值是,我可以发表一些手拉手的声明,然后我们一起研究如何使它们真正正式、精确、清晰和可证明。”“凯里真的很擅长把事情简单化。拥有一个可能奏效的复杂想法是相对容易的。要想有一个简单的可行的想法就难得多了。”

还债的时候了

如今,Priebe和他的妻子Terresa在霍姆伍德校园附近有一所房子,在弗吉尼亚州北部有一个农场,他们在那里养马,收养流浪狗和流浪猫。尽管在2012年的一次骑行事故中摔断了脊背,Priebe还是参加马拉松和骑马。跌倒后,他在医院住了一晚,在支架上住了六个月。

虽然他使用电子邮件,但他拒绝加入Facebook、Twitter或其他社交媒体,也没有手机。他说,他知道利用一个人的数据踪迹来建立一个人的详细图像是多么容易。

虽然公众对政府监控有很多担忧,Priebe说他更担心的是互联网巨头。他说:“不难想象,哪些行业正在收集,他们可能会用收集到的东西来做什么。”

Terresa Priebe经营着一家旅行社,负责非洲等地的狩猎和文化之旅。她每年组织一次前往坦桑尼亚的医疗考察团,帮助向农村社区提供所需的医疗服务。

她抚养了他们的双胞胎,Priebe说,而他为了在约翰霍普金斯大学获得终身教职而在晚上和周末工作。现在他正在尽最大努力来补偿她。“从那以后,我一直在报答她。”

Priebe说他对他的一位高中老师Rochelle Scott感到“一种特别的感激之情”,这个老师意识到他在数学上可以比他的农村小高中走得更远。所以她买了一些数学书,设立了辅导课程。

“她试图为我开设一门微积分课程,我想她也不懂微积分,所以她也在学习,”他说。他不知道为什么,但不知怎的,“她决定也许我应该接触那种东西。”

Priebe永远不会忘记她为他所做的一切。在获得博士学位后,Priebe从Lone Rock开了7英里的车回到她在人口505的爱荷华州Burt的家,并送给了她一本。

回顾自己的职业生涯,他似乎对自己所取得的成就以及有多少人帮助他实现了这一目标感到惊讶。

“我认为我的生活是一次又一次幸运的突破。”

本文最初发表在JHU Engineering杂志上。

在科学+技术

标签系,统计,应用数学

新闻旨在传播有益信息,英文原版地址:https://hub.jhu.edu/2020/07/22/carey-priebe-connects-the-dots/