从中国小镇走到硅谷:一位 IBM 研究员的成长故事

2017 年 8 月 12 日 IBM中国 Ellie Burns 编辑

本文译自CBR Ellie Burns (文中简称EB)对IBM研究员李蕴瑶(文中简称YL)的访谈,讲述了李蕴瑶从我国贵州的一个小城镇走到硅谷的成长故事。原文编辑Ellie Burns。本文根据YL本人的建议略有修改。


旧金山圣何塞的IBM Almaden实验室


EB问

YL答

Q

EB:能否向读者介绍一下您的背景——您是如何开始对技术产生兴趣的?

YL:虽然目前我从事的是人工智能领域与自然语言处理 (NLP)相关的工作,但在上大学之前,我从未见到过真正的计算机。上世纪 80 年代,我出生在中国西南部的一个小城镇——金沙县城关镇,对于当时的我而言,计算机这个术语只是从电视和报纸上得知的一个抽象概念。


我是我们县置县五十多年以来第一个被远在 2000 公里之外的北京清华大学录取的高考生。当年整个贵州省参加高考的考生有 20多万,我的高考成绩位列全省考生第三,应届生第一。受当时报纸和科幻小说的影响,我选择攻读了清华大学的自动化与经济学双学位。我希望通过综合学习计算机科学、电子工程和经济学这三门学科,掌握必要的知识和工具,帮助实现大量人工操作的自动化,让人们的生活变得更美好。


2017年6月15日,李蕴瑶代表AWING(Almaden女性权益小组)

在Laura Haas退休晚宴上,向她赠送了一幅集体签名海报。

Q

EB:您在美国是如何进一步学习并进行技术研究的?

YL:在我发现计算机拥有改变世界的力量之后,我决定在美国的密歇根大学攻读计算机科学博士学位,当时我的导师是 H. V. Jagadish 博士,他在数据库可用性研究领域非常有名。在校期间,我还开始了我的实习生涯继续以前的双重生活,与一些 MBA 学生一同参加了商业化学校的科研成果的项目。通过其中一个项目,我们帮助实现了骨组织培养专利技术的商业化,该技术有助于加快骨质疏松症等疾病治疗药物的发现过程;在另一个项目中,我们参与商业化了一项移动技术,用来帮助改善课堂上师生的互动。


到目前为止,我已经在 IBM 研究院工作了整整10 年的时间,我负责领导 ScalableNLP (规模化自然语言处理)团队(也称为 SNap)。


李蕴瑶童年的照片。她现在是一名位于硅谷的IBM Almaden研究中心的研究员。


Q

EB:自然语言处理研究员主要负责哪些方面的工作?

YL:我们现在正在攻克的一个关键课题是信息提取 (IE),也就是从非结构化数据或半结构化数据中提取结构化信息。通过这种技术,机器将能够自动读取并构造知识库,而这种知识库正是包括 IBM Watson 在内的许多认知系统的基石。


在我所从事的专业领域中,一般有两种信息提取的方法。在学术研究领域,机器学习方法非常流行。不过,这种方法通常需要一个由带标签的数据集构成的大型集合,而在实际中通常很难获得这种数据集。此外,已学习的模型通常都是“黑盒子”,其内部工作机制通常都处于隐藏状态,因此难以理解和解释。


另一种信息提取的方法是使用声明式性语言来开发算法。在商业市场中,这种方法非常流行,因为它需要的是没有标签的数据,而且所得的程序非常容易理解。不过,这种方法非常耗时,需要很高的人工投入。


我们团队的研究理念是,唯有融合这两种方法,取其精华,才能开发出最好的解决方案,比如说 SystemT,它就是两种方法融合后的产物,是我们最新的自然语言处理引擎,目前有 10 多款 IBM 的产品和服务都采用的是这种引擎。

Q

EB:你们近期在研究什么项目?

YL:最近我们构建了 SEER,该工具能够学习如何根据较少数量的用户指定示例,以虚拟说明性提取程序的形式构建模型。借助该工具,用户可以开发高质量的 NLP 算法,这些算法具有透明性和可解释性,而且仅需要最少量的训练即可。举例来说,SEER 可以从参考文献中识别教育背景和从业经历,还可以识别濒危物种的自然习惯。如此一来,政府便有可能更好地了解如何针对紧俏职位开展公民教育,而相关机构也可以更好地保护野生动物赖以生存的自然环境。


接下来,我和我的团队希望将 SEER 开放给 IBM 开发人员,希望从移动应用到下一代 Watson API 领域为他们提供全面的帮助。

Q

EB:从贵州的一个小城镇走到硅谷,是一个非常励志的经历—— 您希望其他年轻人能够从中得到哪些启发?

YL:硅谷是全球的技术圣地,也是我一直以来的梦想;我感到骄傲的是,我能够不懈地追求这个梦想,最终能够在硅谷释放热情,使 STEM 领域更加多样化。我有幸参与了“走进非洲 (Leading to Africa)”等实习项目,正是由于这些经历,使我有机会给妇女及少数民族人群提供实际的指导。


由于我在 IBM 所从事的研究和工作的原因,我经常为北加州妇女联络网定期组织一些技术访谈和活动,这是专门针对 IBM 技术女性成立的一个社区。2013 年,我有幸加入了 MentorNet Mentor-Protégé Council,同时今年开始,我被邀请加入了圣何塞州立大学 计算机系本科外部顾问委员会。

Q

EB:对于同样来自小城镇但怀着同样梦想的其他年轻人,您对他们有什么建议?

YL:我分享自己这些经历只是想鼓励大家,特别是年轻人,去勇敢追逐自己的梦想。即便过程也许不会一帆风顺,但只要坚持不懈,一定会得到回报。综合学习两门似乎截然不同的学科往往会带来意想不到的成功,我自己就是一个活生生的例子。当然,如果在超出自己背景的专业领域内有所建树,也非常不错。总之,固有的出身和背景并不能决定未来。美好的未来还是需要我们自己去努力争取。


登录查看更多
0

相关内容

IBM 即国际商业机器公司(International Business Machines Corporation)。总部在纽约州阿蒙克市,1911年创立于美国,是全球最大的信息技术和业务解决方案公司。 目前拥有全球雇员 30多万人,业务遍及160多个国家和地区。
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
187+阅读 · 2020年3月31日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
【财富空间】一个人真正的资本是什么
产业智能官
6+阅读 · 2018年3月16日
秒杀99%大学生!中国最牛高校学霸PK,简历吓坏网友...
人工智能机器人联盟
7+阅读 · 2017年11月12日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Arxiv
8+阅读 · 2018年7月12日
VIP会员
Top
微信扫码咨询专知VIP会员