我在斯坦福做的科研demo…要被导师带去美国国会演讲？

2022 年 5 月 27 日 夕小瑶的卖萌屋

文 | Jazon
编 | 小戏

大家好，我是 Jazon。时光荏苒，一转眼我已经快要从 Stanford CS 系毕业了。今年7月，我将开始谷歌总部工作，短期内会在硅谷定居，湾区的朋友们欢迎约起呀。

笔者去年写过一篇文章，分享了我研一时做的科研项目情况（推荐系统相关）。而进入研二，我于 2021 年 9 月加入了一个叫做“平台中间件”的新项目，做了半年。这是一个以社会变革为目标的，硬核的 NLP 应用项目，具体如何，且听我慢慢道来：

背景：互联网平台与舆论仲裁

十六年前（2006年），Facebook 推出了 News Feed，这是在社交平台历史上的一个开创性的发明。News Feed 就是根据用户的喜好，在首页给用户展示推荐的帖子，用户可以无限下滑，查看更多帖子。

后来这个“Feed”的模式被各种平台采用，从推特主页到各大新闻网站，几乎遍布我们生活的方方面面。然而，这个模式也带来了一些问题，其中包括：

（1）对于社会、政治类一些有争议的话题，是否应该由平台作为仲裁者，去审查过激言论、过滤不实信息，避免不好的帖子出现在用户的 Feed 里呢？

（2）平台拥有了影响舆论的权力，怎么确保平台不滥用这个权力，在 Feed 里给人们推送特定观点的帖子呢？

目标：变革人们接受信息的方式

针对上面的问题，我们提出“平台中间件”（Platform Middleware）的概念，其要义是——把 News Feed 的推荐算法去中心化，交给第三方去做。在目前的设想里，“中间件”的功能主要有：

（1）辨别敏感言论，并对这些帖子标记“左倾”或“右倾”分数、“争议性”分数；如果帖子包含仇恨言论等，可以选择不显示该帖子；

（2）对平台推荐的帖子，进行重新排名。

“中间件”提供商会有很多，可能各自有自己的政治立场，用户可以自行选择使用哪个“中间件”的服务。这样一来，可以帮助实现舆论仲裁、信息传播的去中心化。

技术：强大的OpenAI API

前面提到，这个项目需要辨认有争议的言论、辨别言论是左倾还是右倾，涉及到 NLP 算法。不过我们自己不做建模，而是全部使用 OpenAI 的 GPT-3，完成 NLP 相关任务。

OpenAI 为他们的 GPT-3 模型提供了公开的 API（https://beta.openai.com/docs/ ），可以付费使用。他们提供的 GPT-3 模型家族里，目前有 4 个“engine”可用，最好的 engine 是 Davinci，它最强大，不过也最慢、价格最贵。而最基础的 engine 是 Ada。

对于辨别文本“左倾还是右倾”的任务，我们主要试了下面 2 个 Endpoints：

（1）Classification 文本分类：给定一个帖子、两个 Labels “Left” 和 “Right”，返回两个 Labels 对应的匹配度分数；

（2）Completion 文本完成：给定一段文字，前面是一些例句，最后附上要分类的帖子文本，让 AI 完成文本，给出 “Left” 还是 “Right” 的判断。

对比效果之后，我们采用了 Completion Endpoint，用文本完成的方式来做分类。它的准确率高得吓人，也让我体会到了 GPT-3 的强大。

我们还尝试、使用了其他公开的 API，比如用“Perspective API”来辨认仇恨言论等等。

导师：历史性大牛

项目的指导老师 Ashish Goel，是 Stanford 计算机系博士毕业，不过现在是管理工程系下的教授，十分全能。他之前在 Twitter 兼职做过科学家，负责了他们的推荐算法。

这个项目 Idea 的来源，是美国政治理论家福山（Francis Fukuyama），也是 Stanford 的教授。关注历史政治的朋友们可能知道，苏联倒台后，福山教授在 1992 年提出了著名的“历史终结论”，认为人类社会已经达到了终极组织形态，即西式民主，以后不会再有根本性变化。

这个理论当然很有争议，不过这不是本文的讨论范畴，也不影响福山教授是位大牛的事实。我17岁时就在网上读到过他，没想到在 Stanford 竟然可以和这样能载入史册的人物共事，真是神奇。

思考：科研不只技术的创新

在加入项目初期，我在写代码之外，也需要花时间主动了解 Project 的大格局、大目标，不然连自己应该干啥都不知道，容易做了一些事结果发现不是老师想要的。

11 月初，Stanford 搞了个 HAI（Human-centered AI）大会，主题是“Radical Policies for AI”（AI 的颠覆性政策）。Ashish 老师在会上发言，进一步阐述了我们的项目。我听着听着，突然意识到，这个科研项目，和我以往做的科研有本质的区别：

我们的最终目标是引领社会变革，而现在要做的是证明“技术可行性”。换句话说，主要目的不是创造新技术，而是运用已有技术，实现社会层面的改变。

我想，之前我做过的科研大都关注在技术、方法的创新上，而很少认真思考这些新技术能怎样在微观、宏观上引导未来，改变社会，这种引导与改变从微观上讲是解决小众的需求，而从宏观上看就是影响大众的生活方式。

当然，如何预测、把控未来，本就是一个无解的问题，但真正的大神还是能做一些基本的判断的。Ashish 不是空想家，在他的“中间件”设计蓝图里：

（1）考虑了加进“中间件”之后，如何维护社交平台现有的商业模式；

（2）阐述了如果要实现设想，国会和政策制定者应该怎么做；

（3）表示这个计划未来一定会调整、进化。

成果：为国会演说做准备

2022 年 2 月，我们搭好了模拟“中间件”的服务器和前端插件，初步做成了产品。经过各种 Presentation，我们不断汲取大家的反馈，不断调整设计、打磨效果，经过一次次迭代，终于完成了可行性演示。

未来，福山教授有计划带着我们做的 Demo，去往国会，向美国的最高立法者们演说，真正改变美国互联网行业以及社交平台运行的模式。

3 月，项目阶段性收尾，老师请组员（我和我的 MSCS 同学 Cassie）吃了饭。至此，我在 Stanford 的科研生活也就结束了。在这里，我在技术、团队合作等等方面，都学到了太多太多，一路走来，也对社会做出了一点属于自己的小小贡献。

最后，感谢大家的阅读：)

萌屋作者：Jazon

来自南京，斯坦福MSCS（计算机硕士）在读，2022年6月毕业后在Google总部工作。爱安静地探索宇宙的奥秘，也爱和朋友桌游、运动。梦想养猫，花花与三猫的视频平均每个看过20+遍。相信AI虽然有趣，但短期内在美国职场生存，还是要靠丰富的开发技能。

作品推荐

人在斯坦福，刚上CS224n

谢撩，人在斯坦福打SoTA