Generative artificial intelligence (GenAI) like Large Language Model (LLM) is increasingly integrated into digital platforms to enhance information access, deliver personalized experiences, and improve matching efficiency. However, these algorithmic advancements rely heavily on large-scale user data, creating a fundamental tension between information assurance-the protection, integrity, and responsible use of privacy data-and artificial intelligence-the learning capacity and predictive accuracy of models. We examine this assurance-intelligence trade-off in the context of LinkedIn, leveraging a regulatory intervention that suspended the use of user data for model training in Hong Kong. Using large-scale employment and job posting data from Revelio Labs and a Difference-in-Differences design, we show that restricting data use significantly reduced GenAI efficiency, leading to lower matching rates, higher employee turnover, and heightened labor market frictions. These effects were especially pronounced for small and fast-growing firms that rely heavily on AI for talent acquisition. Our findings reveal the unintended efficiency costs of well-intentioned data governance and highlight that information assurance, while essential for trust, can undermine intelligence-driven efficiency when misaligned with AI system design. This study contributes to emerging research on AI governance and digital platform by theorizing data assurance as an institutional complement-and potential constraint-to GenAI efficacy in data-intensive environments.


翻译:以大型语言模型(LLM)为代表的生成式人工智能(GenAI)正日益融入数字平台,以提升信息可及性、提供个性化体验并改善匹配效率。然而,这些算法进步严重依赖大规模用户数据,导致信息保障(即隐私数据的保护、完整性与负责任使用)与人工智能(即模型的学习能力与预测准确性)之间产生根本性张力。本研究以LinkedIn为背景,借助香港地区暂停使用用户数据进行模型训练的监管干预,探讨这种保障与智能的权衡。通过使用Revelio Labs的大规模雇佣与职位发布数据,并采用双重差分设计,我们发现限制数据使用显著降低了生成式人工智能的效率,导致匹配率下降、员工流失率上升以及劳动力市场摩擦加剧。这些效应对高度依赖人工智能进行人才招聘的小型及快速增长企业尤为明显。我们的研究揭示了善意数据治理带来的非预期效率成本,并强调信息保障虽对建立信任至关重要,但若与人工智能系统设计不匹配,可能削弱智能驱动的效率。本研究通过将数据保障理论化为数据密集型环境中生成式人工智能效能的制度性补充(及潜在约束),为人工智能治理与数字平台的新兴研究领域作出贡献。

0
下载
关闭预览

相关内容

数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。数据治理是一种数据管理概念,涉及使组织能够确保在数据的整个生命周期中存在高数据质量的能力。一个数据管家是确保数据治理流程遵循,指导执行,并建议改进数据治理流程的作用。
多智能体协作机制:大语言模型综述
专知会员服务
77+阅读 · 1月14日
专知会员服务
112+阅读 · 2020年6月26日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员