Novel deep learning architectures are increasingly being applied to biological data, including genetic sequences. These models, referred to as genomic language mod- els (gLMs), have demonstrated impressive predictive and generative capabilities, raising concerns that such models may also enable misuse, for instance via the generation of genomes for human-infecting viruses. These concerns have catalyzed calls for risk mitigation measures. The de facto mitigation of choice is filtering of pretraining data (i.e., removing viral genomic sequences from training datasets) in order to limit gLM performance on virus-related tasks. However, it is not currently known how robust this approach is for securing open-source models that can be fine-tuned using sensitive pathogen data. Here, we evaluate a state-of-the-art gLM, Evo 2, and perform fine-tuning using sequences from 110 harmful human-infecting viruses to assess the rescue of misuse-relevant predictive capabilities. The fine- tuned model exhibited reduced perplexity on unseen viral sequences relative to 1) the pretrained model and 2) a version fine-tuned on bacteriophage sequences. The model fine-tuned on human-infecting viruses also identified immune escape variants from SARS-CoV-2 (achieving an AUROC of 0.6), despite having no expo- sure to SARS-CoV-2 sequences during fine-tuning. This work demonstrates that data exclusion might be circumvented by fine-tuning approaches that can, to some degree, rescue misuse-relevant capabilities of gLMs. We highlight the need for safety frameworks for gLMs and outline further work needed on evaluations and mitigation measures to enable the safe deployment of gLMs.


翻译:新型深度学习架构正日益应用于生物数据领域,包括基因序列。这些被称为基因组语言模型(gLMs)的模型已展现出卓越的预测与生成能力,引发了对此类模型可能被滥用的担忧,例如通过生成人类感染病毒的基因组。这些担忧催生了对风险缓解措施的呼吁。当前事实上的缓解方案是对预训练数据进行过滤(即从训练数据集中移除病毒基因组序列),以限制gLM在病毒相关任务上的性能。然而,对于可通过敏感病原体数据微调的开源模型,该方法的安全防护鲁棒性尚未明确。本研究评估了先进gLM模型Evo 2,并利用110种有害人类感染病毒的序列进行微调,以评估滥用相关预测能力的恢复情况。相较于:1)预训练模型;2)使用噬菌体序列微调的版本,经病毒微调的模型在未见病毒序列上表现出更低的困惑度。尽管微调过程中未接触SARS-CoV-2序列,经人类感染病毒微调的模型仍能识别SARS-CoV-2的免疫逃逸变异株(AUROC达0.6)。本研究表明,数据排除策略可能被微调方法所规避,这些方法能在一定程度上恢复gLM的滥用相关能力。我们强调建立gLM安全框架的必要性,并概述了在评估与缓解措施方面需进一步开展的工作,以实现gLM的安全部署。

0
下载
关闭预览

相关内容

国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员