重要性采样论文 - 专知

会员服务 ·

重要性采样

重要性采样

Adaptive-lambda Subtracted Importance Sampled Scores in Machine Unlearning for DDPMs and VAEs

Arxiv

0+阅读 · 11月30日

Adaptive-lambda Subtracted Importance Sampled Scores in Machine Unlearning for DDPMs and VAEs

Arxiv

0+阅读 · 12月15日

Each Prompt Matters: Scaling Reinforcement Learning Without Wasting Rollouts on Hundred-Billion-Scale MoE

Arxiv

0+阅读 · 12月8日

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Arxiv

0+阅读 · 12月5日

Stabilizing Reinforcement Learning with LLMs: Formulation and Practices

Arxiv

0+阅读 · 12月3日

Stabilizing Reinforcement Learning with LLMs: Formulation and Practices

Arxiv

0+阅读 · 12月2日

Stabilizing Reinforcement Learning with LLMs: Formulation and Practices

Arxiv

0+阅读 · 12月1日

Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts

Arxiv

0+阅读 · 10月27日

Leveraging Importance Sampling to Detach Alignment Modules from Large Language Models

Arxiv

0+阅读 · 10月14日

A General Framework for Importance Sampling with Markov Random Walks

Arxiv

0+阅读 · 10月13日

Learning Neural Pushforward Samplers for Distributions from Fokker-Planck Equations by Weak Adversarial Training

Learning Neural Pushforward Samplers for Distributions from Fokker-Planck Equations by Weak Adversarial Training

Arxiv

0+阅读 · 10月13日

Randomized Quasi-Monte Carlo with Importance Sampling for Functions under Generalized Growth Conditions and Its Applications in Finance

Arxiv

0+阅读 · 10月8日

ASPO: Asymmetric Importance Sampling Policy Optimization

Arxiv

0+阅读 · 10月7日

Learning Neural Pushforward Samplers for Distributions from Fokker-Planck Equations by Weak Adversarial Training

Arxiv

0+阅读 · 10月6日

Consolidating Reinforcement Learning for Multimodal Discrete Diffusion Models

Arxiv

0+阅读 · 10月3日

参考链接

微信扫码咨询专知VIP会员