成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Softmax
关注
0
综合
百科
VIP
热门
动态
论文
精华
Exploring the Frontiers of Softmax: Provable Optimization, Applications in Diffusion Model, and Beyond
Arxiv
0+阅读 · 5月6日
Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods
Arxiv
0+阅读 · 5月6日
Deep Metric Learning-Based Out-of-Distribution Detection with Synthetic Outlier Exposure
Arxiv
0+阅读 · 5月1日
Counting Like Transformers: Compiling Temporal Counting Logic Into Softmax Transformers
Arxiv
0+阅读 · 4月5日
Softmax Attention with Constant Cost per Token
Arxiv
0+阅读 · 4月8日
MAP: Model Aggregation and Personalization in Federated Learning with Incomplete Classes
Arxiv
0+阅读 · 4月14日
Why do small language models underperform? Studying Language Model Saturation via the Softmax Bottleneck
Arxiv
0+阅读 · 4月11日
ÚFAL LatinPipe at EvaLatin 2024: Morphosyntactic Analysis of Latin
Arxiv
0+阅读 · 4月8日
Elementary Analysis of Policy Gradient Methods
Arxiv
0+阅读 · 4月4日
PolySketchFormer: Fast Transformers via Sketching Polynomial Kernels
Arxiv
0+阅读 · 3月17日
Implicit Regularization of Gradient Flow on One-Layer Softmax Attention
Arxiv
0+阅读 · 3月13日
LVC-LGMC: Joint Local and Global Motion Compensation for Learned Video Compression
Arxiv
0+阅读 · 3月11日
Delving into the Trajectory Long-tail Distribution for Muti-object Tracking
Arxiv
0+阅读 · 3月7日
Self-Evaluation of Large Language Model based on Glass-box Features
Arxiv
0+阅读 · 3月7日
Decentralized Uncoded Storage Elastic Computing with Heterogeneous Computation Speeds
Arxiv
0+阅读 · 3月1日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top