成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
CUDA
关注
17
综合
百科
VIP
热门
动态
论文
精华
Evaluation of Programming Models and Performance for Stencil Computation on Current GPU Architectures
Arxiv
0+阅读 · 4月5日
Taking GPU Programming Models to Task for Performance Portability
Arxiv
0+阅读 · 3月27日
Fully-fused Multi-Layer Perceptrons on Intel Data Center GPUs
Arxiv
0+阅读 · 3月26日
SIP: Autotuning GPU Native Schedules via Stochastic Instruction Perturbation
Arxiv
0+阅读 · 3月25日
Parallel Gaussian process with kernel approximation in CUDA
Arxiv
0+阅读 · 3月19日
Journey into SPH Simulation: A Comprehensive Framework and Showcase
Arxiv
0+阅读 · 3月17日
Assessing Opportunities of SYCL for Biological Sequence Alignment on GPU-based Systems
Arxiv
0+阅读 · 2月23日
Recent Extensions of the ZKCM Library for Parallel and Accurate MPS Simulation of Quantum Circuits
Arxiv
0+阅读 · 2月19日
An Evaluative Comparison of Performance Portability across GPU Programming Models
Arxiv
1+阅读 · 2月14日
Towards a GPU-Parallelization of the neXtSIM-DG Dynamical Core
Arxiv
0+阅读 · 2月1日
Lessons Learned Migrating CUDA to SYCL: A HEP Case Study with ROOT RDataFrame
Arxiv
0+阅读 · 1月24日
Assessing Opportunities of SYCL for Biological Sequence Alignment on GPU-based Systems
Arxiv
0+阅读 · 1月7日
A Case Study in CUDA Kernel Fusion: Implementing FlashAttention-2 on NVIDIA Hopper Architecture using the CUTLASS Library
Arxiv
0+阅读 · 2023年12月19日
Opara: Exploiting Operator Parallelism for Expediting DNN Inference on GPUs
Arxiv
0+阅读 · 2023年12月16日
Comparing Performance and Portability between CUDA and SYCL for Protein Database Search on NVIDIA, AMD, and Intel GPUs
Arxiv
0+阅读 · 2023年11月10日
参考链接
父主题
英伟达(NVIDIA)
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top