Skip to content

issue/1207: 修复 NVIDIA T1-1 失败算子#1208

Open
GordonYang1 wants to merge 1 commit into
InfiniTensor:mainfrom
GordonYang1:issue/1207/fix-nvidia-t1-1-ops
Open

issue/1207: 修复 NVIDIA T1-1 失败算子#1208
GordonYang1 wants to merge 1 commit into
InfiniTensor:mainfrom
GordonYang1:issue/1207/fix-nvidia-t1-1-ops

Conversation

@GordonYang1
Copy link
Copy Markdown
Contributor

Summary

本 PR 修复 2025 秋季算子比赛 T1-1 相关算子在 NVIDIA 后端的失败和不稳定问题。

涉及算子:

  • index_copy
  • fmod
  • logdet
  • upsample_nearest
  • logical_and
  • logical_not
  • addbmm
  • gaussian_nll_loss

本 PR 实际修改并修复了以下算子:

  • index_copy
  • fmod
  • logdet
  • upsample_nearest
  • logical_and
  • logical_not

addbmmgaussian_nll_loss 本 PR 未修改代码;已通过连续单算子测试重新确认,目前可以通过。

Changes

  • index_copy:使用 torch.randperm 生成不重复 index,避免重复 index 导致同一位置被多次写入,从而出现非确定性结果。
  • fmod:测试中避免生成 0 作为除数,防止在 equal_nan=False 时出现 NaN vs NaN 比较失败。
  • logdet:使用稳定的正定 / 对角占优矩阵作为测试输入,同时保留 strided case 覆盖。
  • upsample_nearest:导出 upsample_nearest,并让 1D interpolate(mode="nearest") 复用已有的 upsample_nearest 路径。
  • logical_and:将缺失的 ntops.torch.logical_and CUDA 路径替换为 ne + bitwise_and 组合实现。
  • logical_not:将缺失的 ntops.torch.logical_not CUDA 路径替换为先用 eq 写入临时 bool tensor,再以 alias-safe 的方式写回 out

Test Result

Image

Related issue

Fixes #1207

@GordonYang1 GordonYang1 requested a review from a team June 5, 2026 09:26
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

[BUG] 修复 2025 秋季算子比赛 T1-1 NVIDIA 测试失败/不稳定算子

1 participant