issue/1167 - feat: add flash-attn via MooreThreads/mate for moore gpu by spike-zhu · Pull Request #1168 · InfiniTensor/InfiniCore

spike-zhu · 2026-05-21T08:01:17Z

摩尔 flash-attn 的支持，依赖开源摩尔 mate（https://github.com/MooreThreads/mate） v0.1.3 版本。

算子测试：

wooway777 · 2026-05-22T11:46:02Z

平台限定的东西最好不要轻易加submodule

平台限定的东西最好不要轻易加submodule

如果暂时不加 submodule，第三方仓库先通过 README 的形式说明依赖和拉取方式，这个方法是否合适？

平台限定的东西最好不要轻易加submodule

如果暂时不加 submodule，第三方仓库先通过 README 的形式说明依赖和拉取方式，这个方法是否合适？

可以，之前nv是这么做的。或者你上次好像说了一个默认不拉，手动指定才拉的方式应该也行。

wooway777 · 2026-05-22T11:46:59Z

+
+    -- Moore mate: enable Python bridge macro for flash-attn Moore path
+    if has_config("moore-gpu") and has_config("aten") then
+        add_defines("ENABLE_MOORE_MATE_FLASH_ATTN")


这里感觉略显草率

这里感觉略显草率

草率是指 ENABLE_MOORE_MATE_FLASH_ATTN 宏命名吗？

这里感觉略显草率

草率是指 ENABLE_MOORE_MATE_FLASH_ATTN 宏命名吗？

我觉得，
一方面好像应该是要求了摩尔和flash attention，才会需要编摩尔的flash attention。
现在是只要要求摩尔和aten就编flash attention，逻辑上有点粗暴。

另外命名上，是否需要一个MOORE_MATE_FLASH_ATTN的命名？还是有现有的摩尔和flash attention就够了？

这里感觉略显草率

草率是指 ENABLE_MOORE_MATE_FLASH_ATTN 宏命名吗？

我觉得，一方面好像应该是要求了摩尔和flash attention，才会需要编摩尔的flash attention。现在是只要要求摩尔和aten就编flash attention，逻辑上有点粗暴。

另外命名上，是否需要一个MOORE_MATE_FLASH_ATTN的命名？还是有现有的摩尔和flash attention就够了？

关于“我觉得，一方面好像应该是要求了摩尔和flash attention，才会需要编摩尔的flash attention。现在是只要要求摩尔和aten就编flash attention，逻辑上有点粗暴。”

回复：已在 xmake 中增加 flash-attn=y 判断，现在需要同时开启 moore-gpu、aten 和 flash-attn，才会编译 Moore 的 flash-attn 路径，避免只开 moore-gpu + aten 就默认编译，解决原先逻辑较粗的问题。

关于“另外命名上，是否需要一个MOORE_MATE_FLASH_ATTN的命名？还是有现有的摩尔和flash attention就够了？”

回复：这里保留 MOORE_MATE_FLASH_ATTN 是为了区分 Moore MATE 的特殊实现路径。当前 Moore 并不是直接复用现有 flash-attn C++ 接口，而是通过 MATE/Python wrapper 调用，并额外依赖 pybind11、MUSA stream 相关处理等；因此需要单独的宏隔离 Moore 特有逻辑，避免影响其他平台。

wooway777 · 2026-05-26T10:57:22Z

 #endif

+#if defined(ENABLE_MOORE_MATE_FLASH_ATTN)
+#include "infinicore/adaptor/aten_adaptor.hpp"


这里别人都不需要，摩尔确认需要么？

这里别人都不需要，摩尔确认需要么？

这个是需要的。Moore MATE 这条路径里增加了 LocalMUSAStreamGuard，其中直接使用了 c10::musa::MUSAStream、getCurrentMUSAStream() 和 setCurrentMUSAStream()，因此当前编译单元需要引入 MUSA stream 相关声明。aten_adaptor.hpp 在 ENABLE_MOORE_API 下会间接包含 <c10/musa/MUSAStream.h>，去掉后这里会编译不过。

哦，这个是因为别人在这里又引用了一遍c10/cuda/CUDAGuard.h，麻烦看一眼怎样合理然后统一一下？

或者如果觉得应该换个pr改合理，那也可以先按nv和沐曦一样的做法写。

哦，这个是因为别人在这里又引用了一遍c10/cuda/CUDAGuard.h，麻烦看一眼怎样合理然后统一一下？

或者如果觉得应该换个pr改合理，那也可以先按nv和沐曦一样的做法写。

当前其他平台在 mha_kvcache_flashattn.cc 中通过 flash_attention_adaptor.hpp 间接引入 aten_adaptor.hpp（需要使用 get_cuda_stream 等 aten_adaptor.hpp 等内容）； Moore MATE 路径使用的是独立的 ENABLE_MOORE_MATE_FLASH_ATTN 宏，不会经过 ENABLE_FLASH_ATTN 对应的 include 链路。当前在 ENABLE_MOORE_MATE_FLASH_ATTN 直接引入 aten_adaptor.hpp 是改动较为合适的一种方式

wooway777

完全rebase g了。请确认改动重新rebase

spike-zhu · 2026-06-05T12:51:09Z

完全rebase g了。请确认改动重新rebase

这个 rebase g 了啥意思？我基于 origin/main 重新 rebase 后，文件似乎没有变动

附 rebase 图：

wooway777 · 2026-06-05T12:58:03Z

完全rebase g了。请确认改动重新rebase

这个 rebase g 了啥意思？我基于 origin/main 重新 rebase 后，文件似乎没有变动

附 rebase 图：

我的问题，把你force push的内容当成pr改动了 (:з」∠)

spike-zhu requested a review from a team May 21, 2026 08:01

spike-zhu force-pushed the issue/1167 branch 3 times, most recently from 549a616 to cb6a99b Compare May 21, 2026 08:23

spike-zhu self-assigned this May 21, 2026

spike-zhu force-pushed the issue/1167 branch 2 times, most recently from 11cd394 to 6079550 Compare May 22, 2026 04:29

spike-zhu requested review from Ziminli, voltjia and wooway777 May 22, 2026 11:34

wooway777 reviewed May 22, 2026

View reviewed changes

wooway777 reviewed May 26, 2026

View reviewed changes

Comment thread .gitmodules

spike-zhu force-pushed the issue/1167 branch 3 times, most recently from bfc8b82 to 0c37636 Compare May 28, 2026 10:14

spike-zhu requested a review from wooway777 May 28, 2026 10:41

issue/1167 - feat: add flash-attn via MooreThreads/mate for moore gpu

1b00b4e

spike-zhu force-pushed the issue/1167 branch from 0c37636 to 1b00b4e Compare June 5, 2026 08:07

wooway777 requested changes Jun 5, 2026

View reviewed changes

spike-zhu requested a review from wooway777 June 5, 2026 12:51

Conversation

spike-zhu commented May 21, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

wooway777 left a comment

Choose a reason for hiding this comment

Uh oh!

spike-zhu commented Jun 5, 2026

Uh oh!

wooway777 commented Jun 5, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

spike-zhu commented May 21, 2026 •

edited

Loading