make TransformerLayer accept a `bshd` or `sbhd` tensor format #557

sudhakarsingh27 · 2023-12-08T00:13:35Z

Changes:

DotProductAttention can interpret the input tensor in sbhd or bshd format but MultiHeadAttention and TransformerLayer aren't aware of this. This PR plumbs this information through TransformerLayer -> MultiHeadAttention -> DotProductAttention.
RotaryPositionEmbedding also needs to be aware of this format to correctly apply the rope cache to the q and k inputs.

Uses:

When replacing layers in HF models like LlamaDecoderLayer with TransformerLayer, it helps to have this control since HF is bshd by default and TE is sbhd.

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

cyanguwa

LGTM. Once the CI passes, can merge.

transformer_engine/pytorch/attention.py

transformer_engine/pytorch/transformer.py

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

…to plumb_tensor_format_thru_transformer_layer

transformer_engine/pytorch/attention.py

tests/pytorch/test_fused_attn.py

cyanguwa

Please fix a few small things. Looks good to me. Thanks!

transformer_engine/pytorch/attention.py

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

…to plumb_tensor_format_thru_transformer_layer

ptrendx · 2024-01-17T00:51:56Z

@sudhakarsingh27 Please resolve the merge conflicts

@cyanguwa Could you rereview?

…to plumb_tensor_format_thru_transformer_layer Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

sudhakarsingh27 · 2024-01-18T18:15:02Z

/te-ci/pytorch

sudhakarsingh27 · 2024-01-18T18:16:23Z

/te-ci pytorch

cyanguwa · 2024-01-18T18:17:17Z

/te-ci pytorch

transformer_engine/pytorch/attention.py

transformer_engine/pytorch/transformer.py

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

cyanguwa

LGTM

cyanguwa · 2024-01-19T02:00:11Z

@sudhakarsingh27 Please fix CI before merging -- looks like there's a few failed jobs.

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

fix failing tests due to PR #557 Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> Co-authored-by: cyanguwa <8636796+cyanguwa@users.noreply.github.com>

…#557) * make TransformerLayer accept a `bshd` or `sbhd` tensor format Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * Fixes from feedback Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * more feedback fixes Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * remove incorrect info from docstring Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * fix from feedback Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> --------- Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

* make TransformerLayer accept a `bshd` or `sbhd` tensor format Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * Fixes from feedback Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * more feedback fixes Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * remove incorrect info from docstring Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> * fix from feedback Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> --------- Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

fix failing tests due to PR #557 Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> Co-authored-by: cyanguwa <8636796+cyanguwa@users.noreply.github.com>

make TransformerLayer accept a bshd or sbhd tensor format

90586ee

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

sudhakarsingh27 requested review from ptrendx and cyanguwa December 8, 2023 00:13

sudhakarsingh27 self-assigned this Dec 8, 2023

cyanguwa approved these changes Dec 8, 2023

View reviewed changes

transformer_engine/pytorch/attention.py Show resolved Hide resolved

cyanguwa reviewed Dec 8, 2023

View reviewed changes

transformer_engine/pytorch/attention.py Outdated Show resolved Hide resolved

ptrendx reviewed Dec 13, 2023

View reviewed changes

transformer_engine/pytorch/transformer.py Outdated Show resolved Hide resolved

sudhakarsingh27 added 2 commits December 18, 2023 17:09

Fixes from feedback

920fe9b

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

Merge branch 'main' of https://github.com/NVIDIA/TransformerEngine in…

524eac6

…to plumb_tensor_format_thru_transformer_layer

cyanguwa reviewed Jan 5, 2024

View reviewed changes

transformer_engine/pytorch/attention.py Outdated Show resolved Hide resolved

cyanguwa reviewed Jan 5, 2024

View reviewed changes

transformer_engine/pytorch/attention.py Outdated Show resolved Hide resolved

cyanguwa reviewed Jan 5, 2024

View reviewed changes

tests/pytorch/test_fused_attn.py Outdated Show resolved Hide resolved

cyanguwa requested changes Jan 5, 2024

View reviewed changes

ptrendx reviewed Jan 9, 2024

View reviewed changes

transformer_engine/pytorch/attention.py Outdated Show resolved Hide resolved

sudhakarsingh27 added 2 commits January 9, 2024 14:20

more feedback fixes

4af0f75

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

Merge branch 'main' of https://github.com/NVIDIA/TransformerEngine in…

fdd1271

…to plumb_tensor_format_thru_transformer_layer

ptrendx added the 1.3.0 label Jan 17, 2024

sudhakarsingh27 added 2 commits January 17, 2024 16:43

Merge branch 'main' of https://github.com/NVIDIA/TransformerEngine in…

9cb461b

…to plumb_tensor_format_thru_transformer_layer Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

remove incorrect info from docstring

e263d49

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

sudhakarsingh27 requested a review from cyanguwa January 18, 2024 18:11

cyanguwa reviewed Jan 18, 2024

View reviewed changes

transformer_engine/pytorch/attention.py Outdated Show resolved Hide resolved

cyanguwa reviewed Jan 18, 2024

View reviewed changes

transformer_engine/pytorch/transformer.py Show resolved Hide resolved

fix from feedback

b3da435

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

cyanguwa approved these changes Jan 18, 2024

View reviewed changes

sudhakarsingh27 merged commit 36047fd into NVIDIA:main Jan 18, 2024
9 checks passed

yaox12 mentioned this pull request Jan 19, 2024

[Common][PyTorch] Fused apply_rotorary_pos_emb #517

Merged

sudhakarsingh27 added a commit to sudhakarsingh27/TransformerEngine that referenced this pull request Jan 19, 2024

fix failing tests due to PR NVIDIA#557

5157a4a

Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com>

sudhakarsingh27 mentioned this pull request Jan 19, 2024

Fix failing CI due to PR #557 merge #616

Merged

ksivaman mentioned this pull request Jan 19, 2024

[PyTorch] Fix arg name in numerics test #618

Closed

ksivaman pushed a commit that referenced this pull request Jan 20, 2024

Fix failing CI due to PR #557 merge (#616)

bacefdb

fix failing tests due to PR #557 Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> Co-authored-by: cyanguwa <8636796+cyanguwa@users.noreply.github.com>

ptrendx pushed a commit that referenced this pull request Jan 22, 2024

Fix failing CI due to PR #557 merge (#616)

b25611b

fix failing tests due to PR #557 Signed-off-by: Sudhakar Singh <sudhakars@nvidia.com> Co-authored-by: cyanguwa <8636796+cyanguwa@users.noreply.github.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

make TransformerLayer accept a `bshd` or `sbhd` tensor format #557

make TransformerLayer accept a `bshd` or `sbhd` tensor format #557

sudhakarsingh27 commented Dec 8, 2023

cyanguwa left a comment

cyanguwa left a comment

ptrendx commented Jan 17, 2024

sudhakarsingh27 commented Jan 18, 2024

sudhakarsingh27 commented Jan 18, 2024

cyanguwa commented Jan 18, 2024

cyanguwa left a comment

cyanguwa commented Jan 19, 2024

make TransformerLayer accept a bshd or sbhd tensor format #557

make TransformerLayer accept a bshd or sbhd tensor format #557

Conversation

sudhakarsingh27 commented Dec 8, 2023

cyanguwa left a comment

Choose a reason for hiding this comment

cyanguwa left a comment

Choose a reason for hiding this comment

ptrendx commented Jan 17, 2024

sudhakarsingh27 commented Jan 18, 2024

sudhakarsingh27 commented Jan 18, 2024

cyanguwa commented Jan 18, 2024

cyanguwa left a comment

Choose a reason for hiding this comment

cyanguwa commented Jan 19, 2024

make TransformerLayer accept a `bshd` or `sbhd` tensor format #557

make TransformerLayer accept a `bshd` or `sbhd` tensor format #557