KPK101 / FlashAttention Public

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Implementation of FlashAttention in pycuda

0 stars 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
assets		assets
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
attention.py		attention.py

Repository files navigation

FlashAttention

Implementation of FlashAttention in pycuda

Status

Simple attention mechanism implementation in python using numpy

To-Do (CPU): Target (11/05)

Include multi-headed attention
More modular and checks
Make a PyTorch attention module

To-Do (GPU): Target (11/05)

Implement naive attention computation
Add tiling to blocks for compute
Fused kernels (matmul, softmax, linear layer)

About

Implementation of FlashAttention in pycuda

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%