Feature/top p sampling #1360

belerico · 2024-04-25T19:36:03Z

This PR adds the nucleus-sampling (aka top-p sampling) as specified from https://arxiv.org/abs/1904.09751.
In top-p sampling the next token is chosen from the smallest set of tokens with a cumulative probability greater than top-p, i.e. by selecting the highest probability tokens whose cumulative probability exceeds the top-p threshold.

rasbt

This looks great, thanks a lot! Only a few minor points from my side below:

litgpt/chat/base.py

litgpt/generate/adapter.py

litgpt/generate/adapter_v2.py

litgpt/generate/base.py

litgpt/generate/sequentially.py

litgpt/generate/tp.py

litgpt/generate/base.py

litgpt/chat/base.py

litgpt/generate/base.py

tests/test_generate.py

litgpt/generate/base.py

tests/test_generate.py

rasbt · 2024-05-02T17:54:38Z

Thanks for all the updates and fixes. It looks all great to me now. ~~The only thing is perhaps adding one more unit test, but I can take care of that to make it easier.~~ [done]

belerico · 2024-05-03T18:27:40Z

Thanks for all the updates and fixes. It looks all great to me now. ~~The only thing is perhaps adding one more unit test, but I can take care of that to make it easier.~~ [done]

Thank you @rasbt: i had missed your comment

rasbt · 2024-05-03T18:48:22Z

No worries at all, I also thought it was probably quicker to just add instead of explain 😅

carmocca · 2024-05-06T09:24:07Z

tests/test_generate.py

+def test_generate_different_results_with_different_top_p():
+    config = Config(block_size=128, vocab_size=16, n_layer=1, n_head=4, n_embd=8)
+    model = GPT(config)
+    model.max_seq_length = 50
+    model.set_kv_cache(batch_size=1)
+
+    torch.manual_seed(123)
+    input_idx = torch.randint(10, size=(1,))
+
+    output1 = generate.generate(model, input_idx, 20, top_p=1.0)
+    output2 = generate.generate(model, input_idx, 20, top_p=0.1)
+
+    assert not torch.equal(output1, output2)


This test is not useful because it will also pass if you set the same top_p. That's because multinomial advances the rng state.

For it to achieve the intended result, you need to seed before each call

torch.manual_seed(123) input_idx = torch.randint(10, size=(1,)) torch.manual_seed(123) output1 = generate.generate(model, input_idx, 20, top_p=1.0) torch.manual_seed(123) output2 = generate.generate(model, input_idx, 20, top_p=0.1)

cc @rasbt

arg, thanks!

belerico added 3 commits April 25, 2024 20:20

Add top-p sampling

ab79ca8

Always keep at least one token (the most probable one)

d4ebc32

Add top_p to tests

5073a60

belerico requested review from awaelchli, carmocca and lantiga as code owners April 25, 2024 19:36

rasbt reviewed Apr 25, 2024

View reviewed changes

belerico added 4 commits April 25, 2024 22:18

Fix missing top-p

0e394b0

Update tests

aaeded5

Update docstrings

fab0898

Activate top_p only if top_p<1.0

2f7e9b2

carmocca reviewed Apr 25, 2024

View reviewed changes

litgpt/generate/base.py Outdated Show resolved Hide resolved

sample_top_p as a separate function

021ea1a

belerico requested review from rasbt and carmocca April 25, 2024 23:20

belerico added 2 commits April 26, 2024 01:44

Do not sample if top_p=1.0

1f6010c

Update tests

8d4a499

rasbt reviewed Apr 26, 2024

View reviewed changes

litgpt/chat/base.py Outdated Show resolved Hide resolved

belerico requested a review from rasbt April 26, 2024 16:52

belerico added 3 commits April 26, 2024 19:13

Update top_p docstring

367e78a

Fix bug while setting top_p if was None

79641f6

Disable top_p if None

3770640

rasbt reviewed Apr 26, 2024

View reviewed changes

litgpt/generate/base.py Outdated Show resolved Hide resolved

belerico requested a review from rasbt April 27, 2024 16:12

carmocca reviewed Apr 29, 2024

View reviewed changes

tests/test_generate.py Outdated Show resolved Hide resolved

litgpt/generate/base.py Outdated Show resolved Hide resolved

belerico added 2 commits April 29, 2024 16:22

top_p is 1 by default

cd8a757

fix test create float tensor

c206f86

belerico requested a review from carmocca April 29, 2024 14:45

rasbt reviewed May 2, 2024

View reviewed changes

litgpt/generate/base.py Outdated Show resolved Hide resolved

rasbt reviewed May 2, 2024

View reviewed changes

tests/test_generate.py Show resolved Hide resolved

rasbt added 4 commits May 2, 2024 12:54

Update litgpt/generate/base.py

150f151

Merge branch 'main' into feature/top-p-sampling

dffcdda

add top_p not equal test

d9de539

add negation

2b7c0dc

rasbt approved these changes May 2, 2024

View reviewed changes

rasbt merged commit d39b26a into Lightning-AI:main May 3, 2024
9 checks passed

carmocca reviewed May 6, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feature/top p sampling #1360

Feature/top p sampling #1360

belerico commented Apr 25, 2024

rasbt left a comment

rasbt commented May 2, 2024 •

edited

Loading

belerico commented May 3, 2024

rasbt commented May 3, 2024

carmocca May 6, 2024

rasbt May 6, 2024

Feature/top p sampling #1360

Feature/top p sampling #1360

Conversation

belerico commented Apr 25, 2024

rasbt left a comment

Choose a reason for hiding this comment

rasbt commented May 2, 2024 • edited Loading

belerico commented May 3, 2024

rasbt commented May 3, 2024

carmocca May 6, 2024

Choose a reason for hiding this comment

rasbt May 6, 2024

Choose a reason for hiding this comment

rasbt commented May 2, 2024 •

edited

Loading