Bump llama-cpp-python to 0.2.18 (2nd attempt) #4637

oobabooga · 2023-11-18T03:11:51Z

Full credits to @jllllll for creating new wheels compiled with -DLLAMA_CUDA_FORCE_MMQ=ON, which is necessary now to not break performance on Pascal cards.

oobabooga added 2 commits November 17, 2023 19:04

Update requirements*.txt

51c2203

Add back seed

7461482

oobabooga mentioned this pull request Nov 18, 2023

Bump llama-cpp-python to 0.2.18 #4611

Merged

oobabooga merged commit e0ca49e into dev Nov 18, 2023

oobabooga deleted the bump-4real branch November 18, 2023 21:39

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Bump llama-cpp-python to 0.2.18 (2nd attempt) #4637

Bump llama-cpp-python to 0.2.18 (2nd attempt) #4637

oobabooga commented Nov 18, 2023 •

edited

Loading

Bump llama-cpp-python to 0.2.18 (2nd attempt) #4637

Bump llama-cpp-python to 0.2.18 (2nd attempt) #4637

Conversation

oobabooga commented Nov 18, 2023 • edited Loading

oobabooga commented Nov 18, 2023 •

edited

Loading