server : re-add parameter -tb N, --threads-batch N #3768

cebtenzzre · 2023-10-24T19:58:36Z

Follow-up to #3677, which unintentionally removed the option added in #3584.

Co-authored-by: Michael Coppola <[email protected]>

* master: (350 commits) speculative : ensure draft and target model vocab matches (ggerganov#3812) llama : correctly report GGUFv3 format (ggerganov#3818) simple : fix batch handling (ggerganov#3803) cuda : improve text-generation and batched decoding performance (ggerganov#3776) server : do not release slot on image input (ggerganov#3798) batched-bench : print params at start log : disable pid in log filenames server : add parameter -tb N, --threads-batch N (ggerganov#3584) (ggerganov#3768) server : do not block system prompt update (ggerganov#3767) sync : ggml (conv ops + cuda MSVC fixes) (ggerganov#3765) cmake : add missed dependencies (ggerganov#3763) cuda : add batched cuBLAS GEMM for faster attention (ggerganov#3749) Add more tokenizer tests (ggerganov#3742) metal : handle ggml_scale for n%4 != 0 (close ggerganov#3754) Revert "make : add optional CUDA_NATIVE_ARCH (ggerganov#2482)" issues : separate bug and enhancement template + no default title (ggerganov#3748) Update special token handling in conversion scripts for gpt2 derived tokenizers (ggerganov#3746) llama : remove token functions with `context` args in favor of `model` (ggerganov#3720) Fix baichuan convert script not detecing model (ggerganov#3739) make : add optional CUDA_NATIVE_ARCH (ggerganov#2482) ...

server : add parameter -tb N, --threads-batch N (ggerganov#3584)

54f9831

Co-authored-by: Michael Coppola <[email protected]>

cebtenzzre requested a review from ggerganov October 24, 2023 19:59

ggerganov approved these changes Oct 24, 2023

View reviewed changes

ggerganov merged commit ad93962 into ggerganov:master Oct 24, 2023
31 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

server : re-add parameter -tb N, --threads-batch N #3768

server : re-add parameter -tb N, --threads-batch N #3768

cebtenzzre commented Oct 24, 2023

server : re-add parameter -tb N, --threads-batch N #3768

server : re-add parameter -tb N, --threads-batch N #3768

Conversation

cebtenzzre commented Oct 24, 2023