Update README.md

Co-authored-by: Olga Andreeva <[email protected]>
triton-inference-server · tanmayv25 · Nov 22, 2023 · Nov 22, 2023 · Nov 22, 2023 · Nov 22, 2023
commit f70532457350d76aa572cb3ecc5200f91323c2ed
diff --git a/README.md b/README.md
@@ -143,7 +143,7 @@ We will use the [pre-built Triton container with vLLM backend](#option-1-use-the
 [NGC](https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver) in this example.
 
 ```
-docker run --gpus all -it --net=host --rm -p 8001:8001 --shm-size=1G --ulimit memlock=-1 --ulimit stack=67108864 -v ${PWD}:/work -w /work nvcr.io/nvidia/tritonserver:<xx.yy>-vllm-python-py3 tritonserver --model-store ./model_repository
+docker run --gpus all -it --net=host --rm -p 8001:8001 --shm-size=1G --ulimit memlock=-1 --ulimit stack=67108864 -v ${PWD}:/work -w /work nvcr.io/nvidia/tritonserver:<xx.yy>-vllm-python-py3 tritonserver --model-repository ./model_repository
 ```
 
 Replace \<xx.yy\> with the version of Triton that you want to use.