Changes based on comments.

vllm-project · Sep 5, 2024 · 353fbdf · 353fbdf
1 parent 5a21218
commit 353fbdf
Show file tree

Hide file tree

Showing 2 changed files with 0 additions and 3 deletions.
diff --git a/tests/models/test_granitemoe.py b/tests/models/test_granitemoe.py
@@ -33,7 +33,6 @@ def test_models(
     max_tokens: int,
     num_logprobs: int,
 ) -> None:
-    # TODO(sang): Sliding window should be tested separately.
     with hf_runner(model, dtype=dtype) as hf_model:
         hf_outputs = hf_model.generate_greedy_logprobs_limit(
             example_prompts, max_tokens, num_logprobs)

diff --git a/vllm/model_executor/models/granitemoe.py b/vllm/model_executor/models/granitemoe.py
@@ -25,7 +25,6 @@
 
 import torch
 from torch import nn
-# from transformers import GraniteMoeConfig
 from vllm.transformers_utils.configs.granitemoe import GraniteMoeConfig
 
 from vllm.attention import Attention, AttentionMetadata
@@ -43,7 +42,6 @@
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     DEFAULT_VOCAB_PADDING_SIZE, ParallelLMHead, VocabParallelEmbedding)
 from vllm.model_executor.sampling_metadata import SamplingMetadata
-# from vllm.sequence import IntermediateTensors, SamplerOutput
 from vllm.sequence import IntermediateTensors
 from vllm.model_executor.layers.sampler import Sampler, SamplerOutput