Moved __all__ after imports. Added more __all__:)

Signed-off-by: VahidooX <[email protected]>
NVIDIA · VahidooX · Feb 4, 2020 · Jan 25, 2020 · Jan 27, 2020 · Jan 27, 2020
commit b8f57bfb53e47243fe769d428c74a8fbec2ba0ea
diff --git a/nemo/collections/nlp/__init__.py b/nemo/collections/nlp/__init__.py
@@ -17,6 +17,5 @@
 import nemo.collections.nlp.data
 import nemo.collections.nlp.nm
 import nemo.collections.nlp.utils
-from nemo import logging
 
 backend = nemo.core.Backend.PyTorch
diff --git a/nemo/collections/nlp/callbacks/glue_benchmark_callback.py b/nemo/collections/nlp/callbacks/glue_benchmark_callback.py
@@ -19,8 +19,6 @@
 Some transformer of this code were adapted from the HuggingFace library at
 https://github.com/huggingface/transformers
 """
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import os
 import random
 
@@ -31,6 +29,8 @@
 from nemo import logging
 from nemo.collections.nlp.utils.callback_utils import list2str, tensor2list
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 
 def eval_iter_callback(tensors, global_vars):
     if "all_preds" not in global_vars.keys():

diff --git a/nemo/collections/nlp/callbacks/joint_intent_slot_callback.py b/nemo/collections/nlp/callbacks/joint_intent_slot_callback.py
@@ -1,5 +1,4 @@
 # Copyright (c) 2019 NVIDIA Corporation
-
 import random
 
 import numpy as np

diff --git a/nemo/collections/nlp/callbacks/lm_bert_callback.py b/nemo/collections/nlp/callbacks/lm_bert_callback.py
@@ -1,10 +1,10 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import numpy as np
 
 from nemo import logging
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 
 def eval_iter_callback(tensors, global_vars):
     if "dev_mlm_loss" not in global_vars.keys():

diff --git a/nemo/collections/nlp/callbacks/lm_transformer_callback.py b/nemo/collections/nlp/callbacks/lm_transformer_callback.py
@@ -1,10 +1,9 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import numpy as np
 
 from nemo import logging
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
 GLOBAL_KEYS = ["eval_loss", "sys"]
 
 

diff --git a/nemo/collections/nlp/callbacks/machine_translation_callback.py b/nemo/collections/nlp/callbacks/machine_translation_callback.py
@@ -1,12 +1,12 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import numpy as np
 
 from nemo import logging
 from nemo.collections.asr.metrics import word_error_rate
 from nemo.collections.nlp.metrics.sacrebleu import corpus_bleu
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 GLOBAL_KEYS = ["eval_loss", "ref", "sys", "sent_ids", "nonpad_tokens"]
 
 

diff --git a/nemo/collections/nlp/callbacks/punctuation_capitalization_callback.py b/nemo/collections/nlp/callbacks/punctuation_capitalization_callback.py
@@ -1,6 +1,4 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import random
 
 import numpy as np
@@ -9,6 +7,8 @@
 from nemo import logging
 from nemo.collections.nlp.utils.callback_utils import list2str, plot_confusion_matrix, tensor2list
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 
 def eval_iter_callback(tensors, global_vars):
     if "punct_all_preds" not in global_vars.keys():

diff --git a/nemo/collections/nlp/callbacks/qa_squad_callback.py b/nemo/collections/nlp/callbacks/qa_squad_callback.py
@@ -14,10 +14,10 @@
 limitations under the License.
 """
 
-__all__ = ['eval_epochs_done_callback', 'eval_iter_callback']
-
 from nemo import logging
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 
 def eval_iter_callback(tensors, global_vars):
     if "eval_start_logits" not in global_vars.keys():

diff --git a/nemo/collections/nlp/callbacks/text_classification_callback.py b/nemo/collections/nlp/callbacks/text_classification_callback.py
@@ -1,6 +1,4 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import random
 
 import numpy as np

diff --git a/nemo/collections/nlp/callbacks/token_classification_callback.py b/nemo/collections/nlp/callbacks/token_classification_callback.py
@@ -1,6 +1,4 @@
 # Copyright (c) 2019 NVIDIA Corporation
-__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
-
 import random
 
 import numpy as np
@@ -9,6 +7,8 @@
 from nemo import logging
 from nemo.collections.nlp.utils.callback_utils import list2str, plot_confusion_matrix, tensor2list
 
+__all__ = ['eval_iter_callback', 'eval_epochs_done_callback']
+
 
 def eval_iter_callback(tensors, global_vars):
     if "all_preds" not in global_vars.keys():

diff --git a/nemo/collections/nlp/data/datasets/datasets_utils.py b/nemo/collections/nlp/data/datasets/datasets_utils.py
@@ -22,6 +22,42 @@
     write_vocab_in_order,
 )
 
+__all__ = [
+    'get_label_stats',
+    'process_sst_2',
+    'process_imdb',
+    'process_thucnews',
+    'process_nlu',
+    'process_twitter_airline',
+    'process_atis',
+    'process_jarvis_datasets',
+    'process_mturk',
+    'process_intent_slot_mturk',
+    'get_intents_mturk',
+    'get_slot_labels',
+    'merge',
+    'get_intent_query_files_dialogflow',
+    'get_intents_slots_dialogflow',
+    'get_slots_dialogflow',
+    'partition_data',
+    'write_files',
+    'process_dialogflow',
+    'write_data',
+    'create_dataset',
+    'read_csv',
+    'process_snips',
+    'get_dataset',
+    'partition',
+    'map_entities',
+    'get_entities',
+    'get_data',
+    'reverse_dict',
+    'get_intent_labels',
+    'download_wkt2',
+    'normalize_answer',
+    'get_tokens',
+]
+
 DATABASE_EXISTS_TMP = '{} dataset has already been processed and stored at {}'
 MODE_EXISTS_TMP = '{} mode of {} dataset has already been processed and stored at {}'
 

diff --git a/nemo/collections/nlp/data/datasets/qa_squad_dataset.py b/nemo/collections/nlp/data/datasets/qa_squad_dataset.py
@@ -42,6 +42,7 @@
 from nemo.collections.nlp.utils.common_nlp_utils import _is_whitespace
 from nemo.collections.nlp.utils.loss_utils import _compute_softmax
 
+__all__ = ['SquadDataset']
 
 """
 Utility functions for Question Answering NLP tasks

diff --git a/nemo/collections/nlp/data/scripts/convert_iob_format_to_token_classification_format.py b/nemo/collections/nlp/data/scripts/convert_iob_format_to_token_classification_format.py
@@ -13,7 +13,6 @@
 # limitations under the License.****
 
 import argparse
-import logging
 import os
 
 from nemo import logging

diff --git a/nemo/collections/nlp/data/tokenizers/bert_tokenizer.py b/nemo/collections/nlp/data/tokenizers/bert_tokenizer.py
@@ -1,10 +1,11 @@
-__all__ = ['NemoBertTokenizer']
 import re
 
 from transformers import BertTokenizer
 
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['NemoBertTokenizer']
+
 
 def handle_quotes(text):
     text_ = ""

diff --git a/nemo/collections/nlp/data/tokenizers/char_tokenizer.py b/nemo/collections/nlp/data/tokenizers/char_tokenizer.py
@@ -1,6 +1,7 @@
-__all__ = ['CharTokenizer']
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['CharTokenizer']
+
 
 class CharTokenizer(TokenizerSpec):
     def __init__(self, vocab_path):

diff --git a/nemo/collections/nlp/data/tokenizers/fairseq_tokenizer.py b/nemo/collections/nlp/data/tokenizers/fairseq_tokenizer.py
@@ -2,14 +2,13 @@
 https://github.com/NVIDIA/DeepLearningExamples/blob/
 master/PyTorch/Translation/Transformer/fairseq/tokenizer.py
 """
-
-__all__ = ['get_unicode_categories', 'tokenize_en']
-
 import re
 import sys
 import unicodedata
 from collections import defaultdict
 
+__all__ = ['get_unicode_categories', 'tokenize_en']
+
 
 def get_unicode_categories():
     cats = defaultdict(list)

diff --git a/nemo/collections/nlp/data/tokenizers/gpt2_tokenizer.py b/nemo/collections/nlp/data/tokenizers/gpt2_tokenizer.py
@@ -1,8 +1,9 @@
-__all__ = ['NemoGPT2Tokenizer']
 from transformers import GPT2Tokenizer
 
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['NemoGPT2Tokenizer']
+
 
 class NemoGPT2Tokenizer(TokenizerSpec):
     def __init__(

diff --git a/nemo/collections/nlp/data/tokenizers/sentencepiece_tokenizer.py b/nemo/collections/nlp/data/tokenizers/sentencepiece_tokenizer.py
@@ -1,8 +1,9 @@
-__all__ = ['SentencePieceTokenizer']
 import sentencepiece as spm
 
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['SentencePieceTokenizer']
+
 
 class SentencePieceTokenizer(TokenizerSpec):
     def __init__(self, model_path):

diff --git a/nemo/collections/nlp/data/tokenizers/tokenizer_spec.py b/nemo/collections/nlp/data/tokenizers/tokenizer_spec.py
@@ -1,7 +1,8 @@
-__all__ = ['TokenizerSpec']
 from abc import ABC, abstractmethod
 from typing import List
 
+__all__ = ['TokenizerSpec']
+
 
 class TokenizerSpec(ABC):
     @abstractmethod

diff --git a/nemo/collections/nlp/data/tokenizers/word_tokenizer.py b/nemo/collections/nlp/data/tokenizers/word_tokenizer.py
@@ -1,6 +1,7 @@
-__all__ = ['WordTokenizer']
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['WordTokenizer']
+
 
 class WordTokenizer(TokenizerSpec):
     def __init__(self, vocab_path):

diff --git a/nemo/collections/nlp/data/tokenizers/youtokentome_tokenizer.py b/nemo/collections/nlp/data/tokenizers/youtokentome_tokenizer.py
@@ -1,8 +1,9 @@
-__all__ = ['YouTokenToMeTokenizer']
 import youtokentome as yttm
 
 from nemo.collections.nlp.data.tokenizers.tokenizer_spec import TokenizerSpec
 
+__all__ = ['YouTokenToMeTokenizer']
+
 
 class YouTokenToMeTokenizer(TokenizerSpec):
     def __init__(self, model_path):

diff --git a/nemo/collections/nlp/nm/data_layers/glue_benchmark_datalayer.py b/nemo/collections/nlp/nm/data_layers/glue_benchmark_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['GlueClassificationDataLayer', 'GlueRegressionDataLayer']
 from nemo.collections.nlp.data import GLUEDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, CategoricalTag, NeuralType, RegressionTag, TimeTag
 
+__all__ = ['GlueClassificationDataLayer', 'GlueRegressionDataLayer']
+
 
 class GlueClassificationDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/joint_intent_slot_datalayer.py b/nemo/collections/nlp/nm/data_layers/joint_intent_slot_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['BertJointIntentSlotDataLayer', 'BertJointIntentSlotInferDataLayer']
 from nemo.collections.nlp.data import BertJointIntentSlotDataset, BertJointIntentSlotInferDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['BertJointIntentSlotDataLayer', 'BertJointIntentSlotInferDataLayer']
+
 
 class BertJointIntentSlotDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/lm_bert_datalayer.py b/nemo/collections/nlp/nm/data_layers/lm_bert_datalayer.py
@@ -1,4 +1,3 @@
-__all__ = ['BertPretrainingDataLayer', 'BertPretrainingPreprocessedDataLayer']
 import os
 import random
 
@@ -12,6 +11,8 @@
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['BertPretrainingDataLayer', 'BertPretrainingPreprocessedDataLayer']
+
 
 class BertPretrainingDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/lm_transformer_datalayer.py b/nemo/collections/nlp/nm/data_layers/lm_transformer_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['LanguageModelingDataLayer']
 from nemo.collections.nlp.data import LanguageModelingDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['LanguageModelingDataLayer']
+
 
 class LanguageModelingDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/machine_translation_datalayer.py b/nemo/collections/nlp/nm/data_layers/machine_translation_datalayer.py
@@ -1,4 +1,3 @@
-__all__ = ['TranslationDataLayer']
 import torch
 from torch.utils import data as pt_data
 
@@ -7,6 +6,8 @@
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['TranslationDataLayer']
+
 
 class TranslationDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/punctuation_capitalization_datalayer.py b/nemo/collections/nlp/nm/data_layers/punctuation_capitalization_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['PunctuationCapitalizationDataLayer']
 from nemo.collections.nlp.data import BertPunctuationCapitalizationDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['PunctuationCapitalizationDataLayer']
+
 
 class PunctuationCapitalizationDataLayer(TextDataLayer):
     @property

diff --git a/nemo/collections/nlp/nm/data_layers/qa_squad_datalayer.py b/nemo/collections/nlp/nm/data_layers/qa_squad_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['BertQuestionAnsweringDataLayer']
 from nemo.collections.nlp.data import SquadDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['BertQuestionAnsweringDataLayer']
+
 
 class BertQuestionAnsweringDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/text_classification_datalayer.py b/nemo/collections/nlp/nm/data_layers/text_classification_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['BertSentenceClassificationDataLayer']
 from nemo.collections.nlp.data import BertTextClassificationDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['BertSentenceClassificationDataLayer']
+
 
 class BertSentenceClassificationDataLayer(TextDataLayer):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/text_datalayer.py b/nemo/collections/nlp/nm/data_layers/text_datalayer.py
@@ -1,8 +1,8 @@
-__all__ = ['TextDataLayer']
-
 from nemo.backends.pytorch import DataLayerNM
 from nemo.collections.nlp.data.datasets import *
 
+__all__ = ['TextDataLayer']
+
 
 class TextDataLayer(DataLayerNM):
     """

diff --git a/nemo/collections/nlp/nm/data_layers/token_classification_datalayer.py b/nemo/collections/nlp/nm/data_layers/token_classification_datalayer.py
@@ -1,8 +1,9 @@
-__all__ = ['BertTokenClassificationDataLayer', 'BertTokenClassificationInferDataLayer']
 from nemo.collections.nlp.data import BertTokenClassificationDataset, BertTokenClassificationInferDataset
 from nemo.collections.nlp.nm.data_layers.text_datalayer import TextDataLayer
 from nemo.core import AxisType, BatchTag, NeuralType, TimeTag
 
+__all__ = ['BertTokenClassificationDataLayer', 'BertTokenClassificationInferDataLayer']
+
 
 class BertTokenClassificationDataLayer(TextDataLayer):
     @property

diff --git a/nemo/collections/nlp/nm/losses/aggregator_loss.py b/nemo/collections/nlp/nm/losses/aggregator_loss.py
@@ -1,7 +1,8 @@
-__all__ = ['LossAggregatorNM']
 from nemo.backends.pytorch import LossNM
 from nemo.core import NeuralType
 
+__all__ = ['LossAggregatorNM']
+
 
 class LossAggregatorNM(LossNM):
     """