Tests/ML/runners/test_runner.py

#  ------------------------------------------------------------------------------------------
#  Copyright (c) Microsoft Corporation. All rights reserved.
#  Licensed under the MIT License (MIT). See LICENSE in the repo root for license information.
#  ------------------------------------------------------------------------------------------
import logging
from pathlib import Path
import time
from unittest import mock
from unittest.mock import Mock

from azureml.train.hyperdrive.runconfig import HyperDriveConfig
import numpy as np
import pytest

from InnerEye.Common import common_util, fixed_paths
from InnerEye.Common.common_util import ModelProcessing, get_best_epoch_results_path
from InnerEye.Common.fixed_paths_for_tests import full_ml_test_data_path
from InnerEye.Common.output_directories import OutputFolderForTests
from InnerEye.Common.type_annotations import TupleInt3
from InnerEye.ML.common import BEST_CHECKPOINT_FILE_NAME_WITH_SUFFIX, ModelExecutionMode
from InnerEye.ML.metrics import InferenceMetricsForSegmentation
from InnerEye.ML.run_ml import MLRunner
from InnerEye.ML.runner import Runner
from InnerEye.ML.utils import io_util
from Tests.ML.configs.DummyModel import DummyModel
from Tests.ML.util import get_default_checkpoint_handler
from Tests.ML.utils.test_model_util import create_model_and_store_checkpoint


def create_smaller_image(image_size: TupleInt3, source_image_dir: Path, target_image_dir: Path, image_file_name: str) -> None:
    """
    Load an image from source_image_dir and create another random image in target_image_dir with same header and
    target size.

    :param image_size: Target image size.
    :param source_image_dir: Source image directory.
    :param target_image_dir: Target image directory.
    :param image_file_name: Common image file name.
    :return: None.
    """
    source_image = io_util.load_nifti_image(source_image_dir / image_file_name)
    source_image_data = source_image.image
    min_data_val = np.min(source_image_data)
    max_data_val = np.max(source_image_data)

    image = np.random.randint(low=min_data_val, high=max_data_val + 1, size=image_size)
    io_util.store_as_nifti(image, source_image.header, target_image_dir / image_file_name, np.short)


def create_train_and_test_data_small(image_size: TupleInt3, source_image_dir: Path,
                                     target_image_dir: Path) -> None:
    """
    Create smaller, random, versions of the images from source_image_dir in target_image_dir.

    :param image_size: Target image size:
    :param source_image_dir: Source image directory.
    :param target_image_dir: Target image directory.
    :return: None.
    """
    for channel_file_name in ["id1_channel1.nii.gz", "id1_channel2.nii.gz", "id2_channel1.nii.gz", "id2_channel2.nii.gz"]:
        create_smaller_image(image_size, source_image_dir, target_image_dir, channel_file_name)

    for mask_file_name in ["id1_mask.nii.gz", "id2_mask.nii.gz"]:
        create_smaller_image(image_size, source_image_dir, target_image_dir, mask_file_name)

    for region_file_name in ["id1_region.nii.gz", "id2_region.nii.gz"]:
        create_smaller_image(image_size, source_image_dir, target_image_dir, region_file_name)


def create_train_and_test_data_small_dataset(image_size: TupleInt3,
                                             source_dir: Path, source_images_folder: str,
                                             target_dir: Path, target_images_folder: str) -> Path:
    """
    Create smaller, random, versions of the dataset and images from source_dir in target_dir.

    :param image_size: Target image size:
    :param source_dir: Source dataset directory.
    :param source_images_folder: Source images folder.
    :param target_dir: Target dataset directory.
    :param target_images_folder: Target images folder.
    :return: target_dir.
    """
    # Load and rewrite dataset.csv
    csv_str = (source_dir / "dataset.csv").read_text()
    csv_str = csv_str.replace(source_images_folder, target_images_folder)

    target_dir.mkdir(parents=True)
    (target_dir / "dataset.csv").write_text(csv_str)

    source_image_dir = source_dir / source_images_folder

    target_image_dir = target_dir / target_images_folder
    target_image_dir.mkdir()
    create_train_and_test_data_small(image_size, source_image_dir, target_image_dir)
    return target_dir


@pytest.mark.skipif(common_util.is_windows(), reason="Too slow on windows")
@pytest.mark.parametrize("perform_cross_validation", [True, False])
@pytest.mark.parametrize("inference_on_train_set", [True, False])
@pytest.mark.parametrize("inference_on_val_set", [True, False])
@pytest.mark.parametrize("inference_on_test_set", [True, False])
def test_model_inference_train_and_test(test_output_dirs: OutputFolderForTests,
                                        perform_cross_validation: bool,
                                        inference_on_train_set: bool,
                                        inference_on_val_set: bool,
                                        inference_on_test_set: bool) -> None:
    run_model_inference_train_and_test(test_output_dirs,
                                       perform_cross_validation,
                                       inference_on_train_set,
                                       inference_on_val_set,
                                       inference_on_test_set,
                                       False,
                                       False,
                                       False,
                                       ModelProcessing.DEFAULT)


@pytest.mark.skipif(common_util.is_windows(), reason="Too slow on windows")
@pytest.mark.parametrize("ensemble_inference_on_train_set", [True, False])
@pytest.mark.parametrize("ensemble_inference_on_val_set", [True, False])
@pytest.mark.parametrize("ensemble_inference_on_test_set", [True, False])
def test_ensemble_model_inference_train_and_test(test_output_dirs: OutputFolderForTests,
                                                 ensemble_inference_on_train_set: bool,
                                                 ensemble_inference_on_val_set: bool,
                                                 ensemble_inference_on_test_set: bool) -> None:
    run_model_inference_train_and_test(test_output_dirs,
                                       True,
                                       False,
                                       False,
                                       False,
                                       ensemble_inference_on_train_set,
                                       ensemble_inference_on_val_set,
                                       ensemble_inference_on_test_set,
                                       ModelProcessing.ENSEMBLE_CREATION)


def run_model_inference_train_and_test(test_output_dirs: OutputFolderForTests,
                                       perform_cross_validation: bool,
                                       inference_on_train_set: bool,
                                       inference_on_val_set: bool,
                                       inference_on_test_set: bool,
                                       ensemble_inference_on_train_set: bool,
                                       ensemble_inference_on_val_set: bool,
                                       ensemble_inference_on_test_set: bool,
                                       model_proc: ModelProcessing) -> None:
    config = DummyModel()
    config.crop_size = (29, 29, 29)
    config.test_crop_size = (29, 29, 29)
    config.number_of_cross_validation_splits = 2 if perform_cross_validation else 0
    config.inference_on_train_set = inference_on_train_set
    config.inference_on_val_set = inference_on_val_set
    config.inference_on_test_set = inference_on_test_set
    config.ensemble_inference_on_train_set = ensemble_inference_on_train_set
    config.ensemble_inference_on_val_set = ensemble_inference_on_val_set
    config.ensemble_inference_on_test_set = ensemble_inference_on_test_set
    # Plotting crashes with random TCL errors on Windows, disable that for Windows PR builds.
    config.is_plotting_enabled = common_util.is_linux()

    config.set_output_to(test_output_dirs.root_dir)
    config.local_dataset = create_train_and_test_data_small_dataset(config.test_crop_size,
                                                                    full_ml_test_data_path(),
                                                                    "train_and_test_data",
                                                                    test_output_dirs.root_dir / "train_and_test_data_small",
                                                                    "data")

    checkpoint_path = config.checkpoint_folder / BEST_CHECKPOINT_FILE_NAME_WITH_SUFFIX
    create_model_and_store_checkpoint(config, checkpoint_path)
    checkpoint_handler = get_default_checkpoint_handler(model_config=config,
                                                        project_root=test_output_dirs.root_dir)
    checkpoint_handler.additional_training_done()

    with mock.patch("InnerEye.ML.model_testing.PARENT_RUN_CONTEXT", Mock()) as m:
        metrics = MLRunner(config).model_inference_train_and_test(
            checkpoint_handler=checkpoint_handler,
            model_proc=model_proc)

    if model_proc == ModelProcessing.DEFAULT:
        named_metrics = \
            {
                ModelExecutionMode.TRAIN: inference_on_train_set,
                ModelExecutionMode.TEST: inference_on_test_set,
                ModelExecutionMode.VAL: inference_on_val_set
            }
    else:
        named_metrics = \
            {
                ModelExecutionMode.TRAIN: ensemble_inference_on_train_set,
                ModelExecutionMode.TEST: ensemble_inference_on_test_set,
                ModelExecutionMode.VAL: ensemble_inference_on_val_set
            }

    error = ''
    expected_upload_folder_count = 0
    for mode, flag in named_metrics.items():
        if mode in metrics:
            metric = metrics[mode]
            assert isinstance(metric, InferenceMetricsForSegmentation)
        if mode in metrics and not flag:
            error = error + f"Error: {mode.value} cannot be not None."
        elif mode not in metrics and flag:
            error = error + f"Error: {mode.value} cannot be None."
        results_folder = config.outputs_folder / get_best_epoch_results_path(mode, model_proc)
        folder_exists = results_folder.is_dir()
        assert folder_exists == flag
        if flag and model_proc == ModelProcessing.ENSEMBLE_CREATION:
            expected_upload_folder_count = expected_upload_folder_count + 1
            expected_name = get_best_epoch_results_path(mode, ModelProcessing.DEFAULT)
            m.upload_folder.assert_any_call(name=str(expected_name), path=str(results_folder))
    if len(error):
        raise ValueError(error)

    assert m.upload_folder.call_count == expected_upload_folder_count


def test_logging_to_file(test_output_dirs: OutputFolderForTests) -> None:
    # Log file should go to a new, non-existent folder, 2 levels deep
    file_path = test_output_dirs.root_dir / "subdir1" / "subdir2" / "logfile.txt"
    assert common_util.logging_to_file_handler is None
    common_util.logging_to_file(file_path)
    assert common_util.logging_to_file_handler is not None
    log_line = "foo bar"
    logging.getLogger().setLevel(logging.INFO)
    logging.info(log_line)
    common_util.disable_logging_to_file()
    should_not_be_present = "This should not be present in logs"
    logging.info(should_not_be_present)
    assert common_util.logging_to_file_handler is None
    # Wait for a bit, tests sometimes fail with the file not existing yet
    time.sleep(2)
    assert file_path.exists()
    assert log_line in file_path.read_text()
    assert should_not_be_present not in file_path.read_text()


def test_cross_validation_for_LightingContainer_models_is_supported() -> None:
    '''
    Prior to https://github.com/microsoft/InnerEye-DeepLearning/pull/483 we raised an exception in
    runner.run when cross validation was attempted on a lightning container. This test checks that
    we do not raise the exception anymore, and instead pass on a cross validation hyperdrive config
    to azure_runner's submit_to_azureml method.
    '''
    args_list = ["--model=HelloContainer", "--number_of_cross_validation_splits=5", "--azureml=True"]
    with mock.patch("sys.argv", [""] + args_list):
        runner = Runner(project_root=fixed_paths.repository_root_directory(), yaml_config_file=fixed_paths.SETTINGS_YAML_FILE)
        with mock.patch("InnerEye.Azure.azure_runner.create_and_submit_experiment", return_value=None) as create_and_submit_experiment_patch:
            runner.run()
            assert runner.lightning_container.model_name == 'HelloContainer'
            assert runner.lightning_container.number_of_cross_validation_splits == 5
            args, _ = create_and_submit_experiment_patch.call_args
            script_run_config = args[1]
            assert isinstance(script_run_config, HyperDriveConfig)