columns.py

import pandas as pd
import analyzer
import devices
import services

# mask = [original, measurement, code_of_sensor, voltage_param,
#         short_search_name, full_search_name, concat_of_short_search_name_and_voltage_param]

#  Need to organize "file=devices.nkvv.work_file" etc... ->  to func.
def columns_list_maker(device_type: str = 'nkvv',
                       data: pd.core = None,
                       file: str = None,
                       sep: str = None,
                       encoding: str = None):
    """
    Makes list of columns based on set properties
    Must have a device_type set and a raw data input
    Mostly works well with a default device properties described in devices.py
    Recommended to return the dict in a variable 'cols_list' in a runner-file
    """
    if file is None:
        file, sep, encoding, parse_dates = devices.links(device_type)[1:5]
    if device_type == 'nkvv':
        return list(pd.read_csv(file, sep=sep, encoding=encoding))
    elif device_type == 'gpp':
        return pd.read_csv(file, sep=sep, encoding=encoding, header=[1]).iloc[0].to_string().split('     ')
    elif device_type == 'kiv':
        if data is None:
            data = analyzer.get_data(device_type=device_type)
        if data.columns[0] == ' № ':
            return list(data.columns)
        else:
            for i in range(data.shape[0]):
                if data.iloc[i, 0] != ' № ':
                    pass
                else:
                    return list(data.iloc[i+1])
                    # noinspection PyUnreachableCode
                    break
    elif device_type == 'mon':
        if data is None:
            data = analyzer.get_data(device_type=device_type)
        return list(data.columns)


#  Analyze all columns
def columns_analyzer(device_type: str ='nkvv',
                     list_for_columns: list = None):
    """
    Must have a device_type set. Should take a list of columns as a base (recommend to use func. 'columns_list_maker')
    Based on devices attributes processes data columns into a dictionary with enumerated keys.
    and values as list of parameters (the mask):
        original name,
        measurement,
        code_of_sensor,
        voltage_param,
        short_search_name,
        full_search_name,
        concat_of_short_search_name_and_voltage_param
    The keys of the dictionary can be used as indexes
    Uses in analytical functions for defining the processing columns
    Recommended to return the dict in a variable 'cols' in a runner-file
    """
    if list_for_columns is None:
        list_for_columns = columns_list_maker(device_type=device_type)
    source_dict = {k: [v] for k, v in enumerate(list_for_columns)}
    result_dict = source_dict.copy()
    if device_type == "nkvv":
        for i in range(len(result_dict)):
            tail = services.Trimmer.right(result_dict[i][0], 2)
            head = services.Trimmer.left(result_dict[i][0], 4)
            for key in devices.nkvv.data_types:
                if key == tail:
                    result_dict[i].append(devices.nkvv.data_types[tail])
                elif key == head:
                    result_dict[i].append(devices.nkvv.data_types[head])
            if len(result_dict[i]) < 2:
                result_dict[i].append('other')
            if result_dict[i][0].find("_") == -1:
                result_dict[i].append('overall')
            else:
                codename = services.Trimmer.right((services.Trimmer.left(result_dict[i][0],
                                                                     result_dict[i][0].find("_") + 3)), 2)
                result_dict[i].append(codename)
            if services.Trimmer.right(result_dict[i][2], 1) == '1':
                result_dict[i].append('HV')
            elif services.Trimmer.right(result_dict[i][2], 1) == '2':
                result_dict[i].append('MV')
            else:
                result_dict[i].append('no_voltage')
            for a_key in devices.nkvv.data_search_name:
                if services.Trimmer.left(result_dict[i][0], len(a_key)) == a_key:
                    result_dict[i].append(devices.nkvv.data_search_name[a_key][0])
                    result_dict[i].append(devices.nkvv.data_search_name[a_key][1])
            if len(result_dict[i]) < 5:
                result_dict[i].append('-')
                result_dict[i].append('-')
            result_dict[i].append(result_dict[i][4] + '_' + result_dict[i][3])
    elif device_type == 'mon':  # merge with nkvv, set links to device_class
        for i in range(len(result_dict)):
            tail = services.Trimmer.right(result_dict[3][0], 2)
            head = services.Trimmer.left(result_dict[3][0], 4)
            for key in devices.mon.data_types:
                if key == tail:
                    result_dict[i].append(devices.mon.data_types[tail])
                elif key == head:
                    result_dict[i].append(devices.mon.data_types[head])
            if len(result_dict[i]) < 2:
                result_dict[i].append('other')
            if result_dict[i][0].find("_") == -1:
                result_dict[i].append('overall')
            else:
                codename = services.Trimmer.right((services.Trimmer.left(result_dict[i][0],
                                                                     result_dict[i][0].find("_") + 3)), 2)
                result_dict[i].append(codename)
            if services.Trimmer.right(result_dict[i][2], 1) == '1':
                result_dict[i].append('HV')
            elif services.Trimmer.right(result_dict[i][2], 1) == '2':
                result_dict[i].append('MV')
            else:
                result_dict[i].append('no_voltage')
            for a_key in devices.mon.data_search_name:
                if services.Trimmer.left(result_dict[i][0], len(a_key)) == a_key:
                    result_dict[i].append(devices.mon.data_search_name[a_key][0])
                    result_dict[i].append(devices.mon.data_search_name[a_key][1])
            if len(result_dict[i]) < 5:
                result_dict[i].append('-')
                result_dict[i].append('-')
            result_dict[i].append(result_dict[i][4] + '_' + result_dict[i][3])
    elif device_type == 'kiv':
        for i in range(len(result_dict)):
            tail = services.Trimmer.right(result_dict[i][0], 2)
            head = services.Trimmer.left(result_dict[i][0], 4)
            for key in devices.kiv.data_types:
                if key == tail:
                    result_dict[i].append(devices.kiv.data_types[key])
                elif key == head:
                    result_dict[i].append(devices.kiv.data_types[key])
                elif 'ф.' in str(result_dict[i][0]):  # Works with kiv.xlsx for a phase-parameters
                    if str(result_dict[i][0]).startswith(key):
                        result_dict[i].append(devices.kiv.data_types[key])
            if len(result_dict[i]) < 2:
                result_dict[i].append("other")
            if result_dict[i][0].find("ф.") == -1:
                result_dict[i].append('overall')
            else:
                codename = services.Trimmer.right((services.Trimmer.left(source_dict[i][0],
                                                                     source_dict[i][0].find("ф.") + 3)), 1) + '0'
                source_dict[i].append(codename)
            if 'ф.' in str(result_dict[i][0]):  # Works with kiv.xlsx for a phase-parameters
                result_dict[i].append("MV")
            elif 'unb' in str(result_dict[i][0]):  # Works with kiv.xlsx for a phase-parameters
                result_dict[i].append("unb")
            else:
                result_dict[i].append('no_voltage')
            for a_key in devices.kiv.data_search_name:
                # if services.Trimmer.left(source_dict[i][0], len(a_key)) == a_key and 'ф.' or 'Дата' in str(result_dict[i][0]):
                if services.Trimmer.left(source_dict[i][0], len(a_key)) == a_key:
                    # noinspection PyBroadException
                    try:
                        source_dict[i][4] = devices.kiv.data_search_name[a_key][0]
                        source_dict[i][5] = devices.kiv.data_search_name[a_key][1]
                    except:
                        source_dict[i].append('-')
                        source_dict[i].append('-')
                        source_dict[i][4] = devices.kiv.data_search_name[a_key][0]
                        source_dict[i][5] = devices.kiv.data_search_name[a_key][1]
            if len(source_dict[i]) < 5:
                source_dict[i].append('-')
                source_dict[i].append('-')
            source_dict[i].append(source_dict[i][4] + '_' + source_dict[i][3])
    elif device_type == 'gpp':
        pass
    return result_dict


def time_column(device_type='nkvv',
                data: pd.core = None):
    """
    Returns full name of a timestamp-column in data
    Uses 'device' property 'self.file_parse_dates' (property stores a list of columns which contain time-type data)
    The main time column (with the fixed time of the measurement) must be first in the list of 'self.file_parse_dates'
    """
    the_time_column = None
    device_type = device_type.lower()
    if data is None:
        data = analyzer.get_data(device_type=device_type)
    parse_dates = devices.links(device_type)[4]
    for an_element_of_parse_dates in parse_dates:
        for a_column in list(data.columns):
            if a_column.startswith(an_element_of_parse_dates):
                the_time_column = a_column
        break
    try:
        type(data[the_time_column]) == pd.core.series.Series
    except KeyError:
        print(f'Ошибка поиска колонки с временем замера, проверьте свойства устройства и атрибут'
              f' "self.file_parse_dates" в модуле устройств "devices.py"')
    return the_time_column


def columns_df(device_type='mon', cols: dict = None):
    """
    Used for transformation of 'cols'-dict to pandas dataframe
    """
    if cols is None:
        cols = columns_analyzer(device_type=device_type)
    return pd.DataFrame.from_dict(cols,  orient='index', columns=[
        'Наименование',
        'Тип по ед. измерения',
        'Датчик',
        'Напряжение',
        'Код краткий',
        'Код полный',
        'Код + напряжение'])