shell/lib/perf_metric_validation.py

3ad7092fSWeilin Wang#SPDX-License-Identifier: GPL-2.0
3ad7092fSWeilin Wangimport re
3ad7092fSWeilin Wangimport csv
3ad7092fSWeilin Wangimport json
3ad7092fSWeilin Wangimport argparse
3ad7092fSWeilin Wangfrom pathlib import Path
3ad7092fSWeilin Wangimport subprocess
3ad7092fSWeilin Wang
3ad7092fSWeilin Wangclass Validator:
3ad7092fSWeilin Wang    def __init__(self, rulefname, reportfname='', t=5, debug=False, datafname='', fullrulefname='', workload='true', metrics=''):
3ad7092fSWeilin Wang        self.rulefname = rulefname
3ad7092fSWeilin Wang        self.reportfname = reportfname
3ad7092fSWeilin Wang        self.rules = None
*1203a63dSWeilin Wang        self.collectlist:str = metrics
*1203a63dSWeilin Wang        self.metrics = self.__set_metrics(metrics)
*1203a63dSWeilin Wang        self.skiplist = set()
3ad7092fSWeilin Wang        self.tolerance = t
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        self.workloads = [x for x in workload.split(",") if x]
3ad7092fSWeilin Wang        self.wlidx = 0 # idx of current workloads
3ad7092fSWeilin Wang        self.allresults = dict() # metric results of all workload
3ad7092fSWeilin Wang        self.allignoremetrics = dict() # metrics with no results or negative results
3ad7092fSWeilin Wang        self.allfailtests = dict()
3ad7092fSWeilin Wang        self.alltotalcnt = dict()
3ad7092fSWeilin Wang        self.allpassedcnt = dict()
3ad7092fSWeilin Wang        self.allerrlist = dict()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        self.results = dict() # metric results of current workload
3ad7092fSWeilin Wang        # vars for test pass/failure statistics
3ad7092fSWeilin Wang        self.ignoremetrics= set() # metrics with no results or negative results, neg result counts as a failed test
3ad7092fSWeilin Wang        self.failtests = dict()
3ad7092fSWeilin Wang        self.totalcnt = 0
3ad7092fSWeilin Wang        self.passedcnt = 0
3ad7092fSWeilin Wang        # vars for errors
3ad7092fSWeilin Wang        self.errlist = list()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        # vars for Rule Generator
3ad7092fSWeilin Wang        self.pctgmetrics = set() # Percentage rule
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        # vars for debug
3ad7092fSWeilin Wang        self.datafname = datafname
3ad7092fSWeilin Wang        self.debug = debug
3ad7092fSWeilin Wang        self.fullrulefname = fullrulefname
3ad7092fSWeilin Wang
*1203a63dSWeilin Wang    def __set_metrics(self, metrics=''):
*1203a63dSWeilin Wang        if metrics != '':
*1203a63dSWeilin Wang            return set(metrics.split(","))
*1203a63dSWeilin Wang        else:
*1203a63dSWeilin Wang            return set()
*1203a63dSWeilin Wang
3ad7092fSWeilin Wang    def read_json(self, filename: str) -> dict:
3ad7092fSWeilin Wang        try:
3ad7092fSWeilin Wang            with open(Path(filename).resolve(), "r") as f:
3ad7092fSWeilin Wang                data = json.loads(f.read())
3ad7092fSWeilin Wang        except OSError as e:
3ad7092fSWeilin Wang            print(f"Error when reading file {e}")
3ad7092fSWeilin Wang            sys.exit()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return data
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def json_dump(self, data, output_file):
3ad7092fSWeilin Wang        parent = Path(output_file).parent
3ad7092fSWeilin Wang        if not parent.exists():
3ad7092fSWeilin Wang            parent.mkdir(parents=True)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        with open(output_file, "w+") as output_file:
3ad7092fSWeilin Wang            json.dump(data,
3ad7092fSWeilin Wang                      output_file,
3ad7092fSWeilin Wang                      ensure_ascii=True,
3ad7092fSWeilin Wang                      indent=4)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def get_results(self, idx:int = 0):
3ad7092fSWeilin Wang        return self.results[idx]
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def get_bounds(self, lb, ub, error, alias={}, ridx:int = 0) -> list:
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Get bounds and tolerance from lb, ub, and error.
3ad7092fSWeilin Wang        If missing lb, use 0.0; missing ub, use float('inf); missing error, use self.tolerance.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param lb: str/float, lower bound
3ad7092fSWeilin Wang        @param ub: str/float, upper bound
3ad7092fSWeilin Wang        @param error: float/str, error tolerance
3ad7092fSWeilin Wang        @returns: lower bound, return inf if the lower bound is a metric value and is not collected
3ad7092fSWeilin Wang                  upper bound, return -1 if the upper bound is a metric value and is not collected
3ad7092fSWeilin Wang                  tolerance, denormalized base on upper bound value
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        # init ubv and lbv to invalid values
3ad7092fSWeilin Wang        def get_bound_value (bound, initval, ridx):
3ad7092fSWeilin Wang            val = initval
3ad7092fSWeilin Wang            if isinstance(bound, int) or isinstance(bound, float):
3ad7092fSWeilin Wang                val = bound
3ad7092fSWeilin Wang            elif isinstance(bound, str):
3ad7092fSWeilin Wang                if bound == '':
3ad7092fSWeilin Wang                    val = float("inf")
3ad7092fSWeilin Wang                elif bound in alias:
3ad7092fSWeilin Wang                    vall = self.get_value(alias[ub], ridx)
3ad7092fSWeilin Wang                    if vall:
3ad7092fSWeilin Wang                        val = vall[0]
3ad7092fSWeilin Wang                elif bound.replace('.', '1').isdigit():
3ad7092fSWeilin Wang                    val = float(bound)
3ad7092fSWeilin Wang                else:
3ad7092fSWeilin Wang                    print("Wrong bound: {0}".format(bound))
3ad7092fSWeilin Wang            else:
3ad7092fSWeilin Wang                print("Wrong bound: {0}".format(bound))
3ad7092fSWeilin Wang            return val
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        ubv = get_bound_value(ub, -1, ridx)
3ad7092fSWeilin Wang        lbv = get_bound_value(lb, float('inf'), ridx)
3ad7092fSWeilin Wang        t = get_bound_value(error, self.tolerance, ridx)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        # denormalize error threshold
3ad7092fSWeilin Wang        denormerr = t * ubv / 100 if ubv != 100 and ubv > 0 else t
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return lbv, ubv, denormerr
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def get_value(self, name:str, ridx:int = 0) -> list:
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Get value of the metric from self.results.
3ad7092fSWeilin Wang        If result of this metric is not provided, the metric name will be added into self.ignoremetics and self.errlist.
3ad7092fSWeilin Wang        All future test(s) on this metric will fail.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param name: name of the metric
*1203a63dSWeilin Wang        @returns: list with value found in self.results; list is empty when value is not found.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        results = []
3ad7092fSWeilin Wang        data = self.results[ridx] if ridx in self.results else self.results[0]
3ad7092fSWeilin Wang        if name not in self.ignoremetrics:
3ad7092fSWeilin Wang            if name in data:
3ad7092fSWeilin Wang                results.append(data[name])
3ad7092fSWeilin Wang            elif name.replace('.', '1').isdigit():
3ad7092fSWeilin Wang                results.append(float(name))
3ad7092fSWeilin Wang            else:
3ad7092fSWeilin Wang                self.ignoremetrics.add(name)
3ad7092fSWeilin Wang        return results
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def check_bound(self, val, lb, ub, err):
3ad7092fSWeilin Wang        return True if val <= ub + err and val >= lb - err else False
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    # Positive Value Sanity check
3ad7092fSWeilin Wang    def pos_val_test(self):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Check if metrics value are non-negative.
3ad7092fSWeilin Wang        One metric is counted as one test.
3ad7092fSWeilin Wang        Failure: when metric value is negative or not provided.
3ad7092fSWeilin Wang        Metrics with negative value will be added into the self.failtests['PositiveValueTest'] and self.ignoremetrics.
3ad7092fSWeilin Wang        """
*1203a63dSWeilin Wang        negmetric = dict()
3ad7092fSWeilin Wang        pcnt = 0
3ad7092fSWeilin Wang        tcnt = 0
*1203a63dSWeilin Wang        rerun = list()
3ad7092fSWeilin Wang        for name, val in self.get_results().items():
*1203a63dSWeilin Wang            if val < 0:
*1203a63dSWeilin Wang                negmetric[name] = val
*1203a63dSWeilin Wang                rerun.append(name)
3ad7092fSWeilin Wang            else:
3ad7092fSWeilin Wang                pcnt += 1
3ad7092fSWeilin Wang            tcnt += 1
*1203a63dSWeilin Wang        if len(rerun) > 0 and len(rerun) < 20:
*1203a63dSWeilin Wang            second_results = dict()
*1203a63dSWeilin Wang            self.second_test(rerun, second_results)
*1203a63dSWeilin Wang            for name, val in second_results.items():
*1203a63dSWeilin Wang                if name not in negmetric: continue
*1203a63dSWeilin Wang                if val >= 0:
*1203a63dSWeilin Wang                    del negmetric[name]
*1203a63dSWeilin Wang                    pcnt += 1
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        self.failtests['PositiveValueTest']['Total Tests'] = tcnt
3ad7092fSWeilin Wang        self.failtests['PositiveValueTest']['Passed Tests'] = pcnt
*1203a63dSWeilin Wang        if len(negmetric.keys()):
*1203a63dSWeilin Wang            self.ignoremetrics.update(negmetric.keys())
*1203a63dSWeilin Wang            negmessage = ["{0}(={1:.4f})".format(name, val) for name, val in negmetric.items()]
*1203a63dSWeilin Wang            self.failtests['PositiveValueTest']['Failed Tests'].append({'NegativeValue': negmessage})
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def evaluate_formula(self, formula:str, alias:dict, ridx:int = 0):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Evaluate the value of formula.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param formula: the formula to be evaluated
3ad7092fSWeilin Wang        @param alias: the dict has alias to metric name mapping
3ad7092fSWeilin Wang        @returns: value of the formula is success; -1 if the one or more metric value not provided
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        stack = []
3ad7092fSWeilin Wang        b = 0
3ad7092fSWeilin Wang        errs = []
3ad7092fSWeilin Wang        sign = "+"
3ad7092fSWeilin Wang        f = str()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        #TODO: support parenthesis?
3ad7092fSWeilin Wang        for i in range(len(formula)):
3ad7092fSWeilin Wang            if i+1 == len(formula) or formula[i] in ('+', '-', '*', '/'):
3ad7092fSWeilin Wang                s = alias[formula[b:i]] if i+1 < len(formula) else alias[formula[b:]]
3ad7092fSWeilin Wang                v = self.get_value(s, ridx)
3ad7092fSWeilin Wang                if not v:
3ad7092fSWeilin Wang                    errs.append(s)
3ad7092fSWeilin Wang                else:
3ad7092fSWeilin Wang                    f = f + "{0}(={1:.4f})".format(s, v[0])
3ad7092fSWeilin Wang                    if sign == "*":
3ad7092fSWeilin Wang                        stack[-1] = stack[-1] * v
3ad7092fSWeilin Wang                    elif sign == "/":
3ad7092fSWeilin Wang                        stack[-1] = stack[-1] / v
3ad7092fSWeilin Wang                    elif sign == '-':
3ad7092fSWeilin Wang                        stack.append(-v[0])
3ad7092fSWeilin Wang                    else:
3ad7092fSWeilin Wang                        stack.append(v[0])
3ad7092fSWeilin Wang                if i + 1 < len(formula):
3ad7092fSWeilin Wang                    sign = formula[i]
3ad7092fSWeilin Wang                    f += sign
3ad7092fSWeilin Wang                    b = i + 1
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        if len(errs) > 0:
3ad7092fSWeilin Wang            return -1, "Metric value missing: "+','.join(errs)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        val = sum(stack)
3ad7092fSWeilin Wang        return val, f
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    # Relationships Tests
3ad7092fSWeilin Wang    def relationship_test(self, rule: dict):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Validate if the metrics follow the required relationship in the rule.
3ad7092fSWeilin Wang        eg. lower_bound <= eval(formula)<= upper_bound
3ad7092fSWeilin Wang        One rule is counted as ont test.
3ad7092fSWeilin Wang        Failure: when one or more metric result(s) not provided, or when formula evaluated outside of upper/lower bounds.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param rule: dict with metric name(+alias), formula, and required upper and lower bounds.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        alias = dict()
3ad7092fSWeilin Wang        for m in rule['Metrics']:
3ad7092fSWeilin Wang            alias[m['Alias']] = m['Name']
3ad7092fSWeilin Wang        lbv, ubv, t = self.get_bounds(rule['RangeLower'], rule['RangeUpper'], rule['ErrorThreshold'], alias, ridx=rule['RuleIndex'])
3ad7092fSWeilin Wang        val, f = self.evaluate_formula(rule['Formula'], alias, ridx=rule['RuleIndex'])
3ad7092fSWeilin Wang        if val == -1:
3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Failed Tests'].append({'RuleIndex': rule['RuleIndex'], 'Description':f})
3ad7092fSWeilin Wang        elif not self.check_bound(val, lbv, ubv, t):
3ad7092fSWeilin Wang            lb = rule['RangeLower']
3ad7092fSWeilin Wang            ub = rule['RangeUpper']
3ad7092fSWeilin Wang            if isinstance(lb, str):
3ad7092fSWeilin Wang                if lb in alias:
3ad7092fSWeilin Wang                    lb = alias[lb]
3ad7092fSWeilin Wang            if isinstance(ub, str):
3ad7092fSWeilin Wang                if ub in alias:
3ad7092fSWeilin Wang                    ub = alias[ub]
3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Failed Tests'].append({'RuleIndex': rule['RuleIndex'], 'Formula':f,
3ad7092fSWeilin Wang                                                                       'RangeLower': lb, 'LowerBoundValue': self.get_value(lb),
3ad7092fSWeilin Wang                                                                       'RangeUpper': ub, 'UpperBoundValue':self.get_value(ub),
3ad7092fSWeilin Wang                                                                       'ErrorThreshold': t, 'CollectedValue': val})
3ad7092fSWeilin Wang        else:
3ad7092fSWeilin Wang            self.passedcnt += 1
3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Passed Tests'] += 1
3ad7092fSWeilin Wang        self.totalcnt += 1
3ad7092fSWeilin Wang        self.failtests['RelationshipTest']['Total Tests'] += 1
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    # Single Metric Test
3ad7092fSWeilin Wang    def single_test(self, rule:dict):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Validate if the metrics are in the required value range.
3ad7092fSWeilin Wang        eg. lower_bound <= metrics_value <= upper_bound
3ad7092fSWeilin Wang        One metric is counted as one test in this type of test.
3ad7092fSWeilin Wang        One rule may include one or more metrics.
3ad7092fSWeilin Wang        Failure: when the metric value not provided or the value is outside the bounds.
3ad7092fSWeilin Wang        This test updates self.total_cnt and records failed tests in self.failtest['SingleMetricTest'].
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param rule: dict with metrics to validate and the value range requirement
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        lbv, ubv, t = self.get_bounds(rule['RangeLower'], rule['RangeUpper'], rule['ErrorThreshold'])
3ad7092fSWeilin Wang        metrics = rule['Metrics']
3ad7092fSWeilin Wang        passcnt = 0
3ad7092fSWeilin Wang        totalcnt = 0
*1203a63dSWeilin Wang        faillist = list()
*1203a63dSWeilin Wang        failures = dict()
*1203a63dSWeilin Wang        rerun = list()
3ad7092fSWeilin Wang        for m in metrics:
3ad7092fSWeilin Wang            totalcnt += 1
3ad7092fSWeilin Wang            result = self.get_value(m['Name'])
*1203a63dSWeilin Wang            if len(result) > 0 and self.check_bound(result[0], lbv, ubv, t) or m['Name'] in self.skiplist:
3ad7092fSWeilin Wang                passcnt += 1
3ad7092fSWeilin Wang            else:
*1203a63dSWeilin Wang                failures[m['Name']] = result
*1203a63dSWeilin Wang                rerun.append(m['Name'])
*1203a63dSWeilin Wang
*1203a63dSWeilin Wang        if len(rerun) > 0 and len(rerun) < 20:
*1203a63dSWeilin Wang            second_results = dict()
*1203a63dSWeilin Wang            self.second_test(rerun, second_results)
*1203a63dSWeilin Wang            for name, val in second_results.items():
*1203a63dSWeilin Wang                if name not in failures: continue
*1203a63dSWeilin Wang                if self.check_bound(val, lbv, ubv, t):
*1203a63dSWeilin Wang                    passcnt += 1
*1203a63dSWeilin Wang                    del failures[name]
*1203a63dSWeilin Wang                else:
*1203a63dSWeilin Wang                    failures[name] = val
*1203a63dSWeilin Wang                    self.results[0][name] = val
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        self.totalcnt += totalcnt
3ad7092fSWeilin Wang        self.passedcnt += passcnt
3ad7092fSWeilin Wang        self.failtests['SingleMetricTest']['Total Tests'] += totalcnt
3ad7092fSWeilin Wang        self.failtests['SingleMetricTest']['Passed Tests'] += passcnt
*1203a63dSWeilin Wang        if len(failures.keys()) != 0:
*1203a63dSWeilin Wang            faillist = [{'MetricName':name, 'CollectedValue':val} for name, val in failures.items()]
3ad7092fSWeilin Wang            self.failtests['SingleMetricTest']['Failed Tests'].append({'RuleIndex':rule['RuleIndex'],
3ad7092fSWeilin Wang                                                                       'RangeLower': rule['RangeLower'],
3ad7092fSWeilin Wang                                                                       'RangeUpper': rule['RangeUpper'],
3ad7092fSWeilin Wang                                                                       'ErrorThreshold':rule['ErrorThreshold'],
3ad7092fSWeilin Wang                                                                       'Failure':faillist})
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def create_report(self):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Create final report and write into a JSON file.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        alldata = list()
3ad7092fSWeilin Wang        for i in range(0, len(self.workloads)):
3ad7092fSWeilin Wang            reportstas = {"Total Rule Count": self.alltotalcnt[i], "Passed Rule Count": self.allpassedcnt[i]}
3ad7092fSWeilin Wang            data = {"Metric Validation Statistics": reportstas, "Tests in Category": self.allfailtests[i],
3ad7092fSWeilin Wang                    "Errors":self.allerrlist[i]}
3ad7092fSWeilin Wang            alldata.append({"Workload": self.workloads[i], "Report": data})
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        json_str = json.dumps(alldata, indent=4)
3ad7092fSWeilin Wang        print("Test validation finished. Final report: ")
3ad7092fSWeilin Wang        print(json_str)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        if self.debug:
3ad7092fSWeilin Wang            allres = [{"Workload": self.workloads[i], "Results": self.allresults[i]} for i in range(0, len(self.workloads))]
3ad7092fSWeilin Wang            self.json_dump(allres, self.datafname)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def check_rule(self, testtype, metric_list):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Check if the rule uses metric(s) that not exist in current platform.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        @param metric_list: list of metrics from the rule.
3ad7092fSWeilin Wang        @return: False when find one metric out in Metric file. (This rule should not skipped.)
3ad7092fSWeilin Wang                 True when all metrics used in the rule are found in Metric file.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        if testtype == "RelationshipTest":
3ad7092fSWeilin Wang            for m in metric_list:
3ad7092fSWeilin Wang                if m['Name'] not in self.metrics:
3ad7092fSWeilin Wang                    return False
3ad7092fSWeilin Wang        return True
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    # Start of Collector and Converter
*1203a63dSWeilin Wang    def convert(self, data: list, metricvalues:dict):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Convert collected metric data from the -j output to dict of {metric_name:value}.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        for json_string in data:
3ad7092fSWeilin Wang            try:
3ad7092fSWeilin Wang                result =json.loads(json_string)
3ad7092fSWeilin Wang                if "metric-unit" in result and result["metric-unit"] != "(null)" and result["metric-unit"] != "":
3ad7092fSWeilin Wang                    name = result["metric-unit"].split("  ")[1] if len(result["metric-unit"].split("  ")) > 1 \
3ad7092fSWeilin Wang                        else result["metric-unit"]
*1203a63dSWeilin Wang                    metricvalues[name.lower()] = float(result["metric-value"])
3ad7092fSWeilin Wang            except ValueError as error:
3ad7092fSWeilin Wang                continue
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang
*1203a63dSWeilin Wang    def _run_perf(self, metric, workload: str):
*1203a63dSWeilin Wang        tool = 'perf'
*1203a63dSWeilin Wang        command = [tool, 'stat', '-j', '-M', f"{metric}", "-a"]
*1203a63dSWeilin Wang        wl = workload.split()
*1203a63dSWeilin Wang        command.extend(wl)
*1203a63dSWeilin Wang        print(" ".join(command))
*1203a63dSWeilin Wang        cmd = subprocess.run(command, stderr=subprocess.PIPE, encoding='utf-8')
*1203a63dSWeilin Wang        data = [x+'}' for x in cmd.stderr.split('}\n') if x]
*1203a63dSWeilin Wang        return data
*1203a63dSWeilin Wang
*1203a63dSWeilin Wang
*1203a63dSWeilin Wang    def collect_perf(self, workload: str):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Collect metric data with "perf stat -M" on given workload with -a and -j.
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        self.results = dict()
3ad7092fSWeilin Wang        print(f"Starting perf collection")
*1203a63dSWeilin Wang        print(f"Long workload: {workload}")
3ad7092fSWeilin Wang        collectlist = dict()
3ad7092fSWeilin Wang        if self.collectlist != "":
3ad7092fSWeilin Wang            collectlist[0] = {x for x in self.collectlist.split(",")}
3ad7092fSWeilin Wang        else:
3ad7092fSWeilin Wang            collectlist[0] = set(list(self.metrics))
3ad7092fSWeilin Wang        # Create metric set for relationship rules
3ad7092fSWeilin Wang        for rule in self.rules:
3ad7092fSWeilin Wang            if rule["TestType"] == "RelationshipTest":
3ad7092fSWeilin Wang                metrics = [m["Name"] for m in rule["Metrics"]]
3ad7092fSWeilin Wang                if not any(m not in collectlist[0] for m in metrics):
a0f1cc18SWeilin Wang                    collectlist[rule["RuleIndex"]] = [",".join(list(set(metrics)))]
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        for idx, metrics in collectlist.items():
*1203a63dSWeilin Wang            if idx == 0: wl = "true"
*1203a63dSWeilin Wang            else: wl = workload
3ad7092fSWeilin Wang            for metric in metrics:
*1203a63dSWeilin Wang                data = self._run_perf(metric, wl)
*1203a63dSWeilin Wang                if idx not in self.results: self.results[idx] = dict()
*1203a63dSWeilin Wang                self.convert(data, self.results[idx])
*1203a63dSWeilin Wang        return
*1203a63dSWeilin Wang
*1203a63dSWeilin Wang    def second_test(self, collectlist, second_results):
*1203a63dSWeilin Wang        workload = self.workloads[self.wlidx]
*1203a63dSWeilin Wang        for metric in collectlist:
*1203a63dSWeilin Wang            data = self._run_perf(metric, workload)
*1203a63dSWeilin Wang            self.convert(data, second_results)
*1203a63dSWeilin Wang
3ad7092fSWeilin Wang    # End of Collector and Converter
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    # Start of Rule Generator
3ad7092fSWeilin Wang    def parse_perf_metrics(self):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Read and parse perf metric file:
3ad7092fSWeilin Wang        1) find metrics with '1%' or '100%' as ScaleUnit for Percent check
3ad7092fSWeilin Wang        2) create metric name list
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        command = ['perf', 'list', '-j', '--details', 'metrics']
3ad7092fSWeilin Wang        cmd = subprocess.run(command, stdout=subprocess.PIPE, stderr=subprocess.PIPE, encoding='utf-8')
3ad7092fSWeilin Wang        try:
3ad7092fSWeilin Wang            data = json.loads(cmd.stdout)
3ad7092fSWeilin Wang            for m in data:
3ad7092fSWeilin Wang                if 'MetricName' not in m:
3ad7092fSWeilin Wang                    print("Warning: no metric name")
3ad7092fSWeilin Wang                    continue
*1203a63dSWeilin Wang                name = m['MetricName'].lower()
3ad7092fSWeilin Wang                self.metrics.add(name)
3ad7092fSWeilin Wang                if 'ScaleUnit' in m and (m['ScaleUnit'] == '1%' or m['ScaleUnit'] == '100%'):
3ad7092fSWeilin Wang                    self.pctgmetrics.add(name.lower())
3ad7092fSWeilin Wang        except ValueError as error:
3ad7092fSWeilin Wang            print(f"Error when parsing metric data")
3ad7092fSWeilin Wang            sys.exit()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang
*1203a63dSWeilin Wang    def remove_unsupported_rules(self, rules):
a0f1cc18SWeilin Wang        new_rules = []
a0f1cc18SWeilin Wang        for rule in rules:
a0f1cc18SWeilin Wang            add_rule = True
a0f1cc18SWeilin Wang            for m in rule["Metrics"]:
*1203a63dSWeilin Wang                if m["Name"] in self.skiplist or m["Name"] not in self.metrics:
a0f1cc18SWeilin Wang                    add_rule = False
a0f1cc18SWeilin Wang                    break
a0f1cc18SWeilin Wang            if add_rule:
a0f1cc18SWeilin Wang                new_rules.append(rule)
a0f1cc18SWeilin Wang        return new_rules
a0f1cc18SWeilin Wang
3ad7092fSWeilin Wang    def create_rules(self):
3ad7092fSWeilin Wang        """
3ad7092fSWeilin Wang        Create full rules which includes:
3ad7092fSWeilin Wang        1) All the rules from the "relationshi_rules" file
3ad7092fSWeilin Wang        2) SingleMetric rule for all the 'percent' metrics
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        Reindex all the rules to avoid repeated RuleIndex
3ad7092fSWeilin Wang        """
a0f1cc18SWeilin Wang        data = self.read_json(self.rulefname)
a0f1cc18SWeilin Wang        rules = data['RelationshipRules']
*1203a63dSWeilin Wang        self.skiplist = set([name.lower() for name in data['SkipList']])
*1203a63dSWeilin Wang        self.rules = self.remove_unsupported_rules(rules)
3ad7092fSWeilin Wang        pctgrule = {'RuleIndex':0,
3ad7092fSWeilin Wang                    'TestType':'SingleMetricTest',
3ad7092fSWeilin Wang                    'RangeLower':'0',
3ad7092fSWeilin Wang                    'RangeUpper': '100',
3ad7092fSWeilin Wang                    'ErrorThreshold': self.tolerance,
3ad7092fSWeilin Wang                    'Description':'Metrics in percent unit have value with in [0, 100]',
*1203a63dSWeilin Wang                    'Metrics': [{'Name': m.lower()} for m in self.pctgmetrics]}
3ad7092fSWeilin Wang        self.rules.append(pctgrule)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        # Re-index all rules to avoid repeated RuleIndex
3ad7092fSWeilin Wang        idx = 1
3ad7092fSWeilin Wang        for r in self.rules:
3ad7092fSWeilin Wang            r['RuleIndex'] = idx
3ad7092fSWeilin Wang            idx += 1
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        if self.debug:
3ad7092fSWeilin Wang            #TODO: need to test and generate file name correctly
3ad7092fSWeilin Wang            data = {'RelationshipRules':self.rules, 'SupportedMetrics': [{"MetricName": name} for name in self.metrics]}
3ad7092fSWeilin Wang            self.json_dump(data, self.fullrulefname)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        return
3ad7092fSWeilin Wang    # End of Rule Generator
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def _storewldata(self, key):
3ad7092fSWeilin Wang        '''
3ad7092fSWeilin Wang        Store all the data of one workload into the corresponding data structure for all workloads.
3ad7092fSWeilin Wang        @param key: key to the dictionaries (index of self.workloads).
3ad7092fSWeilin Wang        '''
3ad7092fSWeilin Wang        self.allresults[key] = self.results
3ad7092fSWeilin Wang        self.allignoremetrics[key] = self.ignoremetrics
3ad7092fSWeilin Wang        self.allfailtests[key] = self.failtests
3ad7092fSWeilin Wang        self.alltotalcnt[key] = self.totalcnt
3ad7092fSWeilin Wang        self.allpassedcnt[key] = self.passedcnt
3ad7092fSWeilin Wang        self.allerrlist[key] = self.errlist
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    #Initialize data structures before data validation of each workload
3ad7092fSWeilin Wang    def _init_data(self):
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        testtypes = ['PositiveValueTest', 'RelationshipTest', 'SingleMetricTest']
3ad7092fSWeilin Wang        self.results = dict()
3ad7092fSWeilin Wang        self.ignoremetrics= set()
3ad7092fSWeilin Wang        self.errlist = list()
3ad7092fSWeilin Wang        self.failtests = {k:{'Total Tests':0, 'Passed Tests':0, 'Failed Tests':[]} for k in testtypes}
3ad7092fSWeilin Wang        self.totalcnt = 0
3ad7092fSWeilin Wang        self.passedcnt = 0
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    def test(self):
3ad7092fSWeilin Wang        '''
3ad7092fSWeilin Wang        The real entry point of the test framework.
3ad7092fSWeilin Wang        This function loads the validation rule JSON file and Standard Metric file to create rules for
3ad7092fSWeilin Wang        testing and namemap dictionaries.
3ad7092fSWeilin Wang        It also reads in result JSON file for testing.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        In the test process, it passes through each rule and launch correct test function bases on the
3ad7092fSWeilin Wang        'TestType' field of the rule.
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        The final report is written into a JSON file.
3ad7092fSWeilin Wang        '''
a0f1cc18SWeilin Wang        if not self.collectlist:
3ad7092fSWeilin Wang            self.parse_perf_metrics()
3ad7092fSWeilin Wang        self.create_rules()
3ad7092fSWeilin Wang        for i in range(0, len(self.workloads)):
*1203a63dSWeilin Wang            self.wlidx = i
3ad7092fSWeilin Wang            self._init_data()
*1203a63dSWeilin Wang            self.collect_perf(self.workloads[i])
3ad7092fSWeilin Wang            # Run positive value test
3ad7092fSWeilin Wang            self.pos_val_test()
3ad7092fSWeilin Wang            for r in self.rules:
3ad7092fSWeilin Wang                # skip rules that uses metrics not exist in this platform
3ad7092fSWeilin Wang                testtype = r['TestType']
3ad7092fSWeilin Wang                if not self.check_rule(testtype, r['Metrics']):
3ad7092fSWeilin Wang                    continue
3ad7092fSWeilin Wang                if  testtype == 'RelationshipTest':
3ad7092fSWeilin Wang                    self.relationship_test(r)
3ad7092fSWeilin Wang                elif testtype == 'SingleMetricTest':
3ad7092fSWeilin Wang                    self.single_test(r)
3ad7092fSWeilin Wang                else:
3ad7092fSWeilin Wang                    print("Unsupported Test Type: ", testtype)
3ad7092fSWeilin Wang                    self.errlist.append("Unsupported Test Type from rule: " + r['RuleIndex'])
3ad7092fSWeilin Wang            self._storewldata(i)
3ad7092fSWeilin Wang            print("Workload: ", self.workloads[i])
3ad7092fSWeilin Wang            print("Total metrics collected: ", self.failtests['PositiveValueTest']['Total Tests'])
3ad7092fSWeilin Wang            print("Non-negative metric count: ", self.failtests['PositiveValueTest']['Passed Tests'])
3ad7092fSWeilin Wang            print("Total Test Count: ", self.totalcnt)
3ad7092fSWeilin Wang            print("Passed Test Count: ", self.passedcnt)
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang        self.create_report()
3ad7092fSWeilin Wang        return sum(self.alltotalcnt.values()) != sum(self.allpassedcnt.values())
3ad7092fSWeilin Wang# End of Class Validator
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang
3ad7092fSWeilin Wangdef main() -> None:
3ad7092fSWeilin Wang    parser = argparse.ArgumentParser(description="Launch metric value validation")
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    parser.add_argument("-rule", help="Base validation rule file", required=True)
3ad7092fSWeilin Wang    parser.add_argument("-output_dir", help="Path for validator output file, report file", required=True)
3ad7092fSWeilin Wang    parser.add_argument("-debug", help="Debug run, save intermediate data to files", action="store_true", default=False)
3ad7092fSWeilin Wang    parser.add_argument("-wl", help="Workload to run while data collection", default="true")
3ad7092fSWeilin Wang    parser.add_argument("-m", help="Metric list to validate", default="")
3ad7092fSWeilin Wang    args = parser.parse_args()
3ad7092fSWeilin Wang    outpath = Path(args.output_dir)
3ad7092fSWeilin Wang    reportf = Path.joinpath(outpath, 'perf_report.json')
3ad7092fSWeilin Wang    fullrule = Path.joinpath(outpath, 'full_rule.json')
3ad7092fSWeilin Wang    datafile = Path.joinpath(outpath, 'perf_data.json')
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    validator = Validator(args.rule, reportf, debug=args.debug,
3ad7092fSWeilin Wang                        datafname=datafile, fullrulefname=fullrule, workload=args.wl,
3ad7092fSWeilin Wang                        metrics=args.m)
3ad7092fSWeilin Wang    ret = validator.test()
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang    return ret
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang
3ad7092fSWeilin Wangif __name__ == "__main__":
3ad7092fSWeilin Wang    import sys
3ad7092fSWeilin Wang    sys.exit(main())
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang
3ad7092fSWeilin Wang