shell/lib/perf_metric_validation.py

*3ad7092fSWeilin Wang#SPDX-License-Identifier: GPL-2.0
*3ad7092fSWeilin Wangimport re
*3ad7092fSWeilin Wangimport csv
*3ad7092fSWeilin Wangimport json
*3ad7092fSWeilin Wangimport argparse
*3ad7092fSWeilin Wangfrom pathlib import Path
*3ad7092fSWeilin Wangimport subprocess
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wangclass Validator:
*3ad7092fSWeilin Wang    def __init__(self, rulefname, reportfname='', t=5, debug=False, datafname='', fullrulefname='', workload='true', metrics=''):
*3ad7092fSWeilin Wang        self.rulefname = rulefname
*3ad7092fSWeilin Wang        self.reportfname = reportfname
*3ad7092fSWeilin Wang        self.rules = None
*3ad7092fSWeilin Wang        self.collectlist=metrics
*3ad7092fSWeilin Wang        self.metrics = set()
*3ad7092fSWeilin Wang        self.tolerance = t
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        self.workloads = [x for x in workload.split(",") if x]
*3ad7092fSWeilin Wang        self.wlidx = 0 # idx of current workloads
*3ad7092fSWeilin Wang        self.allresults = dict() # metric results of all workload
*3ad7092fSWeilin Wang        self.allignoremetrics = dict() # metrics with no results or negative results
*3ad7092fSWeilin Wang        self.allfailtests = dict()
*3ad7092fSWeilin Wang        self.alltotalcnt = dict()
*3ad7092fSWeilin Wang        self.allpassedcnt = dict()
*3ad7092fSWeilin Wang        self.allerrlist = dict()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        self.results = dict() # metric results of current workload
*3ad7092fSWeilin Wang        # vars for test pass/failure statistics
*3ad7092fSWeilin Wang        self.ignoremetrics= set() # metrics with no results or negative results, neg result counts as a failed test
*3ad7092fSWeilin Wang        self.failtests = dict()
*3ad7092fSWeilin Wang        self.totalcnt = 0
*3ad7092fSWeilin Wang        self.passedcnt = 0
*3ad7092fSWeilin Wang        # vars for errors
*3ad7092fSWeilin Wang        self.errlist = list()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        # vars for Rule Generator
*3ad7092fSWeilin Wang        self.pctgmetrics = set() # Percentage rule
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        # vars for debug
*3ad7092fSWeilin Wang        self.datafname = datafname
*3ad7092fSWeilin Wang        self.debug = debug
*3ad7092fSWeilin Wang        self.fullrulefname = fullrulefname
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def read_json(self, filename: str) -> dict:
*3ad7092fSWeilin Wang        try:
*3ad7092fSWeilin Wang            with open(Path(filename).resolve(), "r") as f:
*3ad7092fSWeilin Wang                data = json.loads(f.read())
*3ad7092fSWeilin Wang        except OSError as e:
*3ad7092fSWeilin Wang            print(f"Error when reading file {e}")
*3ad7092fSWeilin Wang            sys.exit()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return data
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def json_dump(self, data, output_file):
*3ad7092fSWeilin Wang        parent = Path(output_file).parent
*3ad7092fSWeilin Wang        if not parent.exists():
*3ad7092fSWeilin Wang            parent.mkdir(parents=True)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        with open(output_file, "w+") as output_file:
*3ad7092fSWeilin Wang            json.dump(data,
*3ad7092fSWeilin Wang                      output_file,
*3ad7092fSWeilin Wang                      ensure_ascii=True,
*3ad7092fSWeilin Wang                      indent=4)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def get_results(self, idx:int = 0):
*3ad7092fSWeilin Wang        return self.results[idx]
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def get_bounds(self, lb, ub, error, alias={}, ridx:int = 0) -> list:
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Get bounds and tolerance from lb, ub, and error.
*3ad7092fSWeilin Wang        If missing lb, use 0.0; missing ub, use float('inf); missing error, use self.tolerance.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param lb: str/float, lower bound
*3ad7092fSWeilin Wang        @param ub: str/float, upper bound
*3ad7092fSWeilin Wang        @param error: float/str, error tolerance
*3ad7092fSWeilin Wang        @returns: lower bound, return inf if the lower bound is a metric value and is not collected
*3ad7092fSWeilin Wang                  upper bound, return -1 if the upper bound is a metric value and is not collected
*3ad7092fSWeilin Wang                  tolerance, denormalized base on upper bound value
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        # init ubv and lbv to invalid values
*3ad7092fSWeilin Wang        def get_bound_value (bound, initval, ridx):
*3ad7092fSWeilin Wang            val = initval
*3ad7092fSWeilin Wang            if isinstance(bound, int) or isinstance(bound, float):
*3ad7092fSWeilin Wang                val = bound
*3ad7092fSWeilin Wang            elif isinstance(bound, str):
*3ad7092fSWeilin Wang                if bound == '':
*3ad7092fSWeilin Wang                    val = float("inf")
*3ad7092fSWeilin Wang                elif bound in alias:
*3ad7092fSWeilin Wang                    vall = self.get_value(alias[ub], ridx)
*3ad7092fSWeilin Wang                    if vall:
*3ad7092fSWeilin Wang                        val = vall[0]
*3ad7092fSWeilin Wang                elif bound.replace('.', '1').isdigit():
*3ad7092fSWeilin Wang                    val = float(bound)
*3ad7092fSWeilin Wang                else:
*3ad7092fSWeilin Wang                    print("Wrong bound: {0}".format(bound))
*3ad7092fSWeilin Wang            else:
*3ad7092fSWeilin Wang                print("Wrong bound: {0}".format(bound))
*3ad7092fSWeilin Wang            return val
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        ubv = get_bound_value(ub, -1, ridx)
*3ad7092fSWeilin Wang        lbv = get_bound_value(lb, float('inf'), ridx)
*3ad7092fSWeilin Wang        t = get_bound_value(error, self.tolerance, ridx)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        # denormalize error threshold
*3ad7092fSWeilin Wang        denormerr = t * ubv / 100 if ubv != 100 and ubv > 0 else t
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return lbv, ubv, denormerr
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def get_value(self, name:str, ridx:int = 0) -> list:
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Get value of the metric from self.results.
*3ad7092fSWeilin Wang        If result of this metric is not provided, the metric name will be added into self.ignoremetics and self.errlist.
*3ad7092fSWeilin Wang        All future test(s) on this metric will fail.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param name: name of the metric
*3ad7092fSWeilin Wang        @returns: list with value found in self.results; list is empty when not value found.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        results = []
*3ad7092fSWeilin Wang        data = self.results[ridx] if ridx in self.results else self.results[0]
*3ad7092fSWeilin Wang        if name not in self.ignoremetrics:
*3ad7092fSWeilin Wang            if name in data:
*3ad7092fSWeilin Wang                results.append(data[name])
*3ad7092fSWeilin Wang            elif name.replace('.', '1').isdigit():
*3ad7092fSWeilin Wang                results.append(float(name))
*3ad7092fSWeilin Wang            else:
*3ad7092fSWeilin Wang                self.errlist.append("Metric '%s' is not collected or the value format is incorrect"%(name))
*3ad7092fSWeilin Wang                self.ignoremetrics.add(name)
*3ad7092fSWeilin Wang        return results
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def check_bound(self, val, lb, ub, err):
*3ad7092fSWeilin Wang        return True if val <= ub + err and val >= lb - err else False
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    # Positive Value Sanity check
*3ad7092fSWeilin Wang    def pos_val_test(self):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Check if metrics value are non-negative.
*3ad7092fSWeilin Wang        One metric is counted as one test.
*3ad7092fSWeilin Wang        Failure: when metric value is negative or not provided.
*3ad7092fSWeilin Wang        Metrics with negative value will be added into the self.failtests['PositiveValueTest'] and self.ignoremetrics.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        negmetric = set()
*3ad7092fSWeilin Wang        missmetric = set()
*3ad7092fSWeilin Wang        pcnt = 0
*3ad7092fSWeilin Wang        tcnt = 0
*3ad7092fSWeilin Wang        for name, val in self.get_results().items():
*3ad7092fSWeilin Wang            if val is None or val == '':
*3ad7092fSWeilin Wang                missmetric.add(name)
*3ad7092fSWeilin Wang                self.errlist.append("Metric '%s' is not collected"%(name))
*3ad7092fSWeilin Wang            elif val < 0:
*3ad7092fSWeilin Wang                negmetric.add("{0}(={1:.4f})".format(name, val))
*3ad7092fSWeilin Wang            else:
*3ad7092fSWeilin Wang                pcnt += 1
*3ad7092fSWeilin Wang            tcnt += 1
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        self.failtests['PositiveValueTest']['Total Tests'] = tcnt
*3ad7092fSWeilin Wang        self.failtests['PositiveValueTest']['Passed Tests'] = pcnt
*3ad7092fSWeilin Wang        if len(negmetric) or len(missmetric)> 0:
*3ad7092fSWeilin Wang            self.ignoremetrics.update(negmetric)
*3ad7092fSWeilin Wang            self.ignoremetrics.update(missmetric)
*3ad7092fSWeilin Wang            self.failtests['PositiveValueTest']['Failed Tests'].append({'NegativeValue':list(negmetric), 'MissingValue':list(missmetric)})
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def evaluate_formula(self, formula:str, alias:dict, ridx:int = 0):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Evaluate the value of formula.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param formula: the formula to be evaluated
*3ad7092fSWeilin Wang        @param alias: the dict has alias to metric name mapping
*3ad7092fSWeilin Wang        @returns: value of the formula is success; -1 if the one or more metric value not provided
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        stack = []
*3ad7092fSWeilin Wang        b = 0
*3ad7092fSWeilin Wang        errs = []
*3ad7092fSWeilin Wang        sign = "+"
*3ad7092fSWeilin Wang        f = str()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        #TODO: support parenthesis?
*3ad7092fSWeilin Wang        for i in range(len(formula)):
*3ad7092fSWeilin Wang            if i+1 == len(formula) or formula[i] in ('+', '-', '*', '/'):
*3ad7092fSWeilin Wang                s = alias[formula[b:i]] if i+1 < len(formula) else alias[formula[b:]]
*3ad7092fSWeilin Wang                v = self.get_value(s, ridx)
*3ad7092fSWeilin Wang                if not v:
*3ad7092fSWeilin Wang                    errs.append(s)
*3ad7092fSWeilin Wang                else:
*3ad7092fSWeilin Wang                    f = f + "{0}(={1:.4f})".format(s, v[0])
*3ad7092fSWeilin Wang                    if sign == "*":
*3ad7092fSWeilin Wang                        stack[-1] = stack[-1] * v
*3ad7092fSWeilin Wang                    elif sign == "/":
*3ad7092fSWeilin Wang                        stack[-1] = stack[-1] / v
*3ad7092fSWeilin Wang                    elif sign == '-':
*3ad7092fSWeilin Wang                        stack.append(-v[0])
*3ad7092fSWeilin Wang                    else:
*3ad7092fSWeilin Wang                        stack.append(v[0])
*3ad7092fSWeilin Wang                if i + 1 < len(formula):
*3ad7092fSWeilin Wang                    sign = formula[i]
*3ad7092fSWeilin Wang                    f += sign
*3ad7092fSWeilin Wang                    b = i + 1
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        if len(errs) > 0:
*3ad7092fSWeilin Wang            return -1, "Metric value missing: "+','.join(errs)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        val = sum(stack)
*3ad7092fSWeilin Wang        return val, f
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    # Relationships Tests
*3ad7092fSWeilin Wang    def relationship_test(self, rule: dict):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Validate if the metrics follow the required relationship in the rule.
*3ad7092fSWeilin Wang        eg. lower_bound <= eval(formula)<= upper_bound
*3ad7092fSWeilin Wang        One rule is counted as ont test.
*3ad7092fSWeilin Wang        Failure: when one or more metric result(s) not provided, or when formula evaluated outside of upper/lower bounds.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param rule: dict with metric name(+alias), formula, and required upper and lower bounds.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        alias = dict()
*3ad7092fSWeilin Wang        for m in rule['Metrics']:
*3ad7092fSWeilin Wang            alias[m['Alias']] = m['Name']
*3ad7092fSWeilin Wang        lbv, ubv, t = self.get_bounds(rule['RangeLower'], rule['RangeUpper'], rule['ErrorThreshold'], alias, ridx=rule['RuleIndex'])
*3ad7092fSWeilin Wang        val, f = self.evaluate_formula(rule['Formula'], alias, ridx=rule['RuleIndex'])
*3ad7092fSWeilin Wang        if val == -1:
*3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Failed Tests'].append({'RuleIndex': rule['RuleIndex'], 'Description':f})
*3ad7092fSWeilin Wang        elif not self.check_bound(val, lbv, ubv, t):
*3ad7092fSWeilin Wang            lb = rule['RangeLower']
*3ad7092fSWeilin Wang            ub = rule['RangeUpper']
*3ad7092fSWeilin Wang            if isinstance(lb, str):
*3ad7092fSWeilin Wang                if lb in alias:
*3ad7092fSWeilin Wang                    lb = alias[lb]
*3ad7092fSWeilin Wang            if isinstance(ub, str):
*3ad7092fSWeilin Wang                if ub in alias:
*3ad7092fSWeilin Wang                    ub = alias[ub]
*3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Failed Tests'].append({'RuleIndex': rule['RuleIndex'], 'Formula':f,
*3ad7092fSWeilin Wang                                                                       'RangeLower': lb, 'LowerBoundValue': self.get_value(lb),
*3ad7092fSWeilin Wang                                                                       'RangeUpper': ub, 'UpperBoundValue':self.get_value(ub),
*3ad7092fSWeilin Wang                                                                       'ErrorThreshold': t, 'CollectedValue': val})
*3ad7092fSWeilin Wang        else:
*3ad7092fSWeilin Wang            self.passedcnt += 1
*3ad7092fSWeilin Wang            self.failtests['RelationshipTest']['Passed Tests'] += 1
*3ad7092fSWeilin Wang        self.totalcnt += 1
*3ad7092fSWeilin Wang        self.failtests['RelationshipTest']['Total Tests'] += 1
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    # Single Metric Test
*3ad7092fSWeilin Wang    def single_test(self, rule:dict):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Validate if the metrics are in the required value range.
*3ad7092fSWeilin Wang        eg. lower_bound <= metrics_value <= upper_bound
*3ad7092fSWeilin Wang        One metric is counted as one test in this type of test.
*3ad7092fSWeilin Wang        One rule may include one or more metrics.
*3ad7092fSWeilin Wang        Failure: when the metric value not provided or the value is outside the bounds.
*3ad7092fSWeilin Wang        This test updates self.total_cnt and records failed tests in self.failtest['SingleMetricTest'].
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param rule: dict with metrics to validate and the value range requirement
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        lbv, ubv, t = self.get_bounds(rule['RangeLower'], rule['RangeUpper'], rule['ErrorThreshold'])
*3ad7092fSWeilin Wang        metrics = rule['Metrics']
*3ad7092fSWeilin Wang        passcnt = 0
*3ad7092fSWeilin Wang        totalcnt = 0
*3ad7092fSWeilin Wang        faillist = []
*3ad7092fSWeilin Wang        for m in metrics:
*3ad7092fSWeilin Wang            totalcnt += 1
*3ad7092fSWeilin Wang            result = self.get_value(m['Name'])
*3ad7092fSWeilin Wang            if len(result) > 0 and self.check_bound(result[0], lbv, ubv, t):
*3ad7092fSWeilin Wang                passcnt += 1
*3ad7092fSWeilin Wang            else:
*3ad7092fSWeilin Wang                faillist.append({'MetricName':m['Name'], 'CollectedValue':result})
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        self.totalcnt += totalcnt
*3ad7092fSWeilin Wang        self.passedcnt += passcnt
*3ad7092fSWeilin Wang        self.failtests['SingleMetricTest']['Total Tests'] += totalcnt
*3ad7092fSWeilin Wang        self.failtests['SingleMetricTest']['Passed Tests'] += passcnt
*3ad7092fSWeilin Wang        if len(faillist) != 0:
*3ad7092fSWeilin Wang            self.failtests['SingleMetricTest']['Failed Tests'].append({'RuleIndex':rule['RuleIndex'],
*3ad7092fSWeilin Wang                                                                       'RangeLower': rule['RangeLower'],
*3ad7092fSWeilin Wang                                                                       'RangeUpper': rule['RangeUpper'],
*3ad7092fSWeilin Wang                                                                       'ErrorThreshold':rule['ErrorThreshold'],
*3ad7092fSWeilin Wang                                                                       'Failure':faillist})
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def create_report(self):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Create final report and write into a JSON file.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        alldata = list()
*3ad7092fSWeilin Wang        for i in range(0, len(self.workloads)):
*3ad7092fSWeilin Wang            reportstas = {"Total Rule Count": self.alltotalcnt[i], "Passed Rule Count": self.allpassedcnt[i]}
*3ad7092fSWeilin Wang            data = {"Metric Validation Statistics": reportstas, "Tests in Category": self.allfailtests[i],
*3ad7092fSWeilin Wang                    "Errors":self.allerrlist[i]}
*3ad7092fSWeilin Wang            alldata.append({"Workload": self.workloads[i], "Report": data})
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        json_str = json.dumps(alldata, indent=4)
*3ad7092fSWeilin Wang        print("Test validation finished. Final report: ")
*3ad7092fSWeilin Wang        print(json_str)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        if self.debug:
*3ad7092fSWeilin Wang            allres = [{"Workload": self.workloads[i], "Results": self.allresults[i]} for i in range(0, len(self.workloads))]
*3ad7092fSWeilin Wang            self.json_dump(allres, self.datafname)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def check_rule(self, testtype, metric_list):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Check if the rule uses metric(s) that not exist in current platform.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        @param metric_list: list of metrics from the rule.
*3ad7092fSWeilin Wang        @return: False when find one metric out in Metric file. (This rule should not skipped.)
*3ad7092fSWeilin Wang                 True when all metrics used in the rule are found in Metric file.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        if testtype == "RelationshipTest":
*3ad7092fSWeilin Wang            for m in metric_list:
*3ad7092fSWeilin Wang                if m['Name'] not in self.metrics:
*3ad7092fSWeilin Wang                    return False
*3ad7092fSWeilin Wang        return True
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    # Start of Collector and Converter
*3ad7092fSWeilin Wang    def convert(self, data: list, idx: int):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Convert collected metric data from the -j output to dict of {metric_name:value}.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        for json_string in data:
*3ad7092fSWeilin Wang            try:
*3ad7092fSWeilin Wang                result =json.loads(json_string)
*3ad7092fSWeilin Wang                if "metric-unit" in result and result["metric-unit"] != "(null)" and result["metric-unit"] != "":
*3ad7092fSWeilin Wang                    name = result["metric-unit"].split("  ")[1] if len(result["metric-unit"].split("  ")) > 1 \
*3ad7092fSWeilin Wang                        else result["metric-unit"]
*3ad7092fSWeilin Wang                    if idx not in self.results: self.results[idx] = dict()
*3ad7092fSWeilin Wang                    self.results[idx][name.lower()] = float(result["metric-value"])
*3ad7092fSWeilin Wang            except ValueError as error:
*3ad7092fSWeilin Wang                continue
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def collect_perf(self, data_file: str, workload: str):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Collect metric data with "perf stat -M" on given workload with -a and -j.
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        self.results = dict()
*3ad7092fSWeilin Wang        tool = 'perf'
*3ad7092fSWeilin Wang        print(f"Starting perf collection")
*3ad7092fSWeilin Wang        print(f"Workload: {workload}")
*3ad7092fSWeilin Wang        collectlist = dict()
*3ad7092fSWeilin Wang        if self.collectlist != "":
*3ad7092fSWeilin Wang            collectlist[0] = {x for x in self.collectlist.split(",")}
*3ad7092fSWeilin Wang        else:
*3ad7092fSWeilin Wang            collectlist[0] = set(list(self.metrics))
*3ad7092fSWeilin Wang        # Create metric set for relationship rules
*3ad7092fSWeilin Wang        for rule in self.rules:
*3ad7092fSWeilin Wang            if rule["TestType"] == "RelationshipTest":
*3ad7092fSWeilin Wang                metrics = [m["Name"] for m in rule["Metrics"]]
*3ad7092fSWeilin Wang                if not any(m not in collectlist[0] for m in metrics):
*3ad7092fSWeilin Wang                    collectlist[rule["RuleIndex"]] = set(metrics)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        for idx, metrics in collectlist.items():
*3ad7092fSWeilin Wang            if idx == 0: wl = "sleep 0.5".split()
*3ad7092fSWeilin Wang            else: wl = workload.split()
*3ad7092fSWeilin Wang            for metric in metrics:
*3ad7092fSWeilin Wang                command = [tool, 'stat', '-j', '-M', f"{metric}", "-a"]
*3ad7092fSWeilin Wang                command.extend(wl)
*3ad7092fSWeilin Wang                cmd = subprocess.run(command, stderr=subprocess.PIPE, encoding='utf-8')
*3ad7092fSWeilin Wang                data = [x+'}' for x in cmd.stderr.split('}\n') if x]
*3ad7092fSWeilin Wang                self.convert(data, idx)
*3ad7092fSWeilin Wang    # End of Collector and Converter
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    # Start of Rule Generator
*3ad7092fSWeilin Wang    def parse_perf_metrics(self):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Read and parse perf metric file:
*3ad7092fSWeilin Wang        1) find metrics with '1%' or '100%' as ScaleUnit for Percent check
*3ad7092fSWeilin Wang        2) create metric name list
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        command = ['perf', 'list', '-j', '--details', 'metrics']
*3ad7092fSWeilin Wang        cmd = subprocess.run(command, stdout=subprocess.PIPE, stderr=subprocess.PIPE, encoding='utf-8')
*3ad7092fSWeilin Wang        try:
*3ad7092fSWeilin Wang            data = json.loads(cmd.stdout)
*3ad7092fSWeilin Wang            for m in data:
*3ad7092fSWeilin Wang                if 'MetricName' not in m:
*3ad7092fSWeilin Wang                    print("Warning: no metric name")
*3ad7092fSWeilin Wang                    continue
*3ad7092fSWeilin Wang                name = m['MetricName']
*3ad7092fSWeilin Wang                self.metrics.add(name)
*3ad7092fSWeilin Wang                if 'ScaleUnit' in m and (m['ScaleUnit'] == '1%' or m['ScaleUnit'] == '100%'):
*3ad7092fSWeilin Wang                    self.pctgmetrics.add(name.lower())
*3ad7092fSWeilin Wang        except ValueError as error:
*3ad7092fSWeilin Wang            print(f"Error when parsing metric data")
*3ad7092fSWeilin Wang            sys.exit()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def create_rules(self):
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        Create full rules which includes:
*3ad7092fSWeilin Wang        1) All the rules from the "relationshi_rules" file
*3ad7092fSWeilin Wang        2) SingleMetric rule for all the 'percent' metrics
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        Reindex all the rules to avoid repeated RuleIndex
*3ad7092fSWeilin Wang        """
*3ad7092fSWeilin Wang        self.rules = self.read_json(self.rulefname)['RelationshipRules']
*3ad7092fSWeilin Wang        pctgrule = {'RuleIndex':0,
*3ad7092fSWeilin Wang                    'TestType':'SingleMetricTest',
*3ad7092fSWeilin Wang                    'RangeLower':'0',
*3ad7092fSWeilin Wang                    'RangeUpper': '100',
*3ad7092fSWeilin Wang                    'ErrorThreshold': self.tolerance,
*3ad7092fSWeilin Wang                    'Description':'Metrics in percent unit have value with in [0, 100]',
*3ad7092fSWeilin Wang                    'Metrics': [{'Name': m} for m in self.pctgmetrics]}
*3ad7092fSWeilin Wang        self.rules.append(pctgrule)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        # Re-index all rules to avoid repeated RuleIndex
*3ad7092fSWeilin Wang        idx = 1
*3ad7092fSWeilin Wang        for r in self.rules:
*3ad7092fSWeilin Wang            r['RuleIndex'] = idx
*3ad7092fSWeilin Wang            idx += 1
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        if self.debug:
*3ad7092fSWeilin Wang            #TODO: need to test and generate file name correctly
*3ad7092fSWeilin Wang            data = {'RelationshipRules':self.rules, 'SupportedMetrics': [{"MetricName": name} for name in self.metrics]}
*3ad7092fSWeilin Wang            self.json_dump(data, self.fullrulefname)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        return
*3ad7092fSWeilin Wang    # End of Rule Generator
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def _storewldata(self, key):
*3ad7092fSWeilin Wang        '''
*3ad7092fSWeilin Wang        Store all the data of one workload into the corresponding data structure for all workloads.
*3ad7092fSWeilin Wang        @param key: key to the dictionaries (index of self.workloads).
*3ad7092fSWeilin Wang        '''
*3ad7092fSWeilin Wang        self.allresults[key] = self.results
*3ad7092fSWeilin Wang        self.allignoremetrics[key] = self.ignoremetrics
*3ad7092fSWeilin Wang        self.allfailtests[key] = self.failtests
*3ad7092fSWeilin Wang        self.alltotalcnt[key] = self.totalcnt
*3ad7092fSWeilin Wang        self.allpassedcnt[key] = self.passedcnt
*3ad7092fSWeilin Wang        self.allerrlist[key] = self.errlist
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    #Initialize data structures before data validation of each workload
*3ad7092fSWeilin Wang    def _init_data(self):
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        testtypes = ['PositiveValueTest', 'RelationshipTest', 'SingleMetricTest']
*3ad7092fSWeilin Wang        self.results = dict()
*3ad7092fSWeilin Wang        self.ignoremetrics= set()
*3ad7092fSWeilin Wang        self.errlist = list()
*3ad7092fSWeilin Wang        self.failtests = {k:{'Total Tests':0, 'Passed Tests':0, 'Failed Tests':[]} for k in testtypes}
*3ad7092fSWeilin Wang        self.totalcnt = 0
*3ad7092fSWeilin Wang        self.passedcnt = 0
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    def test(self):
*3ad7092fSWeilin Wang        '''
*3ad7092fSWeilin Wang        The real entry point of the test framework.
*3ad7092fSWeilin Wang        This function loads the validation rule JSON file and Standard Metric file to create rules for
*3ad7092fSWeilin Wang        testing and namemap dictionaries.
*3ad7092fSWeilin Wang        It also reads in result JSON file for testing.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        In the test process, it passes through each rule and launch correct test function bases on the
*3ad7092fSWeilin Wang        'TestType' field of the rule.
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        The final report is written into a JSON file.
*3ad7092fSWeilin Wang        '''
*3ad7092fSWeilin Wang        self.parse_perf_metrics()
*3ad7092fSWeilin Wang        self.create_rules()
*3ad7092fSWeilin Wang        for i in range(0, len(self.workloads)):
*3ad7092fSWeilin Wang            self._init_data()
*3ad7092fSWeilin Wang            self.collect_perf(self.datafname, self.workloads[i])
*3ad7092fSWeilin Wang            # Run positive value test
*3ad7092fSWeilin Wang            self.pos_val_test()
*3ad7092fSWeilin Wang            for r in self.rules:
*3ad7092fSWeilin Wang                # skip rules that uses metrics not exist in this platform
*3ad7092fSWeilin Wang                testtype = r['TestType']
*3ad7092fSWeilin Wang                if not self.check_rule(testtype, r['Metrics']):
*3ad7092fSWeilin Wang                    continue
*3ad7092fSWeilin Wang                if  testtype == 'RelationshipTest':
*3ad7092fSWeilin Wang                    self.relationship_test(r)
*3ad7092fSWeilin Wang                elif testtype == 'SingleMetricTest':
*3ad7092fSWeilin Wang                    self.single_test(r)
*3ad7092fSWeilin Wang                else:
*3ad7092fSWeilin Wang                    print("Unsupported Test Type: ", testtype)
*3ad7092fSWeilin Wang                    self.errlist.append("Unsupported Test Type from rule: " + r['RuleIndex'])
*3ad7092fSWeilin Wang            self._storewldata(i)
*3ad7092fSWeilin Wang            print("Workload: ", self.workloads[i])
*3ad7092fSWeilin Wang            print("Total metrics collected: ", self.failtests['PositiveValueTest']['Total Tests'])
*3ad7092fSWeilin Wang            print("Non-negative metric count: ", self.failtests['PositiveValueTest']['Passed Tests'])
*3ad7092fSWeilin Wang            print("Total Test Count: ", self.totalcnt)
*3ad7092fSWeilin Wang            print("Passed Test Count: ", self.passedcnt)
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang        self.create_report()
*3ad7092fSWeilin Wang        return sum(self.alltotalcnt.values()) != sum(self.allpassedcnt.values())
*3ad7092fSWeilin Wang# End of Class Validator
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wangdef main() -> None:
*3ad7092fSWeilin Wang    parser = argparse.ArgumentParser(description="Launch metric value validation")
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    parser.add_argument("-rule", help="Base validation rule file", required=True)
*3ad7092fSWeilin Wang    parser.add_argument("-output_dir", help="Path for validator output file, report file", required=True)
*3ad7092fSWeilin Wang    parser.add_argument("-debug", help="Debug run, save intermediate data to files", action="store_true", default=False)
*3ad7092fSWeilin Wang    parser.add_argument("-wl", help="Workload to run while data collection", default="true")
*3ad7092fSWeilin Wang    parser.add_argument("-m", help="Metric list to validate", default="")
*3ad7092fSWeilin Wang    args = parser.parse_args()
*3ad7092fSWeilin Wang    outpath = Path(args.output_dir)
*3ad7092fSWeilin Wang    reportf = Path.joinpath(outpath, 'perf_report.json')
*3ad7092fSWeilin Wang    fullrule = Path.joinpath(outpath, 'full_rule.json')
*3ad7092fSWeilin Wang    datafile = Path.joinpath(outpath, 'perf_data.json')
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    validator = Validator(args.rule, reportf, debug=args.debug,
*3ad7092fSWeilin Wang                        datafname=datafile, fullrulefname=fullrule, workload=args.wl,
*3ad7092fSWeilin Wang                        metrics=args.m)
*3ad7092fSWeilin Wang    ret = validator.test()
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang    return ret
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wangif __name__ == "__main__":
*3ad7092fSWeilin Wang    import sys
*3ad7092fSWeilin Wang    sys.exit(main())
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang
*3ad7092fSWeilin Wang