3 vuotta sitten · fb58148df2
--- a/Makefile
+++ b/Makefile
@@ -170,10 +170,11 @@ coverage: $(GCDA)
 
															 .PHONY: summary sizes
														
 
															 summary sizes: $(BUILDDIR)lfs.csv
														
 
															 	$(strip ./scripts/summary.py -Y $^ \
														
 
															-		-f code=code_size,$\
														
 
															+		-fcode=code_size,$\
														
 
															 			data=data_size,$\
														
 
															 			stack=stack_limit,$\
														
 
															 			struct=struct_size \
														
 
															+		--max=stack \
														
 
															 		$(SUMMARYFLAGS))
														
--- a/scripts/plot.py
+++ b/scripts/plot.py
@@ -330,12 +330,13 @@ def collect(csv_paths, renames=[]):
 
															     return results
														
 
															-def dataset(results, x=None, y=None, defines={}):
														
 
															+def dataset(results, x=None, y=None, define=[]):
														
 
															     # organize by 'by', x, and y
														
 
															     dataset = {}
														
 
															-    for i, r in enumerate(results):
														
 
															+    i = 0
														
 
															+    for r in results:
														
 
															         # filter results by matching defines
														
 
															-        if not all(k in r and r[k] in vs for k, vs in defines.items()):
														
 
															+        if not all(k in r and r[k] in vs for k, vs in define):
														
 
															             continue
														
 
															         # find xs
														
@@ -348,6 +349,7 @@ def dataset(results, x=None, y=None, defines={}):
 
															                 continue
														
 
															         else:
														
 
															             x_ = i
														
 
															+            i += 1
														
 
															         # find ys
														
 
															         if y is not None:
														
@@ -368,14 +370,29 @@ def dataset(results, x=None, y=None, defines={}):
 
															     return dataset
														
 
															-def datasets(results, by=None, x=None, y=None, defines={}):
														
 
															+def datasets(results, by=None, x=None, y=None, define=[]):
														
 
															     # filter results by matching defines
														
 
															     results_ = []
														
 
															     for r in results:
														
 
															-        if all(k in r and r[k] in vs for k, vs in defines.items()):
														
 
															+        if all(k in r and r[k] in vs for k, vs in define):
														
 
															             results_.append(r)
														
 
															     results = results_
														
 
															+    # if y not specified, try to guess from data
														
 
															+    if y is None:
														
 
															+        y = co.OrderedDict()
														
 
															+        for r in results:
														
 
															+            for k, v in r.items():
														
 
															+                if by is not None and k in by:
														
 
															+                    continue
														
 
															+                if y.get(k, True):
														
 
															+                    try:
														
 
															+                        dat(v)
														
 
															+                        y[k] = True
														
 
															+                    except ValueError:
														
 
															+                        y[k] = False
														
 
															+        y = list(k for k,v in y.items() if v)
														
 
															+
														
 
															     if by is not None:
														
 
															         # find all 'by' values
														
 
															         ks = set()
														
@@ -387,13 +404,17 @@ def datasets(results, by=None, x=None, y=None, defines={}):
 
															     datasets = co.OrderedDict()
														
 
															     for ks_ in (ks if by is not None else [()]):
														
 
															         for x_ in (x if x is not None else [None]):
														
 
															-            for y_ in (y if y is not None else [None]):
														
 
															-                datasets[ks_ + (x_, y_)] = dataset(
														
 
															+            for y_ in y:
														
 
															+                # hide x/y if there is only one field
														
 
															+                k_x = x_ if len(x or []) > 1 else ''
														
 
															+                k_y = y_ if len(y or []) > 1 else ''
														
 
															+
														
 
															+                datasets[ks_ + (k_x, k_y)] = dataset(
														
 
															                     results,
														
 
															                     x_,
														
 
															                     y_,
														
 
															-                    {by_: {k_} for by_, k_ in zip(by, ks_)}
														
 
															-                        if by is not None else {})
														
 
															+                    [(by_, k_) for by_, k_ in zip(by, ks_)]
														
 
															+                        if by is not None else [])
														
 
															     return datasets
														
@@ -431,7 +452,7 @@ def main(csv_paths, *,
 
															     if ylim is not None and len(ylim) == 1:
														
 
															         ylim = (0, ylim[0])
														
 
															-    # seperate out renames
														
 
															+    # separate out renames
														
 
															     renames = [k.split('=', 1)
														
 
															         for k in it.chain(by or [], x or [], y or [])
														
 
															         if '=' in k]
														
@@ -452,7 +473,7 @@ def main(csv_paths, *,
 
															         results = collect(csv_paths, renames)
														
 
															         # then extract the requested datasets
														
 
															-        datasets_ = datasets(results, by, x, y, dict(define))
														
 
															+        datasets_ = datasets(results, by, x, y, define)
														
 
															         # what colors to use?
														
 
															         if colors is not None:
														
@@ -483,10 +504,7 @@ def main(csv_paths, *,
 
															                         else '%s ' % line_chars_[i % len(line_chars_)]
														
 
															                         if line_chars is not None
														
 
															                         else '',
														
 
															-                    ','.join(k_ for i, k_ in enumerate(k)
														
 
															-                        if k_
														
 
															-                        if not (i == len(k)-2 and len(x) == 1)
														
 
															-                        if not (i == len(k)-1 and len(y) == 1)))
														
 
															+                    ','.join(k_ for k_ in k if k_))
														
 
															                 if label:
														
 
															                     legend_.append(label)
														
@@ -685,7 +703,7 @@ if __name__ == "__main__":
 
															         '-b', '--by',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															         help="Fields to render as separate plots. All other fields will be "
														
 
															-            "summed. Can rename fields with new_name=old_name.")
														
 
															+            "summed as needed. Can rename fields with new_name=old_name.")
														
 
															     parser.add_argument(
														
 
															         '-x',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
@@ -694,15 +712,14 @@ if __name__ == "__main__":
 
															     parser.add_argument(
														
 
															         '-y',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        required=True,
														
 
															         help="Fields to use for the y-axis. Can rename fields with "
														
 
															             "new_name=old_name.")
														
 
															     parser.add_argument(
														
 
															         '-D', '--define',
														
 
															-        type=lambda x: (lambda k, v: (k, set(v.split(','))))(*x.split('=', 1)),
														
 
															+        type=lambda x: (lambda k,v: (k, set(v.split(','))))(*x.split('=', 1)),
														
 
															         action='append',
														
 
															-        help="Only include rows where this field is this value (field=value). "
														
 
															-            "May include comma-separated options.")
														
 
															+        help="Only include rows where this field is this value. May include "
														
 
															+            "comma-separated options.")
														
 
															     parser.add_argument(
														
 
															         '--color',
														
 
															         choices=['never', 'always', 'auto'],
														
--- a/scripts/summary.py
+++ b/scripts/summary.py
@@ -16,6 +16,7 @@ import collections as co
 
															 import csv
														
 
															 import functools as ft
														
 
															 import glob
														
 
															+import itertools as it
														
 
															 import math as m
														
 
															 import os
														
 
															 import re
														
@@ -23,31 +24,13 @@ import re
 
															 CSV_PATHS = ['*.csv']
														
 
															-# Defaults are common fields generated by other littlefs scripts
														
 
															-MERGES = {
														
 
															-    'add': (
														
 
															-        ['code_size', 'data_size', 'stack_frame', 'struct_size',
														
 
															-            'coverage_lines', 'coverage_branches',
														
 
															-            'test_passed',
														
 
															-            'bench_read', 'bench_prog', 'bench_erased'],
														
 
															-        lambda xs: sum(xs[1:], start=xs[0])
														
 
															-    ),
														
 
															-    'mul': (
														
 
															-        [],
														
 
															-        lambda xs: m.prod(xs[1:], start=xs[0])
														
 
															-    ),
														
 
															-    'min': (
														
 
															-        [],
														
 
															-        min
														
 
															-    ),
														
 
															-    'max': (
														
 
															-        ['stack_limit', 'coverage_hits'],
														
 
															-        max
														
 
															-    ),
														
 
															-    'avg': (
														
 
															-        [],
														
 
															-        lambda xs: sum(xs[1:], start=xs[0]) / len(xs)
														
 
															-    ),
														
 
															+# supported merge operations
														
 
															+OPS = {
														
 
															+    'add': lambda xs: sum(xs[1:], start=xs[0]),
														
 
															+    'mul': lambda xs: m.prod(xs[1:], start=xs[0]),
														
 
															+    'min': min,
														
 
															+    'max': max,
														
 
															+    'avg': lambda xs: sum(xs[1:], start=xs[0]) / len(xs),
														
 
															 }
														
@@ -273,112 +256,142 @@ class FracField(co.namedtuple('FracField', 'a,b')):
 
															     def __truediv__(self, n):
														
 
															         return FracField(self.a / n, self.b / n)
														
 
															+# available types
														
 
															+TYPES = [IntField, FloatField, FracField]
														
 
															+
														
 
															 def homogenize(results, *,
														
 
															+        by=None,
														
 
															         fields=None,
														
 
															-        merges=None,
														
 
															-        renames=None,
														
 
															+        renames=[],
														
 
															+        define={},
														
 
															         types=None,
														
 
															         **_):
														
 
															+    results = results.copy()
														
 
															+
														
 
															     # rename fields?
														
 
															-    if renames is not None:
														
 
															+    if renames:
														
 
															+        for r in results:
														
 
															+            # make a copy so renames can overlap
														
 
															+            r_ = {}
														
 
															+            for new_k, old_k in renames:
														
 
															+                if old_k in r:
														
 
															+                    r_[new_k] = r[old_k]
														
 
															+            r.update(r_)
														
 
															+
														
 
															+    # filter by matching defines
														
 
															+    if define:
														
 
															         results_ = []
														
 
															         for r in results:
														
 
															-            results_.append({renames.get(k, k): v for k, v in r.items()})
														
 
															+            if all(k in r and r[k] in vs for k, vs in define):
														
 
															+                results_.append(r)
														
 
															         results = results_
														
 
															-    # find all fields
														
 
															-    if not fields:
														
 
															+    # if fields not specified, try to guess from data
														
 
															+    if fields is None:
														
 
															         fields = co.OrderedDict()
														
 
															         for r in results:
														
 
															-            # also remove None fields, these can get introduced by
														
 
															-            # csv.DictReader when header and rows mismatch
														
 
															-            fields.update((k, v) for k, v in r.items() if k is not None)
														
 
															-        fields = list(fields.keys())
														
 
															+            for k, v in r.items():
														
 
															+                if by is not None and k in by:
														
 
															+                    continue
														
 
															+                types_ = []
														
 
															+                for type in fields.get(k, TYPES):
														
 
															+                    try:
														
 
															+                        type(v)
														
 
															+                        types_.append(type)
														
 
															+                    except ValueError:
														
 
															+                        pass
														
 
															+                fields[k] = types_
														
 
															+        fields = list(k for k,v in fields.items() if v)
														
 
															+
														
 
															+    # infer 'by' fields?
														
 
															+    if by is None:
														
 
															+        by = co.OrderedDict()
														
 
															+        for r in results:
														
 
															+            # also ignore None keys, these are introduced by csv.DictReader
														
 
															+            # when header + row mismatch
														
 
															+            by.update((k, True) for k in r.keys()
														
 
															+                if k is not None
														
 
															+                    and k not in fields
														
 
															+                    and not any(k == old_k for _, old_k in renames))
														
 
															+        by = list(by.keys()) 
														
 
															     # go ahead and clean up none values, these can have a few forms
														
 
															     results_ = []
														
 
															     for r in results:
														
 
															         results_.append({
														
 
															-            k: r[k] for k in fields
														
 
															-            if r.get(k) is not None and not(
														
 
															+            k: r[k] for k in it.chain(by, fields)
														
 
															+            if r.get(k) is not None and not (
														
 
															                 isinstance(r[k], str)
														
 
															                 and re.match('^\s*[+-]?\s*$', r[k]))})
														
 
															+    results = results_
														
 
															     # find best type for all fields
														
 
															-    def try_(x, type):
														
 
															-        try:
														
 
															-            type(x)
														
 
															-            return True
														
 
															-        except ValueError:
														
 
															-            return False
														
 
															-
														
 
															     if types is None:
														
 
															+        def is_type(x, type):
														
 
															+            try:
														
 
															+                type(x)
														
 
															+                return True
														
 
															+            except ValueError:
														
 
															+                return False
														
 
															+
														
 
															         types = {}
														
 
															         for k in fields:
														
 
															-            if merges is not None and merges.get(k):
														
 
															-                for type in [IntField, FloatField, FracField]:
														
 
															-                    if all(k not in r or try_(r[k], type) for r in results_):
														
 
															-                        types[k] = type
														
 
															-                        break
														
 
															-                else:
														
 
															-                    print("no type matches field %r?" % k)
														
 
															-                    sys.exit(-1)
														
 
															+            for type in TYPES:
														
 
															+                if all(k not in r or is_type(r[k], type) for r in results_):
														
 
															+                    types[k] = type
														
 
															+                    break
														
 
															+            else:
														
 
															+                print("no type matches field %r?" % k)
														
 
															+                sys.exit(-1)
														
 
															     # homogenize types
														
 
															-    for k in fields:
														
 
															-        if k in types:
														
 
															-            for r in results_:
														
 
															-                if k in r:
														
 
															-                    r[k] = types[k](r[k])
														
 
															+    for r in results:
														
 
															+        for k in fields:
														
 
															+            if k in r:
														
 
															+                r[k] = types[k](r[k])
														
 
															-    return fields, types, results_
														
 
															+    return by, fields, types, results
														
 
															 def fold(results, *,
														
 
															-        fields=None,
														
 
															-        merges=None,
														
 
															-        by=None,
														
 
															+        by=[],
														
 
															+        fields=[],
														
 
															+        ops={},
														
 
															         **_):
														
 
															     folding = co.OrderedDict()
														
 
															-    if by is None:
														
 
															-        by = [k for k in fields if k not in merges]
														
 
															-
														
 
															     for r in results:
														
 
															-        name = tuple(r.get(k) for k in by)
														
 
															+        name = tuple(r.get(k, '') for k in by)
														
 
															         if name not in folding:
														
 
															-            folding[name] = {k: [] for k in fields if k in merges}
														
 
															+            folding[name] = {k: [] for k in fields}
														
 
															         for k in fields:
														
 
															-            # drop all fields fields without a type
														
 
															-            if k in merges and k in r:
														
 
															+            if k in r:
														
 
															                 folding[name][k].append(r[k])
														
 
															     # merge fields, we need the count at this point for averages
														
 
															     folded = []
														
 
															-    types = {}
														
 
															     for name, r in folding.items():
														
 
															         r_ = {}
														
 
															         for k, vs in r.items():
														
 
															             if vs:
														
 
															-                _, merge = MERGES[merges[k]]
														
 
															-                r_[k] = merge(vs)
														
 
															+                # sum fields by default
														
 
															+                op = OPS[ops.get(k, 'add')]
														
 
															+                r_[k] = op(vs)
														
 
															-        # drop all rows without any fields
														
 
															-        # and drop all empty keys
														
 
															+        # drop any rows without fields and any empty keys
														
 
															         if r_:
														
 
															             folded.append(dict(
														
 
															-                {k: n for k, n in zip(by, name) if n},
														
 
															+                {k: v for k, v in zip(by, name) if v},
														
 
															                 **r_))
														
 
															-    fields_ = by + [k for k in fields if k in merges]
														
 
															-    return fields_, folded
														
 
															+    return folded
														
 
															 def table(results, diff_results=None, *,
														
 
															+        by=None,
														
 
															         fields=None,
														
 
															         types=None,
														
 
															-        merges=None,
														
 
															-        by=None,
														
 
															+        ops=None,
														
 
															         sort=None,
														
 
															         reverse_sort=None,
														
 
															         summary=False,
														
@@ -387,29 +400,18 @@ def table(results, diff_results=None, *,
 
															         **_):
														
 
															     all_, all = all, __builtins__.all
														
 
															-    # fold
														
 
															-    if by is not None:
														
 
															-        fields, results = fold(results, fields=fields, merges=merges, by=by)
														
 
															-        if diff_results is not None:
														
 
															-            _, diff_results = fold(diff_results,
														
 
															-                fields=fields, merges=merges, by=by)
														
 
															-
														
 
															-    table = {
														
 
															-        tuple(r.get(k,'') for k in fields if k not in merges): r
														
 
															-        for r in results}
														
 
															-    diff_table = {
														
 
															-        tuple(r.get(k,'') for k in fields if k not in merges): r
														
 
															-        for r in diff_results or []}
														
 
															+    table = {tuple(r.get(k,'') for k in by): r for r in results}
														
 
															+    diff_table = {tuple(r.get(k,'') for k in by): r for r in diff_results or []}
														
 
															     # sort, note that python's sort is stable
														
 
															     names = list(table.keys() | diff_table.keys())
														
 
															     names.sort()
														
 
															     if diff_results is not None:
														
 
															-        names.sort(key=lambda n: [
														
 
															+        names.sort(key=lambda n: tuple(
														
 
															             -types[k].ratio(
														
 
															                 table.get(n,{}).get(k),
														
 
															                 diff_table.get(n,{}).get(k))
														
 
															-                for k in fields if k in merges])
														
 
															+            for k in fields))
														
 
															     if sort:
														
 
															         names.sort(key=lambda n: tuple(
														
 
															             (table[n][k],) if k in table.get(n,{}) else ()
														
@@ -423,7 +425,7 @@ def table(results, diff_results=None, *,
 
															     # print header
														
 
															     print('%-36s' % ('%s%s' % (
														
 
															-        ','.join(k for k in fields if k not in merges),
														
 
															+        ','.join(k for k in by),
														
 
															         ' (%d added, %d removed)' % (
														
 
															             sum(1 for n in table if n not in diff_table),
														
 
															             sum(1 for n in diff_table if n not in table))
														
@@ -433,19 +435,19 @@ def table(results, diff_results=None, *,
 
															     if diff_results is None:
														
 
															         print(' %s' % (
														
 
															             ' '.join(k.rjust(len(types[k].none))
														
 
															-                for k in fields if k in merges)))
														
 
															+                for k in fields)))
														
 
															     elif percent:
														
 
															         print(' %s' % (
														
 
															             ' '.join(k.rjust(len(types[k].diff_none))
														
 
															-                for k in fields if k in merges)))
														
 
															+                for k in fields)))
														
 
															     else:
														
 
															         print(' %s %s %s' % (
														
 
															             ' '.join(('o'+k).rjust(len(types[k].diff_none))
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' '.join(('n'+k).rjust(len(types[k].diff_none))
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' '.join(('d'+k).rjust(len(types[k].diff_none))
														
 
															-                for k in fields if k in merges)))
														
 
															+                for k in fields)))
														
 
															     # print entries
														
 
															     if not summary:
														
@@ -454,7 +456,7 @@ def table(results, diff_results=None, *,
 
															             if diff_results is not None:
														
 
															                 diff_r = diff_table.get(name, {})
														
 
															                 ratios = [types[k].ratio(r.get(k), diff_r.get(k))
														
 
															-                    for k in fields if k in merges]
														
 
															+                    for k in fields]
														
 
															                 if not any(ratios) and not all_:
														
 
															                     continue
														
@@ -463,12 +465,12 @@ def table(results, diff_results=None, *,
 
															                 print(' %s' % (
														
 
															                     ' '.join(r[k].table()
														
 
															                         if k in r else types[k].none
														
 
															-                        for k in fields if k in merges)))
														
 
															+                        for k in fields)))
														
 
															             elif percent:
														
 
															                 print(' %s%s' % (
														
 
															                     ' '.join(r[k].diff_table()
														
 
															                         if k in r else types[k].diff_none
														
 
															-                        for k in fields if k in merges),
														
 
															+                        for k in fields),
														
 
															                     ' (%s)' % ', '.join(
														
 
															                             '+∞%' if t == float('+inf')
														
 
															                             else '-∞%' if t == float('-inf')
														
@@ -478,13 +480,13 @@ def table(results, diff_results=None, *,
 
															                 print(' %s %s %s%s' % (
														
 
															                     ' '.join(diff_r[k].diff_table()
														
 
															                         if k in diff_r else types[k].diff_none
														
 
															-                        for k in fields if k in merges),
														
 
															+                        for k in fields),
														
 
															                     ' '.join(r[k].diff_table()
														
 
															                         if k in r else types[k].diff_none
														
 
															-                        for k in fields if k in merges),
														
 
															+                        for k in fields),
														
 
															                     ' '.join(types[k].diff_diff(r.get(k), diff_r.get(k))
														
 
															                         if k in r or k in diff_r else types[k].diff_none
														
 
															-                        for k in fields if k in merges),
														
 
															+                        for k in fields),
														
 
															                     ' (%s)' % ', '.join(
														
 
															                             '+∞%' if t == float('+inf')
														
 
															                             else '-∞%' if t == float('-inf')
														
@@ -494,26 +496,25 @@ def table(results, diff_results=None, *,
 
															                         if any(ratios) else ''))
														
 
															     # print total
														
 
															-    _, total = fold(results, fields=fields, merges=merges, by=[])
														
 
															+    total = fold(results, by=[], fields=fields, ops=ops)
														
 
															     r = total[0] if total else {}
														
 
															     if diff_results is not None:
														
 
															-        _, diff_total = fold(diff_results,
														
 
															-            fields=fields, merges=merges, by=[])
														
 
															+        diff_total = fold(diff_results, by=[], fields=fields, ops=ops)
														
 
															         diff_r = diff_total[0] if diff_total else {}
														
 
															         ratios = [types[k].ratio(r.get(k), diff_r.get(k))
														
 
															-            for k in fields if k in merges]
														
 
															+            for k in fields]
														
 
															     print('%-36s' % 'TOTAL', end='')
														
 
															     if diff_results is None:
														
 
															         print(' %s' % (
														
 
															             ' '.join(r[k].table()
														
 
															                 if k in r else types[k].none
														
 
															-                for k in fields if k in merges)))
														
 
															+                for k in fields)))
														
 
															     elif percent:
														
 
															         print(' %s%s' % (
														
 
															             ' '.join(r[k].diff_table()
														
 
															                 if k in r else types[k].diff_none
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' (%s)' % ', '.join(
														
 
															                     '+∞%' if t == float('+inf')
														
 
															                     else '-∞%' if t == float('-inf')
														
@@ -523,13 +524,13 @@ def table(results, diff_results=None, *,
 
															         print(' %s %s %s%s' % (
														
 
															             ' '.join(diff_r[k].diff_table()
														
 
															                 if k in diff_r else types[k].diff_none
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' '.join(r[k].diff_table()
														
 
															                 if k in r else types[k].diff_none
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' '.join(types[k].diff_diff(r.get(k), diff_r.get(k))
														
 
															                 if k in r or k in diff_r else types[k].diff_none
														
 
															-                for k in fields if k in merges),
														
 
															+                for k in fields),
														
 
															             ' (%s)' % ', '.join(
														
 
															                     '+∞%' if t == float('+inf')
														
 
															                     else '-∞%' if t == float('-inf')
														
@@ -539,56 +540,35 @@ def table(results, diff_results=None, *,
 
															                 if any(ratios) else ''))
														
 
															-def main(csv_paths, *, fields=None, by=None, **args):
														
 
															-    # figure out what fields to use
														
 
															-    renames = {}
														
 
															-
														
 
															-    if fields is not None:
														
 
															-        fields_ = []
														
 
															-        for name in fields:
														
 
															-            if '=' in name:
														
 
															-                a, b = name.split('=', 1)
														
 
															-                renames[b] = a
														
 
															-                name = a
														
 
															-            fields_.append(name)
														
 
															-        fields = fields_
														
 
															-
														
 
															+def main(csv_paths, *,
														
 
															+        by=None,
														
 
															+        fields=None,
														
 
															+        define=[],
														
 
															+        **args):
														
 
															+    # separate out renames
														
 
															+    renames = [k.split('=', 1)
														
 
															+        for k in it.chain(by or [], fields or [])
														
 
															+        if '=' in k]
														
 
															     if by is not None:
														
 
															-        by_ = []
														
 
															-        for name in by:
														
 
															-            if '=' in name:
														
 
															-                a, b = name.split('=', 1)
														
 
															-                renames[b] = a
														
 
															-                name = a
														
 
															-            by_.append(name)
														
 
															-        by = by_
														
 
															-
														
 
															-    # include 'by' fields in fields, it doesn't make sense to not
														
 
															-    if fields is not None and by is not None:
														
 
															-        fields[:0] = [k for k in by if k not in fields]
														
 
															-
														
 
															-    # use preconfigured merge operations unless any merge operation is
														
 
															-    # explictly specified
														
 
															-    merge_args = (args
														
 
															-        if any(args.get(m) for m in MERGES.keys())
														
 
															-        else {m: k for m, (k, _) in MERGES.items()})
														
 
															-    merges = {}
														
 
															-    for m in MERGES.keys():
														
 
															-        for k in merge_args.get(m, []):
														
 
															-            if k in merges:
														
 
															-                print("conflicting merge type for field %r?" % k)
														
 
															+        by = [k.split('=', 1)[0] for k in by]
														
 
															+    if fields is not None:
														
 
															+        fields = [k.split('=', 1)[0] for k in fields]
														
 
															+
														
 
															+    # figure out merge operations
														
 
															+    ops = {}
														
 
															+    for m in OPS.keys():
														
 
															+        for k in args.get(m, []):
														
 
															+            if k in ops:
														
 
															+                print("conflicting op for field %r?" % k)
														
 
															                 sys.exit(-1)
														
 
															-            merges[k] = m
														
 
															-    # allow renames to apply to merges
														
 
															-    for m in MERGES.keys():
														
 
															-        for k in merge_args.get(m, []):
														
 
															-            if renames.get(k, k) not in merges:
														
 
															-                merges[renames.get(k, k)] = m
														
 
															-    # ignore merges that conflict with 'by' fields
														
 
															-    if by is not None:
														
 
															-        for k in by:
														
 
															-            if k in merges:
														
 
															-                del merges[k]
														
 
															+            ops[k] = m
														
 
															+    # rename ops?
														
 
															+    if renames:
														
 
															+        ops_ = {}
														
 
															+        for new_k, old_k in renames:
														
 
															+            if old_k in ops:
														
 
															+                ops_[new_k] = ops[old_k]
														
 
															+        ops.update(ops_)
														
 
															     # find CSV files
														
 
															     paths = []
														
@@ -614,17 +594,17 @@ def main(csv_paths, *, fields=None, by=None, **args):
 
															             pass
														
 
															     # homogenize
														
 
															-    fields, types, results = homogenize(results,
														
 
															-        fields=fields, merges=merges, renames=renames)
														
 
															+    by, fields, types, results = homogenize(results,
														
 
															+        by=by, fields=fields, renames=renames, define=define)
														
 
															     # fold to remove duplicates
														
 
															-    fields, results = fold(results,
														
 
															-        fields=fields, merges=merges)
														
 
															+    results = fold(results,
														
 
															+        by=by, fields=fields, ops=ops)
														
 
															     # write results to CSV
														
 
															     if args.get('output'):
														
 
															         with openio(args['output'], 'w') as f:
														
 
															-            writer = csv.DictWriter(f, fields)
														
 
															+            writer = csv.DictWriter(f, by + fields)
														
 
															             writer.writeheader()
														
 
															             for r in results:
														
 
															                 writer.writerow(r)
														
@@ -641,22 +621,22 @@ def main(csv_paths, *, fields=None, by=None, **args):
 
															             pass
														
 
															         # homogenize
														
 
															-        _, _, diff_results = homogenize(diff_results,
														
 
															-            fields=fields, merges=merges, renames=renames, types=types)
														
 
															+        _, _, _, diff_results = homogenize(diff_results,
														
 
															+            by=by, fields=fields, renames=renames, define=define, types=types)
														
 
															         # fold to remove duplicates
														
 
															-        _, diff_results = fold(diff_results,
														
 
															-            fields=fields, merges=merges)
														
 
															+        diff_results = fold(diff_results,
														
 
															+            by=by, fields=fields, ops=ops)
														
 
															     # print table
														
 
															     if not args.get('quiet'):
														
 
															         table(
														
 
															             results,
														
 
															             diff_results if args.get('diff') else None,
														
 
															+            by=by,
														
 
															             fields=fields,
														
 
															+            ops=ops,
														
 
															             types=types,
														
 
															-            merges=merges,
														
 
															-            by=by,
														
 
															             **args)
														
@@ -690,35 +670,40 @@ if __name__ == "__main__":
 
															         action='store_true',
														
 
															         help="Only show percentage change, not a full diff.")
														
 
															     parser.add_argument(
														
 
															-        '-f', '--fields',
														
 
															+        '-b', '--by',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Only show these fields. Can rename fields "
														
 
															-            "with new_name=old_name.")
														
 
															+        help="Group by these fields. All other fields will be merged as "
														
 
															+            "needed. Can rename fields with new_name=old_name.")
														
 
															     parser.add_argument(
														
 
															-        '-b', '--by',
														
 
															+        '-f', '--fields',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Group by these fields. Can rename fields "
														
 
															-            "with new_name=old_name.")
														
 
															+        help="Use these fields. Can rename fields with new_name=old_name.")
														
 
															+    parser.add_argument(
														
 
															+        '-D', '--define',
														
 
															+        type=lambda x: (lambda k,v: (k, set(v.split(','))))(*x.split('=', 1)),
														
 
															+        action='append',
														
 
															+        help="Only include rows where this field is this value. May include "
														
 
															+            "comma-separated options.")
														
 
															     parser.add_argument(
														
 
															         '--add',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Add these fields when merging.")
														
 
															+        help="Add these fields (the default).")
														
 
															     parser.add_argument(
														
 
															         '--mul',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Multiply these fields when merging.")
														
 
															+        help="Multiply these fields.")
														
 
															     parser.add_argument(
														
 
															         '--min',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Take the minimum of these fields when merging.")
														
 
															+        help="Take the minimum of these fields.")
														
 
															     parser.add_argument(
														
 
															         '--max',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Take the maximum of these fields when merging.")
														
 
															+        help="Take the maximum of these fields.")
														
 
															     parser.add_argument(
														
 
															         '--avg',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],
														
 
															-        help="Average these fields when merging.")
														
 
															+        help="Average these fields.")
														
 
															     parser.add_argument(
														
 
															         '-s', '--sort',
														
 
															         type=lambda x: [x.strip() for x in x.split(',')],