new plots based on baseline precisiongit add time.rkt!

AYadrov · AYadrov · commit 3586e723d599 · 2024-10-23T12:22:50.000-06:00
diff --git a/infra/point_graph.py b/infra/point_graph.py
@@ -113,7 +113,7 @@ def plot_points_graph(outcomes, ax):
 
 def load_outcomes(path):
     outcomes = json.load(open(path, "r"))["outcomes"]
-    outcomes = pd.DataFrame(outcomes, columns=['time', 'rival_iter', 'tool_name', 'number_of_points'])
+    outcomes = pd.DataFrame(outcomes, columns=['time', 'rival_iter', 'baseline_precision', 'tool_name', 'number_of_points'])
     return outcomes
 
 parser = argparse.ArgumentParser(prog='point_graph.py', description='Script outputs plots for a Herbie run')
diff --git a/infra/ratio_plot.py b/infra/ratio_plot.py
@@ -4,51 +4,109 @@
 import pandas as pd
 import matplotlib.pyplot as plt
 
-def plot_speed_graph(outcomes, ax):
-    baseline_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-baseline") & (outcomes['rival_iter'] > 73)]
-    rival_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-rival") & (outcomes['rival_iter'] > 73)]
-    sollya_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-sollya") & (outcomes['rival_iter'] > 73)]
+def plot_speed_graph_rival_iter(outcomes, args):
+    # Create figure
+    fig, ax = plt.subplots(figsize=(4, 3.5))
+    fig.tight_layout(pad=2.0)
+    
+    # Drop precision column and sum up based on iteration
+    outcomes = outcomes.drop(['baseline_precision'], axis=1)
+    outcomes = outcomes.groupby(['rival_iter', 'tool_name'], as_index=False).sum()
+    
+    # Select appropriate tools
+    baseline_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-baseline")] # & (outcomes['baseline_precision'] > 73)
+    rival_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-rival")]
+    sollya_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-sollya")]
 
+    # Some weird functions that creates speed per millisecond for each tool
     def add_values(row):
         return int(row['rival_iter']), (row['number_of_points'] / row['time']) * 1000
-
     def tool_cmp2speed(x):
         return x.sort_values(by=['rival_iter']).apply(add_values, axis=1, result_type='expand')
 
+    # Sollya timings considered are as base since we are doing speed ratio comparison
     base = np.array(tool_cmp2speed(sollya_cmp)[1])
 
+    # Plot Rival
     ax.plot(tool_cmp2speed(rival_cmp)[0], np.array(tool_cmp2speed(rival_cmp)[1])/base, '.-', linewidth=2.0, color='r', label='reval')
+    # Plot Baseline
     ax.plot(tool_cmp2speed(baseline_cmp)[0], np.array(tool_cmp2speed(baseline_cmp)[1])/base, '--', linewidth=2.0, color='g',
             label='baseline')
+    # Plot Sollya
     ax.plot(tool_cmp2speed(sollya_cmp)[0], np.array(tool_cmp2speed(sollya_cmp)[1])/base, '-', linewidth=2.0, color='b',
             label='sollya')
 
+    ax.legend()
+    ax.set_xlabel("Difficulty")
+    ax.set_ylabel("Ratio")
+    ax.yaxis.grid(True, linestyle='-', which='major', color='grey', alpha=0.3)
+    plt.savefig(args.path + "/ratio_plot_iter.png", format="png")
+    plt.savefig(args.path + "/ratio_plot_iter.pdf", format="pdf")
+    
+    # Latex stuff
     print("\\newcommand{\RivalAvgSpeedupOverSollya}{" + str(round(tool_cmp2speed(rival_cmp)[1].sum()/np.array(tool_cmp2speed(sollya_cmp)[1]).sum(), 2)) + "\\xspace}")
     print("\\newcommand{\RivalAvgSpeedupOverBaseline}{" + str(
         round(tool_cmp2speed(rival_cmp)[1].sum() / np.array(tool_cmp2speed(baseline_cmp)[1]).sum(), 2)) + "\\xspace}")
-
     print("\\newcommand{\RivalMaxSpeedupOverSollya}{" + str(round(np.array(tool_cmp2speed(rival_cmp)[1])[-1]/np.array(tool_cmp2speed(sollya_cmp)[1])[-1], 2)) + "\\xspace}")
     print("\\newcommand{\RivalMaxSpeedupOverBaseline}{" + str(round(np.array(tool_cmp2speed(rival_cmp)[1])[-1]/np.array(tool_cmp2speed(baseline_cmp)[1])[-1], 2)) + "\\xspace}")
 
+def plot_speed_graph_baseline_precision(outcomes, args):
+    # Create figure
+    fig, ax = plt.subplots(figsize=(4, 3.5))
+    fig.tight_layout(pad=2.0)
+    
+    # Drop precision column and sum up based on iteration
+    outcomes = outcomes.drop(['rival_iter'], axis=1)
+    outcomes = outcomes.groupby(['baseline_precision', 'tool_name'], as_index=False).sum()
+    
+    # Select appropriate tools
+    baseline_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-baseline") & (outcomes['baseline_precision'] > 73)]
+    rival_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-rival") & (outcomes['baseline_precision'] > 73)]
+    sollya_cmp = outcomes.loc[(outcomes['tool_name'] == "valid-sollya") & (outcomes['baseline_precision'] > 73)]
+
+    # Some weird functions that creates speed per millisecond for each tool
+    def add_values(row):
+        return int(row['baseline_precision']), (row['number_of_points'] / row['time']) * 1000
+    def tool_cmp2speed(x):
+        return x.sort_values(by=['baseline_precision']).apply(add_values, axis=1, result_type='expand')
+
+    # Sollya timings considered are as base since we are doing speed ratio comparison
+    base = np.array(tool_cmp2speed(sollya_cmp)[1])
+
+    # Plot Rival
+    ax.plot(tool_cmp2speed(rival_cmp)[0], np.array(tool_cmp2speed(rival_cmp)[1])/base, '.-', linewidth=2.0, color='r', label='reval')
+    # Plot Baseline
+    ax.plot(tool_cmp2speed(baseline_cmp)[0], np.array(tool_cmp2speed(baseline_cmp)[1])/base, '--', linewidth=2.0, color='g',
+            label='baseline')
+    # Plot Sollya
+    ax.plot(tool_cmp2speed(sollya_cmp)[0], np.array(tool_cmp2speed(sollya_cmp)[1])/base, '-', linewidth=2.0, color='b',
+            label='sollya')
+
     ax.legend()
-    ax.set_xlabel("Difficulty")
+    ax.set_xlabel("Truth uniform precision")
     ax.set_ylabel("Ratio")
     ax.yaxis.grid(True, linestyle='-', which='major', color='grey', alpha=0.3)
-
+    plt.savefig(args.path + "/ratio_plot_precision.png", format="png")
+    plt.savefig(args.path + "/ratio_plot_precision.pdf", format="pdf")
+    
+    # Latex stuff
+    print("\\newcommand{\RivalAvgSpeedupOverSollya}{" + str(round(tool_cmp2speed(rival_cmp)[1].sum()/np.array(tool_cmp2speed(sollya_cmp)[1]).sum(), 2)) + "\\xspace}")
+    print("\\newcommand{\RivalAvgSpeedupOverBaseline}{" + str(
+        round(tool_cmp2speed(rival_cmp)[1].sum() / np.array(tool_cmp2speed(baseline_cmp)[1]).sum(), 2)) + "\\xspace}")
+    print("\\newcommand{\RivalMaxSpeedupOverSollya}{" + str(round(np.array(tool_cmp2speed(rival_cmp)[1])[-1]/np.array(tool_cmp2speed(sollya_cmp)[1])[-1], 2)) + "\\xspace}")
+    print("\\newcommand{\RivalMaxSpeedupOverBaseline}{" + str(round(np.array(tool_cmp2speed(rival_cmp)[1])[-1]/np.array(tool_cmp2speed(baseline_cmp)[1])[-1], 2)) + "\\xspace}")
+    
 def load_outcomes(path):
     outcomes = json.load(open(path, "r"))["outcomes"]
-    outcomes = pd.DataFrame(outcomes, columns=['time', 'rival_iter', 'tool_name', 'number_of_points'])
+    outcomes = pd.DataFrame(outcomes, columns=['time', 'rival_iter', 'baseline_precision', 'tool_name', 'number_of_points'])
     return outcomes
 
-parser = argparse.ArgumentParser(prog='histograms.py', description='Script outputs mixed precision histograms for a Herbie run')
+parser = argparse.ArgumentParser(prog='ratio_plot.py', description='Script outputs ratio plots')
 parser.add_argument('-t', '--timeline', dest='timeline', default="report/timeline.json")
 parser.add_argument('-o', '--output-path', dest='path', default="report")
 args = parser.parse_args()
 
 outcomes = load_outcomes(args.timeline)
+plot_speed_graph_rival_iter(outcomes, args)
+plot_speed_graph_baseline_precision(outcomes, args)
 
-fig, ax = plt.subplots(figsize=(4, 3.5))
-fig.tight_layout(pad=2.0)
-plot_speed_graph(outcomes, ax)
-plt.savefig(args.path + "/ratio_plot.png", format="png")
-plt.savefig(args.path + "/ratio_plot.pdf", format="pdf")
diff --git a/time.rkt b/time.rkt
@@ -69,7 +69,6 @@
     (for/list ([pt (in-list (hash-ref rec 'points))])
       ; --------------------------- Rival execution -------------------------------------------------
       (define rival-start-apply (current-inexact-milliseconds))
-
       (match-define (list rival-status rival-exs)
         (parameterize ([*rival-max-precision* 32256])
           (with-handlers ([exn:rival:invalid? (λ (e) (list 'invalid #f))]
@@ -156,7 +155,8 @@
                            sollya-status
                            sollya-apply-time
                            sollya-exs
-                           baseline-precision)))
+                           baseline-precision
+                           rival-iter)))
 
       ; Count differences where baseline is better than rival
       (define rival-baseline-difference
@@ -209,11 +209,11 @@
 (define (timeline-push! timeline key args*)
   (match key
     ['outcomes
-     (match-define (list status iter time*) args*)
+     (match-define (list status iter precision time*) args*)
      (define outcomes-hash (hash-ref timeline key))
      (match-define (list time num-points)
-       (hash-ref outcomes-hash (list status iter) (λ () (list 0 0))))
-     (hash-set! outcomes-hash (list status iter) (list (+ time time*) (+ num-points 1)))]
+       (hash-ref outcomes-hash (list status iter precision) (λ () (list 0 0))))
+     (hash-set! outcomes-hash (list status iter precision) (list (+ time time*) (+ num-points 1)))]
     [(or 'mixsample-rival-valid
          'mixsample-rival-all
          'mixsample-baseline-valid
@@ -227,7 +227,7 @@
 (define (timeline->jsexpr timeline)
   (hash 'outcomes
         (for/list ([(key value) (in-hash (hash-ref timeline 'outcomes))])
-          (list (first value) (second key) (first key) (second value)))
+          (list (first value) (second key) (third key) (first key) (second value)))
         'mixsample-rival-valid
         (for/list ([(key value) (in-hash (hash-ref timeline 'mixsample-rival-valid))])
           (list value (car key) (second key)))
@@ -400,7 +400,8 @@
     (html-end-table html-port))
 
   (when expression-table
-    (html-add-plot html-port "ratio_plot.png")
+    (html-add-plot html-port "ratio_plot_iter.png")
+    (html-add-plot html-port "ratio_plot_precision.png")
     (html-add-plot html-port "point_graph.png")
     (html-add-histogram html-port "histogram_valid.png")
     (html-add-histogram html-port "histogram_all.png"))
@@ -457,6 +458,7 @@
                          sollya-status
                          sollya-time
                          sollya-exs
+                         baseline-precision
                          rival-iter)
 
   (define (status-subbucketing status exs)
@@ -474,89 +476,125 @@
        [(and (equal? 'valid sollya-status)
              (equal? 'valid baseline-status)
              (equal? rival-status 'valid))
-        (timeline-push! timeline 'outcomes (list "valid-sollya" rival-iter sollya-time))
-        (timeline-push! timeline 'outcomes (list "valid-baseline" rival-iter baseline-time))
-        (timeline-push! timeline 'outcomes (list "valid-rival" rival-iter rival-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "valid-sollya" rival-iter baseline-precision sollya-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "valid-baseline" rival-iter baseline-precision baseline-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "valid-rival" rival-iter baseline-precision rival-time))
         (if (fl= rival-exs sollya-exs)
-            (timeline-push! timeline 'outcomes (list "sollya-correct-rounding" 0 0))
+            (timeline-push! timeline 'outcomes (list "sollya-correct-rounding" 0 0 0))
             (if (equal? (flonums-between rival-exs sollya-exs) 1)
-                (timeline-push! timeline 'outcomes (list "sollya-faithful-rounding" 0 0))
-                (timeline-push! timeline 'outcomes (list "sollya-off-results" 0 0))))]
+                (timeline-push! timeline 'outcomes (list "sollya-faithful-rounding" 0 0 0))
+                (timeline-push! timeline 'outcomes (list "sollya-off-results" 0 0 0))))]
 
        ; Baseline and Rival have succeeded
        [(and (equal? 'valid baseline-status) (equal? rival-status 'valid))
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-rival+baseline" rival-exs) rival-iter rival-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-rival+baseline" rival-exs)
+                              rival-iter
+                              baseline-precision
+                              rival-time))]
 
        ; Baseline and Sollya have succeeded
        [(and (equal? 'valid sollya-status) (equal? 'valid baseline-status))
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-sollya+baseline" baseline-exs) rival-iter sollya-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-sollya+baseline" baseline-exs)
+                              rival-iter
+                              baseline-precision
+                              sollya-time))]
 
        ; Sollya and Rival have succeeded
        [(and (equal? 'valid sollya-status) (equal? rival-status 'valid))
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-rival+sollya" rival-exs) rival-iter rival-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-rival+sollya" rival-exs)
+                              rival-iter
+                              baseline-precision
+                              rival-time))]
 
        ; Only Rival has succeeded
        [(equal? rival-status 'valid)
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-rival-only" rival-exs) rival-iter rival-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-rival-only" rival-exs)
+                              rival-iter
+                              baseline-precision
+                              rival-time))]
 
        ; Only Sollya has succeeded
        [(equal? 'valid sollya-status)
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-sollya-only" sollya-exs) rival-iter sollya-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-sollya-only" sollya-exs)
+                              rival-iter
+                              baseline-precision
+                              sollya-time))]
 
        ; Only Baseline has succeeded
        [(equal? 'valid baseline-status)
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-baseline-only" baseline-exs) rival-iter baseline-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-baseline-only" baseline-exs)
+                              rival-iter
+                              baseline-precision
+                              baseline-time))]
 
        ; timeout at all the tools
        [else
-        (timeline-push! timeline 'outcomes (list "exit-baseline" rival-iter baseline-time))
-        (timeline-push! timeline 'outcomes (list "exit-sollya" rival-iter sollya-time))
-        (timeline-push! timeline 'outcomes (list "exit-rival" rival-iter rival-time))])]
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-baseline" rival-iter baseline-precision baseline-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-sollya" rival-iter baseline-precision sollya-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-rival" rival-iter baseline-precision rival-time))])]
 
     ; Rival has exited
     [(equal? rival-status 'unsamplable)
      (cond
        ; Sollya and Baseline have succeeded
        [(and (equal? 'valid sollya-status) (equal? 'valid baseline-status))
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-sollya+baseline" baseline-exs) rival-iter sollya-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-sollya+baseline" baseline-exs)
+                              rival-iter
+                              baseline-precision
+                              sollya-time))]
 
        ; Only Sollya has succeeded
        [(equal? 'valid sollya-status)
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-sollya-only" sollya-exs) rival-iter sollya-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-sollya-only" sollya-exs)
+                              rival-iter
+                              baseline-precision
+                              sollya-time))]
 
        ; Only Baseline has succeeded
        [(equal? 'valid baseline-status)
-        (timeline-push!
-         timeline
-         'outcomes
-         (list (status-subbucketing "valid-baseline-only" baseline-exs) rival-iter baseline-time))]
+        (timeline-push! timeline
+                        'outcomes
+                        (list (status-subbucketing "valid-baseline-only" baseline-exs)
+                              rival-iter
+                              baseline-precision
+                              baseline-time))]
 
        ; Points that every tools fail to evaluate when the precision is unreacheble
        [else
-        (timeline-push! timeline 'outcomes (list "exit-baseline" rival-iter baseline-time))
-        (timeline-push! timeline 'outcomes (list "exit-sollya" rival-iter sollya-time))
-        (timeline-push! timeline 'outcomes (list "exit-rival" rival-iter rival-time))])]))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-baseline" rival-iter baseline-precision baseline-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-sollya" rival-iter baseline-precision sollya-time))
+        (timeline-push! timeline
+                        'outcomes
+                        (list "exit-rival" rival-iter baseline-precision rival-time))])]))