review by @martinfleis: prep for tests and benchmarking

ljwolf · ljwolf · commit 3b2ee7d9e702 · 2025-05-02T11:03:52.000+01:00
diff --git a/esda/crand.py b/esda/crand.py
@@ -8,21 +8,9 @@
 import numpy as np
 
 try:
-    from numba import boolean, jit, njit, prange
+    from numba import boolean, njit, prange
 except (ImportError, ModuleNotFoundError):
-
-    def jit(*dec_args, **dec_kwargs):
-        """
-        decorator mimicking numba.jit
-        """
-
-        def intercepted_function(f, *f_args, **f_kwargs):
-            return f
-
-        return intercepted_function
-
-    njit = jit
-
+    from libpysal.common import jit as njit
     prange = range
     boolean = bool
 
diff --git a/esda/significance.py b/esda/significance.py
@@ -4,19 +4,7 @@
 try:
     from numba import njit
 except (ImportError, ModuleNotFoundError):
-
-    def jit(*dec_args, **dec_kwargs):
-        """
-        decorator mimicking numba.jit
-        """
-
-        def intercepted_function(f, *f_args, **f_kwargs):
-            return f
-
-        return intercepted_function
-
-    njit = jit
-
+    from libpysal.common import jit as njit
 
 
 def calculate_significance(test_stat, reference_distribution, alternative="two-sided"):
@@ -108,57 +96,3 @@ def _permutation_significance(test_stat, reference_distribution, alternative='tw
     return p_value
 
 
-if __name__ == "__main__":
-    import numpy
-    import esda
-    import pandas
-    from libpysal.weights import Voronoi
-
-    coordinates = numpy.random.random(size=(2000, 2))
-    x = numpy.random.normal(size=(2000,))
-    w = Voronoi(coordinates, clip="bbox")
-    w.transform = "r"
-    stat = esda.Moran_Local(x, w)
-
-    ts = calculate_significance(stat.Is, stat.rlisas, method="two-sided")
-    di = calculate_significance(stat.Is, stat.rlisas, method="directed")
-    lt = calculate_significance(stat.Is, stat.rlisas, method="lesser")
-    gt = calculate_significance(stat.Is, stat.rlisas, method="greater")
-    fo = calculate_significance(stat.Is, stat.rlisas, method="folded")
-
-    numpy.testing.assert_array_equal(
-        numpy.minimum(lt, gt), di
-    )  # di is just the minimum of the two tests
-
-    print(
-        f"directed * 2 is the same as two-sided {(di*2 == ts).mean()*100}% of the time"
-    )
-
-    print(
-        pandas.DataFrame(
-            numpy.column_stack((ts, di, fo, lt, gt)),
-            columns=["two-sided", "directed", "folded", "lt", "gt"],
-        ).corr()
-    )
-
-    answer = input("run big simulation? [y/n]")
-    if answer.lower().startswith("y"):
-        all_correlations = []
-        for i in range(1000):
-            x = numpy.random.normal(size=(2000,))
-            stat = esda.Moran_Local(x, w)
-            ts = calculate_significance(stat.Is, stat.rlisas, method="two-sided")
-            di = calculate_significance(stat.Is, stat.rlisas, method="directed")
-            lt = calculate_significance(stat.Is, stat.rlisas, method="lesser")
-            gt = calculate_significance(stat.Is, stat.rlisas, method="greater")
-            fo = calculate_significance(stat.Is, stat.rlisas, method="folded")
-            corrs = (
-                pandas.DataFrame(
-                    numpy.column_stack((ts, di, fo, lt, gt)),
-                    columns=["two-sided", "directed", "folded", "lt", "gt"],
-                )
-                .corr()
-                .assign(repno=i)
-            )
-            all_correlations.append(corrs)
-        all_correlations = pandas.concat(all_correlations)
diff --git a/esda/tests/test_significance.py b/esda/tests/test_significance.py
@@ -0,0 +1,67 @@
+import numpy
+import esda
+import pandas
+from libpysal.weights import Voronoi
+
+#this was more a validation exercise than a test. 
+#Set tests to check:
+#1. the results of the two sided are always greater than the directed
+#2. the results of the directed are equal to either the lesser or greater
+#3. the folded variant is close to the two-sided variant in a normal problem, 
+#   but is similar to the one-sided test in a very skewed problem
+#4. all p-values are between 0 and 1, with some p-values near 1
+#5. no directed p-value will be bigger than .5
+
+def test_significance():
+    raise NotImplementedError()
+
+"""
+coordinates = numpy.random.random(size=(2000, 2))
+x = numpy.random.normal(size=(2000,))
+w = Voronoi(coordinates, clip="bbox")
+w.transform = "r"
+stat = esda.Moran_Local(x, w)
+
+ts = calculate_significance(stat.Is, stat.rlisas, method="two-sided")
+di = calculate_significance(stat.Is, stat.rlisas, method="directed")
+lt = calculate_significance(stat.Is, stat.rlisas, method="lesser")
+gt = calculate_significance(stat.Is, stat.rlisas, method="greater")
+fo = calculate_significance(stat.Is, stat.rlisas, method="folded")
+
+numpy.testing.assert_array_equal(
+    numpy.minimum(lt, gt), di
+)  # di is just the minimum of the two tests
+
+print(
+    f"directed * 2 is the same as two-sided {(di*2 == ts).mean()*100}% of the time"
+)
+
+print(
+    pandas.DataFrame(
+        numpy.column_stack((ts, di, fo, lt, gt)),
+        columns=["two-sided", "directed", "folded", "lt", "gt"],
+    ).corr()
+)
+
+answer = input("run big simulation? [y/n]")
+if answer.lower().startswith("y"):
+    all_correlations = []
+    for i in range(1000):
+        x = numpy.random.normal(size=(2000,))
+        stat = esda.Moran_Local(x, w)
+        ts = calculate_significance(stat.Is, stat.rlisas, method="two-sided")
+        di = calculate_significance(stat.Is, stat.rlisas, method="directed")
+        lt = calculate_significance(stat.Is, stat.rlisas, method="lesser")
+        gt = calculate_significance(stat.Is, stat.rlisas, method="greater")
+        fo = calculate_significance(stat.Is, stat.rlisas, method="folded")
+        corrs = (
+            pandas.DataFrame(
+                numpy.column_stack((ts, di, fo, lt, gt)),
+                columns=["two-sided", "directed", "folded", "lt", "gt"],
+            )
+            .corr()
+            .assign(repno=i)
+        )
+        all_correlations.append(corrs)
+    all_correlations = pandas.concat(all_correlations)
+"""