Do not predefine custom Cholesky and SolveTriangular Ops

ricardoV94 · ricardoV94 · commit ec64d4016358 · 2023-09-14T09:25:11.000+02:00
Also standardize pytensor linalg calls
diff --git a/pymc/distributions/multivariate.py b/pymc/distributions/multivariate.py
@@ -17,7 +17,7 @@
 
 import warnings
 
-from functools import reduce
+from functools import partial, reduce
 from typing import Optional
 
 import numpy as np
@@ -30,16 +30,17 @@
 from pytensor.raise_op import Assert
 from pytensor.sparse.basic import sp_sum
 from pytensor.tensor import TensorConstant, gammaln, sigmoid
-from pytensor.tensor.nlinalg import det, eigh, matrix_inverse, trace
+from pytensor.tensor.linalg import cholesky, det, eigh
+from pytensor.tensor.linalg import inv as matrix_inverse
+from pytensor.tensor.linalg import solve_triangular, trace
 from pytensor.tensor.random.basic import dirichlet, multinomial, multivariate_normal
 from pytensor.tensor.random.op import RandomVariable
 from pytensor.tensor.random.utils import (
     broadcast_params,
     supp_shape_from_ref_param_shape,
 )
-from pytensor.tensor.slinalg import Cholesky, SolveTriangular
 from pytensor.tensor.type import TensorType
-from scipy import linalg, stats
+from scipy import stats
 
 import pymc as pm
 
@@ -93,8 +94,8 @@
     "StickBreakingWeights",
 ]
 
-solve_lower = SolveTriangular(lower=True)
-solve_upper = SolveTriangular(lower=False)
+solve_lower = partial(solve_triangular, lower=True)
+solve_upper = partial(solve_triangular, lower=False)
 
 
 class SimplexContinuous(Continuous):
@@ -110,7 +111,7 @@ def simplex_cont_transform(op, rv):
 # moment. We work around that by using a cholesky op
 # that returns a nan as first entry instead of raising
 # an error.
-cholesky = Cholesky(lower=True, on_error="nan")
+nan_lower_cholesky = partial(cholesky, lower=True, on_error="nan")
 
 
 def quaddist_matrix(cov=None, chol=None, tau=None, lower=True, *args, **kwargs):
@@ -155,7 +156,7 @@ def quaddist_parse(value, mu, cov, mat_type="cov"):
         onedim = False
 
     delta = value - mu
-    chol_cov = cholesky(cov)
+    chol_cov = nan_lower_cholesky(cov)
     if mat_type != "tau":
         dist, logdet, ok = quaddist_chol(delta, chol_cov)
     else:
@@ -847,9 +848,9 @@ def dist(cls, *args, **kwargs):
 
 def posdef(AA):
     try:
-        linalg.cholesky(AA)
+        scipy.linalg.cholesky(AA)
         return True
-    except linalg.LinAlgError:
+    except scipy.linalg.LinAlgError:
         return False
 
 
@@ -1073,7 +1074,7 @@ def WishartBartlett(name, S, nu, is_cholesky=False, return_cholesky=False, initv
     if initval is not None:
         # Inverse transform
         initval = np.dot(np.dot(np.linalg.inv(L), initval), np.linalg.inv(L.T))
-        initval = linalg.cholesky(initval, lower=True)
+        initval = scipy.linalg.cholesky(initval, lower=True)
         diag_testval = initval[diag_idx] ** 2
         tril_testval = initval[tril_idx]
     else:
@@ -1785,7 +1786,7 @@ def dist(
         *args,
         **kwargs,
     ):
-        cholesky = Cholesky(lower=True, on_error="raise")
+        lower_cholesky = partial(cholesky, lower=True, on_error="raise")
 
         # Among-row matrices
         if len([i for i in [rowcov, rowchol] if i is not None]) != 1:
@@ -1795,7 +1796,7 @@ def dist(
         if rowcov is not None:
             if rowcov.ndim != 2:
                 raise ValueError("rowcov must be two dimensional.")
-            rowchol_cov = cholesky(rowcov)
+            rowchol_cov = lower_cholesky(rowcov)
         else:
             if rowchol.ndim != 2:
                 raise ValueError("rowchol must be two dimensional.")
@@ -1810,7 +1811,7 @@ def dist(
             colcov = pt.as_tensor_variable(colcov)
             if colcov.ndim != 2:
                 raise ValueError("colcov must be two dimensional.")
-            colchol_cov = cholesky(colcov)
+            colchol_cov = lower_cholesky(colcov)
         else:
             if colchol.ndim != 2:
                 raise ValueError("colchol must be two dimensional.")
@@ -1851,10 +1852,10 @@ def logp(value, mu, rowchol, colchol):
 
         # Find exponent piece by piece
         right_quaddist = solve_lower(rowchol, delta)
-        quaddist = pt.nlinalg.matrix_dot(right_quaddist.T, right_quaddist)
+        quaddist = pt.linalg.matrix_dot(right_quaddist.T, right_quaddist)
         quaddist = solve_lower(colchol, quaddist)
         quaddist = solve_upper(colchol.T, quaddist)
-        trquaddist = pt.nlinalg.trace(quaddist)
+        trquaddist = pt.linalg.trace(quaddist)
 
         coldiag = pt.diag(colchol)
         rowdiag = pt.diag(rowchol)
@@ -1887,7 +1888,7 @@ def rng_fn(self, rng, mu, sigma, *covs, size=None):
         size = size if size else covs[-1]
         covs = covs[:-1] if covs[-1] == size else covs
 
-        cov = reduce(linalg.kron, covs)
+        cov = reduce(scipy.linalg.kron, covs)
 
         if sigma:
             cov = cov + sigma**2 * np.eye(cov.shape[0])
@@ -1930,7 +1931,7 @@ class KroneckerNormal(Continuous):
         :math:`[(v_1, Q_1), (v_2, Q_2), ...]` such that
         :math:`K_i = Q_i \text{diag}(v_i) Q_i'`. For example::
 
-            v_i, Q_i = pt.nlinalg.eigh(K_i)
+            v_i, Q_i = pt.linalg.eigh(K_i)
     sigma : scalar, optional
         Standard deviation of the Gaussian white noise.
 
@@ -2228,7 +2229,7 @@ def logp(value, mu, W, alpha, tau):
             D = W.sum(axis=0)
             Dinv_sqrt = pt.diag(1 / pt.sqrt(D))
             DWD = pt.dot(pt.dot(Dinv_sqrt, W), Dinv_sqrt)
-        lam = pt.slinalg.eigvalsh(DWD, pt.eye(DWD.shape[0]))
+        lam = pt.linalg.eigvalsh(DWD, pt.eye(DWD.shape[0]))
 
         d, _ = W.shape
 
diff --git a/pymc/gp/gp.py b/pymc/gp/gp.py
@@ -14,26 +14,28 @@
 
 import warnings
 
+from functools import partial
+
 import numpy as np
 import pytensor.tensor as pt
 
-from pytensor.tensor.nlinalg import eigh
+from pytensor.tensor.linalg import cholesky, eigh, solve_triangular
 
 import pymc as pm
 
 from pymc.gp.cov import BaseCovariance, Constant
 from pymc.gp.mean import Zero
 from pymc.gp.util import (
     JITTER_DEFAULT,
-    cholesky,
     conditioned_vars,
     replace_with_values,
-    solve_lower,
-    solve_upper,
     stabilize,
 )
 from pymc.math import cartesian, kron_diag, kron_dot, kron_solve_lower, kron_solve_upper
 
+solve_lower = partial(solve_triangular, lower=True)
+solve_upper = partial(solve_triangular, lower=False)
+
 __all__ = ["Latent", "Marginal", "TP", "MarginalApprox", "LatentKron", "MarginalKron"]
 
 
diff --git a/pymc/gp/util.py b/pymc/gp/util.py
@@ -18,11 +18,6 @@
 import pytensor.tensor as pt
 
 from pytensor.compile import SharedVariable
-from pytensor.tensor.slinalg import (  # noqa: W0611; pylint: disable=unused-import
-    SolveTriangular,
-    cholesky,
-    solve,
-)
 from pytensor.tensor.var import TensorConstant
 from scipy.cluster.vq import kmeans
 
@@ -35,9 +30,6 @@
 
 JITTER_DEFAULT = 1e-6
 
-solve_lower = SolveTriangular(lower=True)
-solve_upper = SolveTriangular(lower=False)
-
 
 def replace_with_values(vars_needed, replacements=None, model=None):
     R"""
diff --git a/pymc/math.py b/pymc/math.py
@@ -75,14 +75,9 @@
     where,
     zeros_like,
 )
-from pytensor.tensor.special import log_softmax, softmax
-
-try:
-    from pytensor.tensor.basic import extract_diag
-except ImportError:
-    from pytensor.tensor.nlinalg import extract_diag
-
+from pytensor.tensor.linalg import solve_triangular
 from pytensor.tensor.nlinalg import matrix_inverse
+from pytensor.tensor.special import log_softmax, softmax
 from scipy.linalg import block_diag as scipy_block_diag
 
 from pymc.pytensorf import floatX, ix_, largest_common_dtype
@@ -230,8 +225,8 @@ def kron_vector_op(v):
 
 # Define kronecker functions that work on 1D and 2D arrays
 kron_dot = partial(kron_matrix_op, op=pt.dot)
-kron_solve_lower = partial(kron_matrix_op, op=pt.slinalg.SolveTriangular(lower=True))
-kron_solve_upper = partial(kron_matrix_op, op=pt.slinalg.SolveTriangular(lower=False))
+kron_solve_lower = partial(kron_matrix_op, op=partial(solve_triangular, lower=True))
+kron_solve_upper = partial(kron_matrix_op, op=partial(solve_triangular, lower=False))
 
 
 def flat_outer(a, b):