comments

Devjiu · Devjiu · commit 283be5423a3e · 2025-06-02T13:13:10.000Z
diff --git a/bitsandbytes/__init__.py b/bitsandbytes/__init__.py
@@ -35,9 +35,8 @@
     from .backends.cuda import ops as cuda_ops
 
 # xpu was introduced in PyTorch 2.3
-if torch.__version__ >= (2, 3):
-    if torch.xpu.is_available():
-        from .backends.xpu import ops as xpu_ops
+if torch.__version__ >= (2, 3) and torch.xpu.is_available():
+    from .backends.xpu import ops as xpu_ops
 
 
 def _import_backends():
diff --git a/bitsandbytes/backends/xpu/ops.py b/bitsandbytes/backends/xpu/ops.py
@@ -6,8 +6,8 @@
 from ..._ops import register_kernel
 from ..utils import ipex_xpu, triton_available
 
-# With default torch, error:
-#  NotImplementedError: The operator 'aten::_int_mm' for XPU
+# _int_mm is available in torch starting from 2.7 version,
+# but currently it's don't have xpu implementation.
 if ipex_xpu and torch.__version__ >= (2, 7):
 
     @register_kernel("bitsandbytes::int8_linear_matmul", "xpu")
@@ -18,6 +18,7 @@ def _(A: torch.Tensor, B: torch.Tensor):
         ).reshape(*A.shape[:-1], B.shape[0])
 
 
+# IPEX should be faster for xpu, so at first checking if it is available.
 if ipex_xpu:
 
     @register_kernel("bitsandbytes::dequantize_nf4_ipex", "xpu")
@@ -53,7 +54,6 @@ def _(
 
         return out.reshape(shape)
 elif triton_available:
-    # IPEX should be faster for xpu, so at first checking if it is available.
     from ..triton import ops as triton_ops
 
     register_kernel("bitsandbytes::quantize_blockwise", "xpu")(triton_ops.quantize_blockwise)
@@ -64,4 +64,4 @@ def _(
     register_kernel("bitsandbytes::dequantize_4bit", "xpu")(triton_ops.dequantize_4bit)
     register_kernel("bitsandbytes::gemv_4bit", "xpu")(triton_ops.gemv_4bit)
 else:
-    warnings.warn("XPU available, but nor ipex or trtion package is found.")
+    warnings.warn("XPU available but no ipex or triton packages found.")