add calibration metrics to stats

MannLabs · Nov 10, 2024 · eaf38cd · eaf38cd
1 parent 4f5afa3
commit eaf38cd
Show file tree

Hide file tree

Showing 3 changed files with 73 additions and 15 deletions.
diff --git a/alphadia/calibration/property.py b/alphadia/calibration/property.py
@@ -75,6 +75,7 @@ def __init__(
             float(transform_deviation) if transform_deviation is not None else None
         )
         self.is_fitted = False
+        self.metrics = None
 
     def __repr__(self) -> str:
         return f"<Calibration {self.name}, is_fitted: {self.is_fitted}>"
@@ -175,7 +176,9 @@ def fit(self, dataframe: pd.DataFrame, plot: bool = False, **kwargs):
             logging.error(f"Could not fit estimator {self.name}: {e}")
             return
 
-        if plot is True:
+        self._save_metrics(dataframe)
+
+        if plot:
             self.plot(dataframe, **kwargs)
 
     def predict(self, dataframe, inplace=True):
@@ -297,6 +300,13 @@ def deviation(self, dataframe: pd.DataFrame):
             axis=1,
         )
 
+    def _save_metrics(self, dataframe):
+        deviation = self.deviation(dataframe)
+        self.metrics = {
+            "median_accuracy": np.median(np.abs(deviation[:, 1])),
+            "median_precision": np.median(np.abs(deviation[:, 2])),
+        }
+
     def ci(self, dataframe, ci: float = 0.95):
         """Calculate the residual deviation at the given confidence interval.
 

diff --git a/alphadia/outputtransform.py b/alphadia/outputtransform.py
@@ -942,6 +942,10 @@ def _build_run_stat_df(
         folder, peptidecentric.PeptideCentricWorkflow.OPTIMIZATION_MANAGER_PATH
     )
 
+    calibration_manager_path = os.path.join(
+        folder, peptidecentric.PeptideCentricWorkflow.CALIBRATION_MANAGER_PATH
+    )
+
     if channels is None:
         channels = [0]
     out_df = []
@@ -956,31 +960,69 @@ def _build_run_stat_df(
             "proteins": channel_df["pg"].nunique(),
         }
 
-        if "weighted_mass_error" in channel_df.columns:
-            base_dict["ms1_accuracy"] = np.mean(channel_df["weighted_mass_error"])
-
         if "cycle_fwhm" in channel_df.columns:
             base_dict["fwhm_rt"] = np.mean(channel_df["cycle_fwhm"])
 
         if "mobility_fwhm" in channel_df.columns:
             base_dict["fwhm_mobility"] = np.mean(channel_df["mobility_fwhm"])
 
+        # collect optimization stats
+        base_dict["optimization.ms2_error"] = np.nan
+        base_dict["optimization.ms1_error"] = np.nan
+        base_dict["optimization.rt_error"] = np.nan
+        base_dict["optimization.mobility_error"] = np.nan
+
         if os.path.exists(optimization_manager_path):
             optimization_manager = manager.OptimizationManager(
                 path=optimization_manager_path
             )
-
-            base_dict["ms2_error"] = optimization_manager.ms2_error
-            base_dict["ms1_error"] = optimization_manager.ms1_error
-            base_dict["rt_error"] = optimization_manager.rt_error
-            base_dict["mobility_error"] = optimization_manager.mobility_error
+            base_dict["optimization.ms2_error"] = optimization_manager.ms2_error
+            base_dict["optimization.ms1_error"] = optimization_manager.ms1_error
+            base_dict["optimization.rt_error"] = optimization_manager.rt_error
+            base_dict["optimization.mobility_error"] = (
+                optimization_manager.mobility_error
+            )
 
         else:
             logger.warning(f"Error reading optimization manager for {raw_name}")
-            base_dict["ms2_error"] = np.nan
-            base_dict["ms1_error"] = np.nan
-            base_dict["rt_error"] = np.nan
-            base_dict["mobility_error"] = np.nan
+
+        # collect calibration stats
+        base_dict["calibration.ms2_median_accuracy"] = np.nan
+        base_dict["calibration.ms2_median_precision"] = np.nan
+        base_dict["calibration.ms1_median_accuracy"] = np.nan
+        base_dict["calibration.ms1_median_precision"] = np.nan
+
+        if os.path.exists(calibration_manager_path):
+            calibration_manager = manager.CalibrationManager(
+                path=calibration_manager_path
+            )
+
+            if (
+                fragment_mz_estimator := calibration_manager.get_estimator(
+                    "fragment", "mz"
+                )
+            ) and (fragment_mz_metrics := fragment_mz_estimator.metrics):
+                base_dict["calibration.ms2_median_accuracy"] = fragment_mz_metrics[
+                    "median_accuracy"
+                ]
+                base_dict["calibration.ms2_median_precision"] = fragment_mz_metrics[
+                    "median_precision"
+                ]
+
+            if (
+                precursor_mz_estimator := calibration_manager.get_estimator(
+                    "precursor", "mz"
+                )
+            ) and (precursor_mz_metrics := precursor_mz_estimator.metrics):
+                base_dict["calibration.ms1_median_accuracy"] = precursor_mz_metrics[
+                    "median_accuracy"
+                ]
+                base_dict["calibration.ms1_median_precision"] = precursor_mz_metrics[
+                    "median_precision"
+                ]
+
+        else:
+            logger.warning(f"Error reading calibration manager for {raw_name}")
 
         out_df.append(base_dict)
 

diff --git a/alphadia/workflow/manager.py b/alphadia/workflow/manager.py
@@ -2,6 +2,7 @@
 import logging
 import os
 import pickle
+import traceback
 import typing
 from collections import defaultdict
 from copy import deepcopy
@@ -82,11 +83,16 @@ def save(self):
             try:
                 with open(self.path, "wb") as f:
                     pickle.dump(self, f)
-            except Exception:
+            except Exception as e:
                 self.reporter.log_string(
-                    f"Failed to save {self.__class__.__name__} to {self.path}",
+                    f"Failed to save {self.__class__.__name__} to {self.path}: {str(e)}",
                     verbosity="error",
                 )
+                # Log the full traceback
+
+                self.reporter.log_string(
+                    f"Traceback: {traceback.format_exc()}", verbosity="error"
+                )
 
     def load(self):
         """Load the state from pickle file."""