From 44d0345b3b4d0e56c05df58cb632595276cb05a2 Mon Sep 17 00:00:00 2001
From: Tim Jenness <tjenness@lsst.org>
Date: Wed, 19 Jul 2023 11:57:24 -0700
Subject: [PATCH] Use model_construct in direct methods

If the BaseModel.construct() method is slow we can still
reimplement it as was done in the individual direct() methods
but with the direct() methods still being much simpler.
---
 python/lsst/daf/butler/_quantum_backed.py     | 50 +++++-----------
 python/lsst/daf/butler/core/datasets/ref.py   | 28 +++------
 python/lsst/daf/butler/core/datasets/type.py  | 30 +++-------
 .../daf/butler/core/datastoreRecordData.py    | 17 ++----
 .../daf/butler/core/dimensions/_coordinate.py | 11 +---
 .../lsst/daf/butler/core/dimensions/_graph.py | 10 +---
 .../daf/butler/core/dimensions/_records.py    | 10 +---
 python/lsst/daf/butler/core/quantum.py        | 58 ++++---------------
 8 files changed, 52 insertions(+), 162 deletions(-)

diff --git a/python/lsst/daf/butler/_quantum_backed.py b/python/lsst/daf/butler/_quantum_backed.py
index fcd8279628..a7f143d2a3 100644
--- a/python/lsst/daf/butler/_quantum_backed.py
+++ b/python/lsst/daf/butler/_quantum_backed.py
@@ -31,7 +31,7 @@
 from typing import TYPE_CHECKING, Any
 
 from deprecated.sphinx import deprecated
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from lsst.resources import ResourcePathExpression
 
 from ._butlerConfig import ButlerConfig
@@ -745,40 +745,16 @@ def _to_uuid_set(uuids: Iterable[str | uuid.UUID]) -> set[uuid.UUID]:
             """
             return {uuid.UUID(id) if isinstance(id, str) else id for id in uuids}
 
-        if PYDANTIC_V2:
-            data = cls.model_construct(
-                _fields_set={
-                    "predicted_inputs",
-                    "available_inputs",
-                    "actual_inputs",
-                    "predicted_outputs",
-                    "actual_outputs",
-                    "datastore_records",
-                },
-                predicted_inputs=_to_uuid_set(predicted_inputs),
-                available_inputs=_to_uuid_set(available_inputs),
-                actual_inputs=_to_uuid_set(actual_inputs),
-                predicted_outputs=_to_uuid_set(predicted_outputs),
-                actual_outputs=_to_uuid_set(actual_outputs),
-                datastore_records={
-                    key: SerializedDatastoreRecordData.direct(**records)
-                    for key, records in datastore_records.items()
-                },
-            )
-        else:
-            data = QuantumProvenanceData.__new__(cls)
-            setter = object.__setattr__
-            setter(data, "predicted_inputs", _to_uuid_set(predicted_inputs))
-            setter(data, "available_inputs", _to_uuid_set(available_inputs))
-            setter(data, "actual_inputs", _to_uuid_set(actual_inputs))
-            setter(data, "predicted_outputs", _to_uuid_set(predicted_outputs))
-            setter(data, "actual_outputs", _to_uuid_set(actual_outputs))
-            setter(
-                data,
-                "datastore_records",
-                {
-                    key: SerializedDatastoreRecordData.direct(**records)
-                    for key, records in datastore_records.items()
-                },
-            )
+        data = cls.model_construct(
+            predicted_inputs=_to_uuid_set(predicted_inputs),
+            available_inputs=_to_uuid_set(available_inputs),
+            actual_inputs=_to_uuid_set(actual_inputs),
+            predicted_outputs=_to_uuid_set(predicted_outputs),
+            actual_outputs=_to_uuid_set(actual_outputs),
+            datastore_records={
+                key: SerializedDatastoreRecordData.direct(**records)
+                for key, records in datastore_records.items()
+            },
+        )
+
         return data
diff --git a/python/lsst/daf/butler/core/datasets/ref.py b/python/lsst/daf/butler/core/datasets/ref.py
index 93ed396edb..49af583d5b 100644
--- a/python/lsst/daf/butler/core/datasets/ref.py
+++ b/python/lsst/daf/butler/core/datasets/ref.py
@@ -35,7 +35,7 @@
 from collections.abc import Iterable
 from typing import TYPE_CHECKING, Any, ClassVar, Protocol, TypeAlias, runtime_checkable
 
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from lsst.utils.classes import immutable
 from pydantic import StrictStr, validator
 
@@ -226,24 +226,14 @@ def direct(
         )
         serialized_dataId = SerializedDataCoordinate.direct(**dataId) if dataId is not None else None
 
-        if PYDANTIC_V2:
-            node = cls.model_construct(
-                _fields_set=_serializedDatasetRefFieldsSet,
-                id=uuid.UUID(id),
-                datasetType=serialized_datasetType,
-                dataId=serialized_dataId,
-                run=sys.intern(run),
-                component=component,
-            )
-        else:
-            node = SerializedDatasetRef.__new__(cls)
-            setter = object.__setattr__
-            setter(node, "id", uuid.UUID(id))
-            setter(node, "datasetType", serialized_datasetType)
-            setter(node, "dataId", serialized_dataId)
-            setter(node, "run", sys.intern(run))
-            setter(node, "component", component)
-            setter(node, "__fields_set__", _serializedDatasetRefFieldsSet)
+        node = cls.model_construct(
+            _fields_set=_serializedDatasetRefFieldsSet,
+            id=uuid.UUID(id),
+            datasetType=serialized_datasetType,
+            dataId=serialized_dataId,
+            run=sys.intern(run),
+            component=component,
+        )
 
         return node
 
diff --git a/python/lsst/daf/butler/core/datasets/type.py b/python/lsst/daf/butler/core/datasets/type.py
index 55b3885366..080df18c8b 100644
--- a/python/lsst/daf/butler/core/datasets/type.py
+++ b/python/lsst/daf/butler/core/datasets/type.py
@@ -29,7 +29,7 @@
 from types import MappingProxyType
 from typing import TYPE_CHECKING, Any, ClassVar
 
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from pydantic import StrictBool, StrictStr
 
 from ..configSupport import LookupKey
@@ -85,27 +85,13 @@ def direct(
             SerializedDimensionGraph.direct(**dimensions) if dimensions is not None else None
         )
 
-        if PYDANTIC_V2:
-            node = cls.model_construct(
-                name=name,
-                storageClass=storageClass,
-                dimensions=serialized_dimensions,
-                parentStorageClass=parentStorageClass,
-                isCalibration=isCalibration,
-            )
-        else:
-            node = SerializedDatasetType.__new__(cls)
-            setter = object.__setattr__
-            setter(node, "name", name)
-            setter(node, "storageClass", storageClass)
-            setter(node, "dimensions", serialized_dimensions)
-            setter(node, "parentStorageClass", parentStorageClass)
-            setter(node, "isCalibration", isCalibration)
-            setter(
-                node,
-                "__fields_set__",
-                {"name", "storageClass", "dimensions", "parentStorageClass", "isCalibration"},
-            )
+        node = cls.model_construct(
+            name=name,
+            storageClass=storageClass,
+            dimensions=serialized_dimensions,
+            parentStorageClass=parentStorageClass,
+            isCalibration=isCalibration,
+        )
 
         if cache is not None:
             cache[key] = node
diff --git a/python/lsst/daf/butler/core/datastoreRecordData.py b/python/lsst/daf/butler/core/datastoreRecordData.py
index 6a077b3a4e..93ae3667b2 100644
--- a/python/lsst/daf/butler/core/datastoreRecordData.py
+++ b/python/lsst/daf/butler/core/datastoreRecordData.py
@@ -86,18 +86,13 @@ def direct(
                     if (id := record.get("dataset_id")) is not None:
                         record["dataset_id"] = uuid.UUID(id) if isinstance(id, str) else id
 
-        if PYDANTIC_V2:
-            data = cls.model_construct(
-                _fields_set={"dataset_ids", "records"},
-                dataset_ids=[uuid.UUID(id) if isinstance(id, str) else id for id in dataset_ids],
-                records=records,
-            )
-        else:
-            data = SerializedDatastoreRecordData.__new__(cls)
-            setter = object.__setattr__
+        data = cls.model_construct(
+            _fields_set={"dataset_ids", "records"},
             # JSON makes strings out of UUIDs, need to convert them back
-            setter(data, "dataset_ids", [uuid.UUID(id) if isinstance(id, str) else id for id in dataset_ids])
-            setter(data, "records", records)
+            dataset_ids=[uuid.UUID(id) if isinstance(id, str) else id for id in dataset_ids],
+            records=records,
+        )
+
         return data
 
 
diff --git a/python/lsst/daf/butler/core/dimensions/_coordinate.py b/python/lsst/daf/butler/core/dimensions/_coordinate.py
index e1bef8d50e..e914dfe085 100644
--- a/python/lsst/daf/butler/core/dimensions/_coordinate.py
+++ b/python/lsst/daf/butler/core/dimensions/_coordinate.py
@@ -34,7 +34,7 @@
 from typing import TYPE_CHECKING, Any, ClassVar, Literal, overload
 
 from deprecated.sphinx import deprecated
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from lsst.sphgeom import IntersectionRegion, Region
 
 from ..json import from_json_pydantic, to_json_pydantic
@@ -89,14 +89,7 @@ def direct(
         else:
             serialized_records = {k: SerializedDimensionRecord.direct(**v) for k, v in records.items()}
 
-        if PYDANTIC_V2:
-            node = cls.model_construct(dataId=dataId, records=serialized_records)
-        else:
-            node = SerializedDataCoordinate.__new__(cls)
-            setter = object.__setattr__
-            setter(node, "dataId", dataId)
-            setter(node, "records", serialized_records)
-            setter(node, "__fields_set__", {"dataId", "records"})
+        node = cls.model_construct(dataId=dataId, records=serialized_records)
 
         if cache is not None:
             cache[key] = node
diff --git a/python/lsst/daf/butler/core/dimensions/_graph.py b/python/lsst/daf/butler/core/dimensions/_graph.py
index a03c28a6ab..e00b4e1a2a 100644
--- a/python/lsst/daf/butler/core/dimensions/_graph.py
+++ b/python/lsst/daf/butler/core/dimensions/_graph.py
@@ -28,7 +28,7 @@
 from types import MappingProxyType
 from typing import TYPE_CHECKING, Any, ClassVar
 
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from lsst.utils.classes import cached_getter, immutable
 
 from .._topology import TopologicalFamily, TopologicalSpace
@@ -57,13 +57,7 @@ def direct(cls, *, names: list[str]) -> SerializedDimensionGraph:
 
         This method should only be called when the inputs are trusted.
         """
-        if PYDANTIC_V2:
-            return cls.model_construct(names=names)
-        else:
-            node = SerializedDimensionGraph.__new__(cls)
-            object.__setattr__(node, "names", names)
-            object.__setattr__(node, "__fields_set__", {"names"})
-            return node
+        return cls.model_construct(names=names)
 
 
 @immutable
diff --git a/python/lsst/daf/butler/core/dimensions/_records.py b/python/lsst/daf/butler/core/dimensions/_records.py
index 1cc8dea6e3..882ef5938d 100644
--- a/python/lsst/daf/butler/core/dimensions/_records.py
+++ b/python/lsst/daf/butler/core/dimensions/_records.py
@@ -186,15 +186,7 @@ def direct(
         # transform to tuples
         serialized_record = {k: v if type(v) != list else tuple(v) for k, v in record.items()}  # type: ignore
 
-        if PYDANTIC_V2:
-            node = cls.model_construct(definition=definition, record=serialized_record)  # type: ignore
-        else:
-            node = SerializedDimensionRecord.__new__(cls)
-            setter = object.__setattr__
-            setter(node, "definition", definition)
-            setter(node, "record", serialized_record)
-
-            setter(node, "__fields_set__", {"definition", "record"})
+        node = cls.model_construct(definition=definition, record=serialized_record)  # type: ignore
 
         if cache is not None:
             cache[key] = node
diff --git a/python/lsst/daf/butler/core/quantum.py b/python/lsst/daf/butler/core/quantum.py
index 925dbc4d9a..21344f7ddd 100644
--- a/python/lsst/daf/butler/core/quantum.py
+++ b/python/lsst/daf/butler/core/quantum.py
@@ -28,7 +28,7 @@
 from collections.abc import Iterable, Mapping, MutableMapping, Sequence
 from typing import Any
 
-from lsst.daf.butler._compat import PYDANTIC_V2, _BaseModelCompat
+from lsst.daf.butler._compat import _BaseModelCompat
 from lsst.utils import doImportType
 from lsst.utils.introspection import find_outside_stacklevel
 
@@ -126,52 +126,16 @@ def direct(
             else None
         )
 
-        if PYDANTIC_V2:
-            node = cls.model_construct(
-                _fields_set={
-                    "taskName",
-                    "dataId",
-                    "datasetTypeMapping",
-                    "initInputs",
-                    "inputs",
-                    "outputs",
-                    "dimensionRecords",
-                    "datastoreRecords",
-                },
-                taskName=sys.intern(taskName or ""),
-                dataId=serialized_dataId,
-                datasetTypeMapping=serialized_datasetTypeMapping,
-                initInputs=serialized_initInputs,
-                inputs=serialized_inputs,
-                outputs=serialized_outputs,
-                dimensionRecords=serialized_records,
-                datastoreRecords=serialized_datastore_records,
-            )
-        else:
-            node = SerializedQuantum.__new__(cls)
-            setter = object.__setattr__
-            setter(node, "taskName", sys.intern(taskName or ""))
-            setter(node, "dataId", serialized_dataId)
-            setter(node, "datasetTypeMapping", serialized_datasetTypeMapping)
-            setter(node, "initInputs", serialized_initInputs)
-            setter(node, "inputs", serialized_inputs)
-            setter(node, "outputs", serialized_outputs)
-            setter(node, "dimensionRecords", serialized_records)
-            setter(node, "datastoreRecords", serialized_datastore_records)
-            setter(
-                node,
-                "__fields_set__",
-                {
-                    "taskName",
-                    "dataId",
-                    "datasetTypeMapping",
-                    "initInputs",
-                    "inputs",
-                    "outputs",
-                    "dimensionRecords",
-                    "datastoreRecords",
-                },
-            )
+        node = cls.model_construct(
+            taskName=sys.intern(taskName or ""),
+            dataId=serialized_dataId,
+            datasetTypeMapping=serialized_datasetTypeMapping,
+            initInputs=serialized_initInputs,
+            inputs=serialized_inputs,
+            outputs=serialized_outputs,
+            dimensionRecords=serialized_records,
+            datastoreRecords=serialized_datastore_records,
+        )
 
         return node