diff --git a/official/recommendation/ranking/data/data_pipeline_multi_hot.py b/official/recommendation/ranking/data/data_pipeline_multi_hot.py
index 959154fd8e7..feeb691dd29 100644
--- a/official/recommendation/ranking/data/data_pipeline_multi_hot.py
+++ b/official/recommendation/ranking/data/data_pipeline_multi_hot.py
@@ -23,190 +23,6 @@
 from official.recommendation.ranking.configs import config
 
 
-class CriteoTsvReaderMultiHot:
-  """Input reader callable for pre-processed Multi Hot Criteo data.
-
-  Raw Criteo data is assumed to be preprocessed in the following way:
-  1. Missing values are replaced with zeros.
-  2. Negative values are replaced with zeros.
-  3. Integer features are transformed by log(x+1) and are hence tf.float32.
-  4. Categorical data is bucketized and are hence tf.int32.
-  
-  Implements a TsvReaderMultiHot for reading data from a criteo dataset and 
-  generate multi hot synthetic data using the provided vocab_sizes and
-  multi_hot_sizes, also includes a complete synthetic data generator as well as 
-  a TFRecordReader to read data from pre materialized multi hot synthetic 
-  dataset that converted to TFRecords
-  """
-
-  def __init__(self,
-               file_pattern: str,
-               params: config.DataConfig,
-               num_dense_features: int,
-               vocab_sizes: List[int],
-               multi_hot_sizes: List[int],
-               use_synthetic_data: bool = False):
-    self._file_pattern = file_pattern
-    self._params = params
-    self._num_dense_features = num_dense_features
-    self._vocab_sizes = vocab_sizes
-    self._use_synthetic_data = use_synthetic_data
-    self._multi_hot_sizes = multi_hot_sizes
-
-  def __call__(self, ctx: tf.distribute.InputContext) -> tf.data.Dataset:
-    params = self._params
-    # Per replica batch size.
-    batch_size = ctx.get_per_replica_batch_size(
-        params.global_batch_size) if ctx else params.global_batch_size
-    if self._use_synthetic_data:
-      return self._generate_synthetic_data(ctx, batch_size)
-
-    @tf.function
-    def _parse_fn(example: tf.Tensor):
-      """Parser function for pre-processed Criteo TSV records."""
-      label_defaults = [[0.0]]
-      dense_defaults = [
-          [0.0] for _ in range(self._num_dense_features)
-      ]
-      num_sparse_features = len(self._vocab_sizes)
-      categorical_defaults = [
-          [0] for _ in range(num_sparse_features)
-      ]
-      record_defaults = label_defaults + dense_defaults + categorical_defaults
-      fields = tf.io.decode_csv(
-          example, record_defaults, field_delim='\t', na_value='-1')
-
-      num_labels = 1
-      label = tf.reshape(fields[0], [batch_size, 1])
-
-      features = {}
-      num_dense = len(dense_defaults)
-
-      dense_features = []
-      offset = num_labels
-      for idx in range(num_dense):
-        dense_features.append(fields[idx + offset])
-      features['dense_features'] = tf.stack(dense_features, axis=1)
-
-      offset += num_dense
-      features['sparse_features'] = {}
-
-      sparse_tensors = []
-      for idx, (vocab_size, multi_hot_size) in enumerate(
-          zip(self._vocab_sizes, self._multi_hot_sizes)
-      ):
-        sparse_tensor = tf.reshape(fields[idx + offset], [batch_size, 1])
-        sparse_tensor_synthetic = tf.random.uniform(
-            shape=(batch_size, multi_hot_size - 1),
-            maxval=int(vocab_size),
-            dtype=tf.int32,
-        )
-        sparse_tensors.append(
-            tf.sparse.from_dense(
-                tf.concat([sparse_tensor, sparse_tensor_synthetic], axis=1)
-            )
-        )
-
-      sparse_tensor_elements = {
-          str(i): sparse_tensors[i] for i in range(len(sparse_tensors))
-      }
-
-      features['sparse_features'] = sparse_tensor_elements
-
-      return features, label
-
-    filenames = tf.data.Dataset.list_files(self._file_pattern, shuffle=False)
-
-    # Shard the full dataset according to host number.
-    # Each host will get 1 / num_of_hosts portion of the data.
-    if params.sharding and ctx and ctx.num_input_pipelines > 1:
-      filenames = filenames.shard(ctx.num_input_pipelines,
-                                  ctx.input_pipeline_id)
-
-    num_shards_per_host = 1
-    if params.sharding:
-      num_shards_per_host = params.num_shards_per_host
-
-    def make_dataset(shard_index):
-      filenames_for_shard = filenames.shard(num_shards_per_host, shard_index)
-      dataset = tf.data.TextLineDataset(filenames_for_shard)
-      if params.is_training:
-        dataset = dataset.repeat()
-      dataset = dataset.batch(batch_size, drop_remainder=True)
-      dataset = dataset.map(_parse_fn,
-                            num_parallel_calls=tf.data.experimental.AUTOTUNE)
-      return dataset
-
-    indices = tf.data.Dataset.range(num_shards_per_host)
-    dataset = indices.interleave(
-        map_func=make_dataset,
-        cycle_length=params.cycle_length,
-        num_parallel_calls=tf.data.experimental.AUTOTUNE)
-
-    dataset = dataset.prefetch(tf.data.experimental.AUTOTUNE)
-
-    return dataset
-
-  def _generate_synthetic_data(self, ctx: tf.distribute.InputContext,
-                               batch_size: int) -> tf.data.Dataset:
-    """Creates synthetic data based on the parameter batch size.
-
-    Args:
-      ctx: Input Context
-      batch_size: per replica batch size.
-
-    Returns:
-      The synthetic dataset.
-    """
-    params = self._params
-    num_dense = self._num_dense_features
-    num_replicas = ctx.num_replicas_in_sync if ctx else 1
-
-    if params.is_training:
-      dataset_size = 50 * batch_size * num_replicas
-    else:
-      dataset_size = 50 * batch_size * num_replicas
-    dense_tensor = tf.random.uniform(
-        shape=(dataset_size, num_dense), maxval=1.0, dtype=tf.float32
-    )
-
-    sparse_tensors = []
-    for vocab_size, multi_hot_size in zip(
-        self._vocab_sizes, self._multi_hot_sizes
-    ):
-      sparse_tensors.append(
-          tf.sparse.from_dense(
-              tf.random.uniform(
-                  shape=(dataset_size, multi_hot_size),
-                  maxval=int(vocab_size),
-                  dtype=tf.int32,
-              )
-          )
-      )
-
-    sparse_tensor_elements = {
-        str(i): sparse_tensors[i] for i in range(len(sparse_tensors))
-    }
-
-    # the mean is in [0, 1] interval.
-    dense_tensor_mean = tf.math.reduce_mean(dense_tensor, axis=1)
-
-    # the label is in [0, 1] interval.
-    label_tensor = (dense_tensor_mean)
-    # Using the threshold 0.5 to convert to 0/1 labels.
-    label_tensor = tf.cast(label_tensor + 0.5, tf.int32)
-
-    input_elem = {'dense_features': dense_tensor,
-                  'sparse_features': sparse_tensor_elements}, label_tensor
-
-    dataset = tf.data.Dataset.from_tensor_slices(input_elem)
-    dataset = dataset.cache()
-    if params.is_training:
-      dataset = dataset.repeat()
-
-    return dataset.batch(batch_size, drop_remainder=True)
-
-
 class CriteoTFRecordReader(object):
   """Input reader fn for TFRecords that have been serialized in batched form."""
 
@@ -222,11 +38,12 @@ def __init__(self,
     self._vocab_sizes = vocab_sizes
     self._multi_hot_sizes = multi_hot_sizes
 
-    self.label_features = 'label'
-    self.dense_features = ['dense-feature-%d' % x for x in range(1, 14)]
-    self.sparse_features = ['sparse-feature-%d' % x for x in range(14, 40)]
+    self.label_features = 'clicked'
+    self.dense_features = ['int-feature-%d' % x for x in range(1, 14)]
+    self.sparse_features = ['categorical-feature-%d' % x for x in range(14, 40)]
 
   def __call__(self, ctx: tf.distribute.InputContext):
+    
     params = self._params
     # Per replica batch size.
     batch_size = (
@@ -237,17 +54,19 @@ def __call__(self, ctx: tf.distribute.InputContext):
 
     def _get_feature_spec():
       feature_spec = {}
+    
       feature_spec[self.label_features] = tf.io.FixedLenFeature(
-          [], dtype=tf.int64
+          [batch_size,], dtype=tf.int64
       )
+      
       for dense_feat in self.dense_features:
         feature_spec[dense_feat] = tf.io.FixedLenFeature(
-            [],
+            [batch_size,],
             dtype=tf.float32,
         )
-      for i, sparse_feat in enumerate(self.sparse_features):
+      for sparse_feat in self.sparse_features:
         feature_spec[sparse_feat] = tf.io.FixedLenFeature(
-            [self._multi_hot_sizes[i]], dtype=tf.int64
+            [batch_size,], dtype=tf.string
         )
       return feature_spec
 
@@ -258,91 +77,65 @@ def _parse_fn(serialized_example):
       )
       label = parsed_features[self.label_features]
       features = {}
+      features['clicked'] = tf.reshape(label, [batch_size,])
       int_features = []
       for dense_ft in self.dense_features:
-        int_features.append(parsed_features[dense_ft])
-      features['dense_features'] = tf.stack(int_features)
-
+        cur_feature = tf.reshape(parsed_features[dense_ft], [batch_size, 1])
+        int_features.append(cur_feature)
+      features['dense_features'] = tf.concat(int_features, axis=-1)
       features['sparse_features'] = {}
+
       for i, sparse_ft in enumerate(self.sparse_features):
-        features['sparse_features'][str(i)] = tf.sparse.from_dense(
-            parsed_features[sparse_ft]
+        cat_ft_int64 = tf.io.decode_raw(parsed_features[sparse_ft], tf.int64)
+        cat_ft_int64 = tf.reshape(
+            cat_ft_int64, [batch_size, self._multi_hot_sizes[i]]
         )
+        features['sparse_features'][str(i)] = tf.sparse.from_dense(cat_ft_int64)
 
-      return features, label
-
-    filenames = tf.data.Dataset.list_files(self._file_pattern, shuffle=False)
-    # Shard the full dataset according to host number.
-    # Each host will get 1 / num_of_hosts portion of the data.
-    if params.sharding and ctx and ctx.num_input_pipelines > 1:
-      filenames = filenames.shard(ctx.num_input_pipelines,
-                                  ctx.input_pipeline_id)
-
-    num_shards_per_host = 1
-    if params.sharding:
-      num_shards_per_host = params.num_shards_per_host
+      return features
 
-    def make_dataset(shard_index):
-      filenames_for_shard = filenames.shard(num_shards_per_host, shard_index)
-      dataset = tf.data.TFRecordDataset(
-          filenames_for_shard
-      )
-      if params.is_training:
-        dataset = dataset.repeat()
-      dataset = dataset.map(
-          _parse_fn, num_parallel_calls=tf.data.experimental.AUTOTUNE
-      )
-      return dataset
+    dataset = tf.data.Dataset.list_files(self._file_pattern, shuffle=False)
+    self._num_files = len(dataset)
+    self._num_input_pipelines = ctx.num_input_pipelines
+    self._input_pipeline_id = ctx.input_pipeline_id
+    self._parallelism = min(self._num_files/self._num_input_pipelines, 8)
+    
+    dataset = dataset.shard(self._num_input_pipelines,
+                              self._input_pipeline_id)
 
-    indices = tf.data.Dataset.range(num_shards_per_host)
-    dataset = indices.interleave(
-        map_func=make_dataset,
-        cycle_length=params.cycle_length,
-        num_parallel_calls=tf.data.experimental.AUTOTUNE,
+    if params.is_training:
+      dataset = dataset.shuffle(self._parallelism)
+      dataset = dataset.repeat()
+    
+    dataset = tf.data.TFRecordDataset(
+        dataset,
+        buffer_size=64 * 1024 * 1024,
+        num_parallel_reads=self._parallelism,
     )
+    dataset = dataset.map(_parse_fn, num_parallel_calls=self._parallelism)
+    dataset = dataset.shuffle(256)
+
+    if not params.is_training:
+      num_eval_samples = 89137319
+      num_dataset_batches = params.global_batch_size/self._num_input_pipelines
+
+      def _mark_as_padding(features):
+        """Padding will be denoted with a label value of -1."""
+        features['clicked'] = -1 * tf.ones(
+            [
+                batch_size,
+            ],
+            dtype=tf.int64,
+        )
+        return features
 
-    dataset = dataset.batch(
-        batch_size,
-        drop_remainder=True,
-        num_parallel_calls=tf.data.experimental.AUTOTUNE,
-    )
-    dataset = dataset.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
+      # 100 steps worth of padding.
+      padding_ds = dataset.take(1) # If we're running 1 input pipeline per chip
+      padding_ds = padding_ds.map(_mark_as_padding).repeat(1000)
+      dataset = dataset.concatenate(padding_ds).take(660)
 
+    dataset = dataset.prefetch(buffer_size=16)
+    options = tf.data.Options()
+    options.threading.private_threadpool_size = 48
+    dataset = dataset.with_options(options)
     return dataset
-
-
-def train_input_fn(params: config.Task) -> CriteoTsvReaderMultiHot:
-  """Returns callable object of batched training examples.
-
-  Args:
-    params: hyperparams to create input pipelines.
-
-  Returns:
-    CriteoTsvReader callable for training dataset.
-  """
-  return CriteoTsvReaderMultiHot(
-      file_pattern=params.train_data.input_path,
-      params=params.train_data,
-      vocab_sizes=params.model.vocab_sizes,
-      num_dense_features=params.model.num_dense_features,
-      multi_hot_sizes=params.model.multi_hot_sizes,
-      use_synthetic_data=params.use_synthetic_data)
-
-
-def eval_input_fn(params: config.Task) -> CriteoTsvReaderMultiHot:
-  """Returns callable object of batched eval examples.
-
-  Args:
-    params: hyperparams to create input pipelines.
-
-  Returns:
-    CriteoTsvReader callable for eval dataset.
-  """
-
-  return CriteoTsvReaderMultiHot(
-      file_pattern=params.validation_data.input_path,
-      params=params.validation_data,
-      vocab_sizes=params.model.vocab_sizes,
-      num_dense_features=params.model.num_dense_features,
-      multi_hot_sizes=params.model.multi_hot_sizes,
-      use_synthetic_data=params.use_synthetic_data)
diff --git a/official/recommendation/ranking/task.py b/official/recommendation/ranking/task.py
index 3f34ac64bc1..9dc40fb5336 100644
--- a/official/recommendation/ranking/task.py
+++ b/official/recommendation/ranking/task.py
@@ -67,9 +67,9 @@ def _get_tpu_embedding_feature_config(
     table_config = tf.tpu.experimental.embedding.TableConfig(
         vocabulary_size=vocab_size,
         dim=embedding_dim[i],
-        combiner='mean',
-        initializer=tf.initializers.TruncatedNormal(
-            mean=0.0, stddev=1 / math.sqrt(embedding_dim[i])),
+        combiner='sum',
+        initializer=tf.initializers.RandomUniform(
+            minval= - 1.0 / math.sqrt(vocab_size), maxval = 1.0 / math.sqrt(vocab_size)),
         name=table_name_prefix + '_%02d' % i)
     feature_config[str(i)] = tf.tpu.experimental.embedding.FeatureConfig(
         name=str(i),
@@ -149,29 +149,17 @@ def build_model(self) -> tf_keras.Model:
       A Ranking model instance.
     """
     lr_config = self.optimizer_config.lr_config
-    lr_callable = common.WarmUpAndPolyDecay(
-        batch_size=self.task_config.train_data.global_batch_size,
-        decay_exp=lr_config.decay_exp,
+    embedding_optimizer = tf.keras.optimizers.legacy.Adagrad(
         learning_rate=lr_config.learning_rate,
-        warmup_steps=lr_config.warmup_steps,
-        decay_steps=lr_config.decay_steps,
-        decay_start_steps=lr_config.decay_start_steps)
-    embedding_optimizer = tf_keras.optimizers.get(
-        self.optimizer_config.embedding_optimizer, use_legacy_optimizer=True)
-    embedding_optimizer.learning_rate = lr_callable
-
-    dense_optimizer = tf_keras.optimizers.get(
-        self.optimizer_config.dense_optimizer, use_legacy_optimizer=True)
-    if self.optimizer_config.dense_optimizer == 'SGD':
-      dense_lr_config = self.optimizer_config.dense_sgd_config
-      dense_lr_callable = common.WarmUpAndPolyDecay(
-          batch_size=self.task_config.train_data.global_batch_size,
-          decay_exp=dense_lr_config.decay_exp,
-          learning_rate=dense_lr_config.learning_rate,
-          warmup_steps=dense_lr_config.warmup_steps,
-          decay_steps=dense_lr_config.decay_steps,
-          decay_start_steps=dense_lr_config.decay_start_steps)
-      dense_optimizer.learning_rate = dense_lr_callable
+        initial_accumulator_value=self.optimizer_config.initial_accumulator_value,
+        epsilon=self.optimizer_config.epsilon,
+    )
+
+    dense_optimizer = tf.keras.optimizers.legacy.Adagrad(
+        learning_rate=lr_config.learning_rate,
+        initial_accumulator_value=self.optimizer_config.initial_accumulator_value,
+        epsilon=self.optimizer_config.epsilon,
+    )
 
     feature_config = _get_tpu_embedding_feature_config(
         embedding_dim=self.task_config.model.embedding_dim,
@@ -208,9 +196,6 @@ def build_model(self) -> tf_keras.Model:
           tfrs.layers.feature_interaction.MultiLayerDCN(
               projection_dim=self.task_config.model.dcn_low_rank_dim,
               num_layers=self.task_config.model.dcn_num_layers,
-              use_bias=self.task_config.model.dcn_use_bias,
-              kernel_initializer=self.task_config.model.dcn_kernel_initializer,
-              bias_initializer=self.task_config.model.dcn_bias_initializer,
           ),
       ])
     else:
@@ -226,7 +211,7 @@ def build_model(self) -> tf_keras.Model:
         ),
         feature_interaction=feature_interaction,
         top_stack=tfrs.layers.blocks.MLP(
-            units=self.task_config.model.top_mlp, final_activation='sigmoid'
+            units=self.task_config.model.top_mlp
         ),
         concat_dense=self.task_config.model.concat_dense,
     )
diff --git a/official/recommendation/ranking/train.py b/official/recommendation/ranking/train.py
index 6486e1dc82b..a0e43cb4ce7 100644
--- a/official/recommendation/ranking/train.py
+++ b/official/recommendation/ranking/train.py
@@ -60,6 +60,8 @@ def train_loop_end(self) -> Dict[str, float]:
 def main(_) -> None:
   """Train and evaluate the Ranking model."""
   params = train_utils.parse_configuration(FLAGS)
+  if params.runtime.mixed_precision_dtype:
+    tf.keras.mixed_precision.set_global_policy(params.runtime.mixed_precision_dtype)
   mode = FLAGS.mode
   model_dir = FLAGS.model_dir
   if 'train' in FLAGS.mode:
@@ -67,10 +69,6 @@ def main(_) -> None:
     # may race against the train job for writing the same file.
     train_utils.serialize_config(params, model_dir)
 
-  if FLAGS.seed is not None:
-    logging.info('Setting tf seed.')
-    tf.random.set_seed(FLAGS.seed)
-
   task = RankingTask(
       params=params.task,
       trainer_config=params.trainer,
diff --git a/orbit/standard_runner.py b/orbit/standard_runner.py
index 338abc5799d..72ef3f4dbad 100644
--- a/orbit/standard_runner.py
+++ b/orbit/standard_runner.py
@@ -326,6 +326,8 @@ def evaluate(self, num_steps: tf.Tensor) -> Optional[runner.Output]:
                        "`options.use_tf_while_loop` is `True`")
 
     outputs = self.eval_begin()  # pylint: disable=assignment-from-no-return
+    outputs = [tf.zeros([0, 2112,], dtype=tf.int64),
+               tf.zeros([0 ,2112,], dtype=tf.bfloat16)]
 
     has_state = outputs is not None
     if self._eval_loop_fn is None: