intel-analytics · qiuxin2012 · Jul 31, 2019 · May 15, 2019 · May 17, 2019 · May 20, 2019
diff --git a/zoo/src/main/scala/com/intel/analytics/zoo/common/ZooTrigger.scala b/zoo/src/main/scala/com/intel/analytics/zoo/common/ZooTrigger.scala
@@ -0,0 +1,147 @@
+package com.intel.analytics.zoo.common
+
+import com.intel.analytics.bigdl.optim.Trigger
+import com.intel.analytics.bigdl.utils.{T, Table}
+
+/**
+ * A trigger specifies a timespot or several timespots during training,
+ * and a corresponding action will be taken when the timespot(s)
+ * is reached.
+ */
+trait ZooTrigger extends Trigger {
+  protected var zooState: Table = T()
+
+  /**
+   * We also hold some training metrics to control trigger.
+   * @param zooState zoo state table
+   */
+  private[zoo] def setZooState(zooState: Table): Unit = {
+    this.zooState = zooState
+  }
+}
+
+/**
+ * A trigger that triggers an action when each epoch finishs.
+ * Could be used as trigger in setValidation and setCheckpoint
+ * in Optimizer, and also in TrainSummary.setSummaryTrigger.
+ */
+case class EveryEpoch() extends ZooTrigger{
+  private var lastEpoch = -1
+
+  override def apply(state: Table): Boolean = {
+    if (lastEpoch == -1) {
+      lastEpoch = state[Int]("epoch")
+      false
+    } else {
+      if (state[Int]("epoch") <= lastEpoch) {
+        false
+      } else {
+        if (zooState.contains("numSlice") && zooState.contains("currentSlice")
+          && zooState[Int]("currentSlice") % zooState[Int]("numSlice") == 0) {
+          lastEpoch = state[Int]("epoch")
+          true
+        } else {
+          false
+        }
+      }
+    }
+  }
+}
+/**
+ * A trigger that triggers an action every "n" iterations.
+ * Could be used as trigger in setValidation and setCheckpoint
+ * in Optimizer, and also in TrainSummary.setSummaryTrigger.
+ *
+ * @param interval - trigger interval "n"
+ */
+case class SeveralIteration(interval: Int) extends ZooTrigger{
+  override def apply(state: Table): Boolean = {
+    val curIteration = state[Int]("neval") - 1
+    curIteration != 0 && curIteration % interval == 0
+  }
+}
+
+/**
+ * A trigger that triggers an action when training reaches
+ * the number of epochs specified by "max".
+ * Usually used in Optimizer.setEndWhen.
+ *
+ * @param max the epoch when the action takes place
+ */
+case class MaxEpoch(max: Int) extends ZooTrigger{
+  override def apply(state: Table): Boolean = {
+    state[Int]("epoch") > max
+  }
+}
+
+/**
+ * A trigger that triggers an action when training reaches
+ * the number of iterations specified by "max".
+ * Usually used in Optimizer.setEndWhen.
+ *
+ * @param max the iteration when the action takes place
+ *
+ */
+case class MaxIteration(max: Int) extends ZooTrigger {
+  override def apply(state: Table): Boolean = {
+    state[Int]("neval") > max
+  }
+}
+
+/**
+ * A trigger that triggers an action when validation score larger than "max" score
+ * @param max max score
+ */
+case class MaxScore(max: Float) extends ZooTrigger {
+  override def apply(state: Table): Boolean = {
+    state[Float]("score") > max
+  }
+}
+
+/**
+ * A trigger that triggers an action when training loss less than "min" loss
+ * @param min min loss
+ */
+case class MinLoss(min: Float) extends ZooTrigger {
+  override def apply(state: Table): Boolean = {
+    state[Float]("Loss") < min
+  }
+}
+
+/**
+ * A trigger contains other triggers and triggers when all of them trigger (logical AND)
+ * @param first first trigger
+ * @param others others triggers
+ */
+case class And(first : ZooTrigger, others : ZooTrigger*) extends ZooTrigger {
+  override def setZooState(zooState: Table): Unit = {
+    super.setZooState(zooState)
+    first.setZooState(zooState)
+    others.foreach{zt =>
+      zt.setZooState(zooState)
+    }
+  }
+
+  override def apply(state: Table): Boolean = {
+    first.apply(state) && others.forall(_.apply(state))
+  }
+}
+
+/**
+ * A trigger contains other triggers and triggers when any of them trigger (logical OR)
+ * @param first first trigger
+ * @param others others triggers
+ */
+case class Or(first : ZooTrigger, others : ZooTrigger*) extends ZooTrigger {
+  override def setZooState(zooState: Table): Unit = {
+    super.setZooState(zooState)
+    first.setZooState(zooState)
+    others.foreach{zt =>
+      zt.setZooState(zooState)
+    }
+  }
+
+  override def apply(state: Table): Boolean = {
+    first.apply(state) || others.exists(_.apply(state))
+  }
+}
diff --git a/zoo/src/main/scala/com/intel/analytics/zoo/examples/inception/ImageNet2012.scala b/zoo/src/main/scala/com/intel/analytics/zoo/examples/inception/ImageNet2012.scala
@@ -19,14 +19,13 @@ package com.intel.analytics.zoo.examples.inception
 import java.nio.ByteBuffer
 
 import com.intel.analytics.bigdl.dataset._
-import com.intel.analytics.bigdl.dataset.image.CropCenter
-import com.intel.analytics.bigdl.dataset.image.{BGRImgCropper, BGRImgNormalizer, BytesToBGRImg, MTLabeledBGRImgToBatch, HFlip => DatasetHFlip}
+import com.intel.analytics.bigdl.dataset.image.{BGRImgCropper, BGRImgNormalizer, BGRImgToSample, BytesToBGRImg, CropCenter, MTLabeledBGRImgToBatch, HFlip => DatasetHFlip}
 import com.intel.analytics.bigdl.tensor.Tensor
 import com.intel.analytics.bigdl.transform.vision.image._
 import com.intel.analytics.bigdl.utils.{Engine, T}
 import com.intel.analytics.zoo.feature.image._
 import com.intel.analytics.zoo.feature.{DistributedFeatureSet, FeatureSet}
-import com.intel.analytics.zoo.feature.pmem.{DRAM, MemoryType, PMEM}
+import com.intel.analytics.zoo.feature.pmem._
 import com.intel.analytics.zoo.pipeline.api.keras.layers.utils.EngineRef
 import org.apache.hadoop.io.Text
 import org.apache.log4j.Logger
@@ -78,27 +77,24 @@ object ImageNet2012 {
     coresPerNode: Int,
     classNumber: Int,
     memoryType: MemoryType = DRAM,
-    opencvPreprocessing: Boolean = false
+    opencvPreprocessing: Boolean = false,
+    dataStrategy: DataStrategy = PARTITIONED
   )
   : FeatureSet[MiniBatch[Float]] = {
     if (opencvPreprocessing) {
       logger.info("Using opencv preprocessing for training set")
       opencv(path, sc, imageSize, batchSize,
-        nodeNumber, coresPerNode, classNumber, memoryType)
+        nodeNumber, coresPerNode, classNumber, memoryType, dataStrategy)
     } else {
       val rawData = readFromSeqFiles(path, sc, classNumber)
         .setName("ImageNet2012 Training Set")
-      val featureSet = FeatureSet.rdd(rawData, memoryType = memoryType)
-      featureSet.transform(
-        MTLabeledBGRImgToBatch[ByteRecord](
-          width = imageSize,
-          height = imageSize,
-          batchSize = batchSize,
-          transformer = (BytesToBGRImg()
+      val featureSet = FeatureSet.rdd(rawData, memoryType = memoryType, dataStrategy)
+      featureSet.transform(BytesToBGRImg()
             -> BGRImgCropper(imageSize, imageSize)
             -> DatasetHFlip(0.5)
-            -> BGRImgNormalizer(0.485, 0.456, 0.406, 0.229, 0.224, 0.225))
-        ))
+            -> BGRImgNormalizer(0.485, 0.456, 0.406, 0.229, 0.224, 0.225)
+            -> BGRImgToSample()
+            -> SampleToMiniBatch(batchSize))
     }
   }
 
@@ -123,11 +119,12 @@ object ImageNet2012 {
         nodeNumber: Int,
         coresPerNode: Int,
         classNumber: Int,
-        memoryType: MemoryType = DRAM): FeatureSet[MiniBatch[Float]] = {
+        memoryType: MemoryType = DRAM,
+        dataStrategy: DataStrategy = PARTITIONED): FeatureSet[MiniBatch[Float]] = {
     val rawData = readFromSeqFiles(path, sc, classNumber)
       .map(byteRecordToImageFeature(_))
       .setName("ImageNet2012 Training Set")
-    val featureSet = FeatureSet.rdd(rawData, memoryType = memoryType)
+    val featureSet = FeatureSet.rdd(rawData, memoryType = memoryType, dataStrategy)
     val transformer = ImagePixelBytesToMat() ->
       ImageRandomCrop(imageSize, imageSize) ->
       ImageChannelNormalize(0.485f, 0.456f, 0.406f, 0.229f, 0.224f, 0.225f) ->

diff --git a/zoo/src/main/scala/com/intel/analytics/zoo/examples/inception/Train.scala b/zoo/src/main/scala/com/intel/analytics/zoo/examples/inception/Train.scala
@@ -17,11 +17,11 @@ package com.intel.analytics.zoo.examples.inception
 
 import com.intel.analytics.bigdl._
 import com.intel.analytics.bigdl.models.inception.Inception_v1_NoAuxClassifier
-import com.intel.analytics.bigdl.nn.{ClassNLLCriterion, Module}
+import com.intel.analytics.bigdl.nn._
 import com.intel.analytics.bigdl.optim.SGD.{Poly, SequentialSchedule, Warmup}
 import com.intel.analytics.bigdl.optim._
 import com.intel.analytics.bigdl.utils.{Engine, LoggerFilter, T, Table}
-import com.intel.analytics.zoo.feature.pmem.MemoryType
+import com.intel.analytics.zoo.feature.pmem.{MemoryType, PARTITIONED}
 import com.intel.analytics.zoo.pipeline.api.keras.layers.utils.EngineRef
 import com.intel.analytics.zoo.pipeline.estimator.{ConstantClipping, Estimator, L2NormClipping}
 import org.apache.spark.SparkContext
@@ -111,6 +111,7 @@ object TrainInceptionV1 {
         checkPointTrigger = Some(checkpointTrigger),
         valSet, Array(new Top1Accuracy[Float], new Top5Accuracy[Float]))
 
+      estimator.close()
       sc.stop()
     })
   }

diff --git a/zoo/src/main/scala/com/intel/analytics/zoo/examples/recommendation/CensusWideAndDeep.scala b/zoo/src/main/scala/com/intel/analytics/zoo/examples/recommendation/CensusWideAndDeep.scala
@@ -17,12 +17,13 @@
 package com.intel.analytics.zoo.examples.recommendation
 
 import com.intel.analytics.bigdl.dataset.{Sample, SampleToMiniBatch}
-import com.intel.analytics.bigdl.nn.{ClassNLLCriterion}
+import com.intel.analytics.bigdl.nn.ClassNLLCriterion
 import com.intel.analytics.bigdl.numeric.NumericFloat
 import com.intel.analytics.bigdl.optim._
 import com.intel.analytics.bigdl.utils.{RandomGenerator, T}
-import com.intel.analytics.zoo.common.NNContext
+import com.intel.analytics.zoo.common.{EveryEpoch, MaxEpoch, NNContext}
 import com.intel.analytics.zoo.feature.FeatureSet
+import com.intel.analytics.zoo.feature.pmem.DISK_AND_DRAM
 import com.intel.analytics.zoo.models.recommendation._
 import com.intel.analytics.zoo.pipeline.estimator.Estimator
 import org.apache.log4j.{Level, Logger}
@@ -131,7 +132,7 @@ object CensusWideAndDeep {
     }
 
     val sample2batch = SampleToMiniBatch(batchSize)
-    val trainRdds = FeatureSet.rdd(trainpairFeatureRdds.map(x => x.sample).cache()) ->
+    val trainRdds = FeatureSet.rdd(trainpairFeatureRdds.map(x => x.sample).cache(), DISK_AND_DRAM(2)) ->
       sample2batch
     val validationRdds = FeatureSet.rdd(validationpairFeatureRdds.map(x => x.sample).cache()) ->
       sample2batch
@@ -144,8 +145,8 @@ object CensusWideAndDeep {
       Estimator[Float](wideAndDeep, optimMethods)
     }
 
-    val (checkpointTrigger, testTrigger, endTrigger) =
-      (Trigger.everyEpoch, Trigger.everyEpoch, Trigger.maxEpoch(maxEpoch))
+    val (checkpointTrigger, endTrigger) =
+      (EveryEpoch(), MaxEpoch(maxEpoch))
 
     estimator.train(trainRdds, ClassNLLCriterion[Float](),
       Some(endTrigger),