Add loaders for ELU, RELU activation layers (#78)

kokorins · kokorins · commit 19750dd76421 · 2021-06-14T21:14:03.000+02:00
- missing activation layers loaders added
- two distinct examples with save/load added to examples folder (trying to reach 0.7 accuracy)
diff --git a/api/src/main/kotlin/org/jetbrains/kotlinx/dl/api/inference/keras/ModelLoader.kt b/api/src/main/kotlin/org/jetbrains/kotlinx/dl/api/inference/keras/ModelLoader.kt
@@ -398,7 +398,7 @@ private fun createActivationLayer(config: LayerConfig, name: String): Layer {
 
 private fun createReLULayer(config: LayerConfig, name: String): Layer {
     return ReLU(
-        maxValue = config.max_value!!.toFloat(),
+        maxValue = config.max_value?.toFloat(),
         negativeSlope = config.negative_slope!!.toFloat(),
         threshold = config.threshold!!.toFloat(),
         name = name
diff --git a/api/src/main/kotlin/org/jetbrains/kotlinx/dl/api/inference/keras/ModelSaver.kt b/api/src/main/kotlin/org/jetbrains/kotlinx/dl/api/inference/keras/ModelSaver.kt
@@ -16,6 +16,8 @@ import org.jetbrains.kotlinx.dl.api.core.layer.activation.PReLU
 import org.jetbrains.kotlinx.dl.api.core.layer.activation.LeakyReLU
 import org.jetbrains.kotlinx.dl.api.core.layer.activation.Softmax
 import org.jetbrains.kotlinx.dl.api.core.layer.activation.ThresholdedReLU
+import org.jetbrains.kotlinx.dl.api.core.layer.activation.ReLU
+import org.jetbrains.kotlinx.dl.api.core.layer.activation.ELU
 import org.jetbrains.kotlinx.dl.api.core.layer.convolutional.*
 import org.jetbrains.kotlinx.dl.api.core.layer.core.ActivationLayer
 import org.jetbrains.kotlinx.dl.api.core.layer.core.Dense
@@ -87,6 +89,8 @@ private fun convertToKerasLayer(layer: Layer, isKerasFullyCompatible: Boolean, i
         is BatchNorm -> createKerasBatchNorm(layer, isKerasFullyCompatible)
         is ActivationLayer -> createKerasActivationLayer(layer)
         is PReLU -> createKerasPReLULayer(layer, isKerasFullyCompatible)
+        is ReLU -> createKerasReLU(layer)
+        is ELU -> createKerasELU(layer)
         is LeakyReLU -> createKerasLeakyReLU(layer)
         is ThresholdedReLU -> createKerasThresholdedReLULayer(layer)
         is Add -> createKerasAddLayer(layer)
@@ -241,6 +245,24 @@ private fun createKerasSoftmaxLayer(layer: Softmax): KerasLayer {
     return KerasLayer(class_name = LAYER_SOFTMAX, config = configX)
 }
 
+private fun createKerasReLU(layer: ReLU): KerasLayer {
+    val configX = LayerConfig(
+            dtype = DATATYPE_FLOAT32,
+            max_value = layer.maxValue?.toDouble(),
+            negative_slope = layer.negativeSlope.toDouble(),
+            threshold = layer.threshold.toDouble()
+    )
+    return KerasLayer(class_name = LAYER_RELU, config = configX)
+}
+
+private fun createKerasELU(layer: ELU): KerasLayer {
+    val configX = LayerConfig(
+            dtype = DATATYPE_FLOAT32,
+            alpha = layer.alpha.toDouble()
+    )
+    return KerasLayer(class_name = LAYER_ELU, config = configX)
+}
+
 private fun createKerasLeakyReLU(layer: LeakyReLU): KerasLayer {
     val configX = LayerConfig(
         dtype = DATATYPE_FLOAT32,
diff --git a/examples/src/main/kotlin/examples/inference/LeNetModel.kt b/examples/src/main/kotlin/examples/inference/LeNetModel.kt
@@ -27,7 +27,7 @@ private val biasInitializer = GlorotUniform(SEED)
 /**
  * Returns classic LeNet-5 model with minor improvements (Sigmoid activation -> ReLU activation, AvgPool layer -> MaxPool layer).
  */
-fun lenet5(): Sequential = Sequential.of(
+fun lenet5(sigmoidActivations:Activations = Activations.Relu): Sequential = Sequential.of(
     Input(
         IMAGE_SIZE,
         IMAGE_SIZE,
@@ -38,7 +38,7 @@ fun lenet5(): Sequential = Sequential.of(
         filters = 32,
         kernelSize = longArrayOf(5, 5),
         strides = longArrayOf(1, 1, 1, 1),
-        activation = Activations.Relu,
+        activation = sigmoidActivations,
         kernelInitializer = kernelInitializer,
         biasInitializer = biasInitializer,
         padding = ConvPadding.SAME,
@@ -53,7 +53,7 @@ fun lenet5(): Sequential = Sequential.of(
         filters = 64,
         kernelSize = longArrayOf(5, 5),
         strides = longArrayOf(1, 1, 1, 1),
-        activation = Activations.Relu,
+        activation = sigmoidActivations,
         kernelInitializer = kernelInitializer,
         biasInitializer = biasInitializer,
         padding = ConvPadding.SAME,
diff --git a/examples/src/main/kotlin/examples/inference/saveload/SaveLoadElu.kt b/examples/src/main/kotlin/examples/inference/saveload/SaveLoadElu.kt
@@ -0,0 +1,30 @@
+package examples.inference.saveload
+
+import examples.inference.lenet5
+import org.jetbrains.kotlinx.dl.api.core.Sequential
+import org.jetbrains.kotlinx.dl.api.core.activation.Activations
+import org.jetbrains.kotlinx.dl.api.core.loss.Losses
+import org.jetbrains.kotlinx.dl.api.core.metric.Metrics
+import org.jetbrains.kotlinx.dl.api.core.optimizer.SGD
+import org.jetbrains.kotlinx.dl.dataset.mnist
+import java.io.File
+
+
+private const val PATH_TO_MODEL = "savedmodels/elu_lenet_saveload"
+
+/**
+ * This examples demonstrates running Save and Load for prediction on [mnist] dataset.
+ */
+fun eluLenetOnMnistWithIntermediateSave() {
+    val (train, test) = mnist()
+    SaveLoadExample.trainAndSave(train, test, lenet5(Activations.Elu), PATH_TO_MODEL, 0.7)
+    Sequential.loadDefaultModelConfiguration(File(PATH_TO_MODEL)).use {
+        it.compile(optimizer = SGD(learningRate = 0.3f), loss = Losses.SOFT_MAX_CROSS_ENTROPY_WITH_LOGITS,
+                metric = Metrics.ACCURACY)
+        it.loadWeights(File(PATH_TO_MODEL))
+        val accuracy = it.evaluate(test).metrics[Metrics.ACCURACY] ?: 0.0
+        println("Accuracy is : $accuracy")
+    }
+}
+
+fun main(): Unit = eluLenetOnMnistWithIntermediateSave()
diff --git a/examples/src/main/kotlin/examples/inference/saveload/SaveLoadExample.kt b/examples/src/main/kotlin/examples/inference/saveload/SaveLoadExample.kt
@@ -0,0 +1,46 @@
+package examples.inference.saveload
+
+import org.jetbrains.kotlinx.dl.api.core.SavingFormat
+import org.jetbrains.kotlinx.dl.api.core.Sequential
+import org.jetbrains.kotlinx.dl.api.core.WritingMode
+import org.jetbrains.kotlinx.dl.api.core.callback.Callback
+import org.jetbrains.kotlinx.dl.api.core.history.BatchTrainingEvent
+import org.jetbrains.kotlinx.dl.api.core.history.TrainingHistory
+import org.jetbrains.kotlinx.dl.api.core.loss.Losses
+import org.jetbrains.kotlinx.dl.api.core.metric.Metrics
+import org.jetbrains.kotlinx.dl.api.core.optimizer.SGD
+import org.jetbrains.kotlinx.dl.dataset.Dataset
+import java.io.File
+
+object SaveLoadExample {
+
+    private const val TEST_BATCH_SIZE = 1000
+    private const val TRAINING_BATCH_SIZE = 500
+
+    fun trainAndSave(train: Dataset, test: Dataset, model: Sequential, path: String, accuracyThreshold: Double = 0.7) {
+        model.use {
+            it.name = "lenet-accuracy85"
+            it.compile(
+                    optimizer = SGD(learningRate = 0.3f),
+                    loss = Losses.SOFT_MAX_CROSS_ENTROPY_WITH_LOGITS,
+                    metric = Metrics.ACCURACY,
+                    callback = object : Callback() {
+                        override fun onTrainBatchEnd(batch: Int, batchSize: Int, event: BatchTrainingEvent, logs: TrainingHistory) {
+                            if (event.metricValue > accuracyThreshold+0.1) {
+                                println("Stopping training at ${event.metricValue} accuracy")
+                                model.stopTraining = true
+                            }
+                        }
+                    }
+            )
+            it.init()
+            var accuracy = 0.0
+            while (accuracy < accuracyThreshold) {
+                it.fit(dataset = train, epochs = 1, batchSize = TRAINING_BATCH_SIZE)
+                accuracy = it.evaluate(dataset = test, batchSize = TEST_BATCH_SIZE).metrics[Metrics.ACCURACY] ?: 0.0
+                println("Accuracy: $accuracy")
+            }
+            model.save(modelDirectory = File(path), savingFormat = SavingFormat.JSON_CONFIG_CUSTOM_VARIABLES, writingMode = WritingMode.OVERRIDE)
+        }
+    }
+}
diff --git a/examples/src/main/kotlin/examples/inference/saveload/SaveLoadRelu.kt b/examples/src/main/kotlin/examples/inference/saveload/SaveLoadRelu.kt
@@ -0,0 +1,29 @@
+package examples.inference.saveload
+
+import examples.inference.lenet5
+import org.jetbrains.kotlinx.dl.api.core.Sequential
+import org.jetbrains.kotlinx.dl.api.core.activation.Activations
+import org.jetbrains.kotlinx.dl.api.core.loss.Losses
+import org.jetbrains.kotlinx.dl.api.core.metric.Metrics
+import org.jetbrains.kotlinx.dl.api.core.optimizer.SGD
+import org.jetbrains.kotlinx.dl.dataset.mnist
+import java.io.File
+
+
+private const val PATH_TO_MODEL = "savedmodels/relu_lenet_saveload"
+
+/**
+ * This examples demonstrates running Save and Load for prediction on [mnist] dataset.
+ */
+fun reluLenetOnMnistWithIntermediateSave() {
+    val (train, test) = mnist()
+    SaveLoadExample.trainAndSave(train, test, lenet5(Activations.Relu), PATH_TO_MODEL, 0.7)
+    Sequential.loadDefaultModelConfiguration(File(PATH_TO_MODEL)).use {
+        it.compile(optimizer = SGD(learningRate = 0.3f), loss = Losses.SOFT_MAX_CROSS_ENTROPY_WITH_LOGITS, metric = Metrics.ACCURACY)
+        it.loadWeights(File(PATH_TO_MODEL))
+        val accuracy = it.evaluate(test).metrics[Metrics.ACCURACY] ?: 0.0
+        println("Accuracy is : $accuracy")
+    }
+}
+
+fun main(): Unit = reluLenetOnMnistWithIntermediateSave()