Source code for langml.layers.layers

# -*- coding: utf-8 -*-

from typing import Optional, List

from langml import keras, K, L
from langml.tensor_typing import Tensors, Initializer, Constraint, Regularizer


[docs]class AbsolutePositionEmbedding(L.Layer):
    def __init__(self,
                 input_dim: int,
                 output_dim: int,
                 mode: str = 'add',
                 embeddings_initializer: Initializer = 'uniform',
                 embeddings_regularizer: Optional[Regularizer] = None,
                 embeddings_constraint: Optional[Constraint] = None,
                 mask_zero: bool = False,
                 **kwargs):
        """Absolute Position Embedding
        # mode:
          expand
            # Input shape
                2D tensor with shape: `(batch_size, sequence_length)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, output_dim)`.
          add
            # Input shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
          concat
            # Input shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim + output_dim)`.
        """
        assert mode in ['expand', 'add', 'concat'], f'not support mode `{mode}`, options: expand | add | concat'
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.mode = mode
        self.embeddings_initializer = keras.initializers.get(embeddings_initializer)
        self.embeddings_regularizer = keras.regularizers.get(embeddings_regularizer)
        self.embeddings_constraint = keras.constraints.get(embeddings_constraint)
        self.mask_zero = mask_zero
        self.supports_masking = True if mask_zero else False
        self.embeddings = None
        super(AbsolutePositionEmbedding, self).__init__(**kwargs)

[docs]    def get_config(self) -> dict:
        config = {
            'input_dim': self.input_dim,
            'output_dim': self.output_dim,
            'mode': self.mode,
            'embeddings_initializer': keras.initializers.serialize(self.embeddings_initializer),
            'embeddings_regularizer': keras.regularizers.serialize(self.embeddings_regularizer),
            'embeddings_constraint': keras.constraints.serialize(self.embeddings_constraint),
            'mask_zero': self.mask_zero
        }
        base_config = super(AbsolutePositionEmbedding, self).get_config()
        return dict(base_config, **config)

    @staticmethod
[docs]    def get_custom_objects() -> dict:
        return {'AbsolutePositionEmbedding': AbsolutePositionEmbedding}

[docs]    def build(self, input_shape: Tensors):
        if self.mode == 'expand':
            self.embeddings = self.add_weight(
                shape=(self.input_dim * 2 + 1, self.output_dim),
                initializer=self.embeddings_initializer,
                name='embeddings',
                regularizer=self.embeddings_regularizer,
                constraint=self.embeddings_constraint,
            )
        else:
            self.embeddings = self.add_weight(
                shape=(self.input_dim, self.output_dim),
                initializer=self.embeddings_initializer,
                name='embeddings',
                regularizer=self.embeddings_regularizer,
                constraint=self.embeddings_constraint,
            )
        super(AbsolutePositionEmbedding, self).build(input_shape)

[docs]    def compute_mask(self, inputs: Tensors, mask: Optional[Tensors] = None) -> Tensors:
        if self.mode == 'expand':
            if self.mask_zero:
                output_mask = K.not_equal(inputs, self.mask_zero)
            else:
                output_mask = None
        else:
            output_mask = mask
        return output_mask

[docs]    def compute_output_shape(self, input_shape: Tensors) -> Tensors:
        if self.mode == 'expand':
            return input_shape + (self.output_dim,)
        if self.mode == 'concat':
            return input_shape[:-1] + (input_shape[-1] + self.output_dim,)
        return input_shape

[docs]    def call(self, inputs: Tensors, **kwargs) -> Tensors:
        if self.mode == 'expand':
            inputs = K.cast(inputs, 'int32')
            return K.gather(
                self.embeddings,
                K.minimum(K.maximum(inputs, -self.input_dim), self.input_dim) + self.input_dim,
            )
        input_shape = K.shape(inputs)
        if self.mode == 'add':
            batch_size, seq_len, output_dim = input_shape[0], input_shape[1], input_shape[2]
        else:
            batch_size, seq_len, output_dim = input_shape[0], input_shape[1], self.output_dim
        pos_embeddings = K.tile(
            K.expand_dims(self.embeddings[:seq_len, :output_dim], axis=0),
            [batch_size, 1, 1],
        )
        if self.mode == 'add':
            return inputs + pos_embeddings
        return K.concatenate([inputs, pos_embeddings], axis=-1)


[docs]class SineCosinePositionEmbedding(L.Layer):
    """Sine Cosine Position Embedding.
    https://arxiv.org/pdf/1706.03762
    """

    def __init__(self,
                 mode: str = 'add',
                 output_dim: Optional[int] = None,
                 **kwargs):
        """
        mode:
          expand
            # Input shape
                2D tensor with shape: `(batch_size, sequence_length)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, output_dim)`.
          add
            # Input shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
          concat
            # Input shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
            # Output shape
                3D tensor with shape: `(batch_size, sequence_length, feature_dim + output_dim)`.
          zero
            # Input shape
              3D tensor with shape: `(batch_size, sequence_length, feature_dim)`.
            # Output shape
              3D tensor with shape: `(batch_size, sequence_length, output_dim)`.
        """
        self.supports_masking = True
        assert mode in ['expand', 'add', 'concat', 'zero'], 'please specify model from: expand|add|concat| zero'
        if mode in ['expand', 'concat']:
            if output_dim is None:
                raise NotImplementedError(f'`output_dim` is required in `{mode}` mode')
            if output_dim % 2 != 0:
                raise NotImplementedError(f'Not support an odd output dimension: {output_dim}')
        self.mode = mode
        self.output_dim = output_dim
        super(SineCosinePositionEmbedding, self).__init__(**kwargs)

[docs]    def get_config(self):
        config = {
            'mode': self.mode,
            'output_dim': self.output_dim,
        }
        base_config = super(SineCosinePositionEmbedding, self).get_config()

        return dict(base_config, **config)

    @staticmethod
[docs]    def get_custom_objects() -> dict:
        return {'SineCosinePositionEmbedding': SineCosinePositionEmbedding}

[docs]    def compute_mask(self, inputs: Tensors, mask: Optional[Tensors] = None) -> Tensors:
        return mask

[docs]    def compute_output_shape(self, input_shape: Tensors) -> Tensors:
        if self.mode == 'expand':
            return input_shape + (self.output_dim,)
        if self.mode == 'concat':
            return input_shape[:-1] + (input_shape[-1] + self.output_dim,)
        return input_shape

[docs]    def call(self, inputs: Tensors, mask: Optional[Tensors] = None, **kwargs) -> Tensors:
        input_shape = K.shape(inputs)
        batch_size, seq_len = input_shape[0], input_shape[1]
        output_dim = input_shape[2] if self.mode == 'add' else self.output_dim
        if self.mode in ['add', 'concat', 'zero']:
            pos_input = K.tile(K.expand_dims(K.arange(0, seq_len), axis=0), [batch_size, 1])
        else:
            pos_input = inputs
        pos_input = K.cast(pos_input, K.floatx())
        evens = K.arange(0, output_dim // 2) * 2
        odds = K.arange(0, output_dim // 2) * 2 + 1
        sim_embed = K.sin(
            K.dot(
                K.expand_dims(pos_input, -1),
                K.expand_dims(1.0 / K.pow(
                    10000.0,
                    K.cast(evens, K.floatx()) / K.cast(output_dim, K.floatx())
                ), 0)
            )
        )
        cos_embed = K.cos(
            K.dot(
                K.expand_dims(pos_input, -1),
                K.expand_dims(1.0 / K.pow(
                    10000.0, K.cast((odds - 1), K.floatx()) / K.cast(output_dim, K.floatx())
                ), 0)
            )
        )
        embed = K.stack([sim_embed, cos_embed], axis=-1)
        output = K.reshape(embed, [-1, seq_len, output_dim])
        if self.mode == 'add':
            output += inputs
        elif self.mode == 'concat':
            output = K.concatenate([inputs, output], axis=-1)
        return output


[docs]class ScaleOffset(L.Layer):
    """ Scale Offset
    """
    def __init__(self, scale: bool = True, offset: bool = True, **kwargs):
        super(ScaleOffset, self).__init__(**kwargs)
        self.scale = scale
        self.offset = offset

        self.supports_masking = True

[docs]    def get_config(self):
        config = {
            'scale': self.scale,
            'offset': self.offset,
        }
        base_config = super(ScaleOffset, self).get_config()
        return dict(base_config, **config)

[docs]    def build(self, input_shape: Tensors):
        super(ScaleOffset, self).build(input_shape)

        if self.offset is True:
            self.beta = self.add_weight(
                name='beta', shape=(input_shape[-1],), initializer='zeros'
            )
        if self.scale is True:
            self.gamma = self.add_weight(
                name='gamma', shape=(input_shape[-1],), initializer='ones'
            )

[docs]    def compute_mask(self, inputs: Tensors, mask: Optional[Tensors] = None):
        return mask

[docs]    def call(self, inputs: Tensors) -> Tensors:
        o = inputs
        if self.scale:
            o *= self.gamma
        if self.offset:
            o += self.beta
        return o

[docs]    def compute_output_shape(self, input_shape: Tensors) -> Tensors:
        return input_shape

    @staticmethod
[docs]    def get_custom_objects() -> dict:
        return {'ScaleOffset': ScaleOffset}


[docs]class ConditionalLayerNormalization(L.Layer):
    """ Conditional Layer Normalization
    https://arxiv.org/abs/2108.00449
    """
    def __init__(self,
                 center: bool = True,
                 epsilon: Optional[float] = None,
                 scale: bool = True,
                 offset: bool = True,
                 **kwargs):
        super(ConditionalLayerNormalization, self).__init__(**kwargs)
        self.center = center
        self.epsilon = K.epsilon() if epsilon is None else epsilon
        self.scale = scale
        self.offset = offset

        self.supports_masking = True

[docs]    def get_config(self):
        config = {
            'center': self.center,
            'epsilon': self.epsilon,
            'scale': self.scale,
            'offset': self.offset,
        }
        base_config = super(ConditionalLayerNormalization, self).get_config()
        return dict(base_config, **config)

[docs]    def build(self, input_shapes: Tensors):
        super(ConditionalLayerNormalization, self).build(input_shapes)

        input_shape, cond_shape = input_shapes
        if self.offset is True:
            self.beta = self.add_weight(
                name='beta', shape=(input_shape[-1],), initializer='zeros'
            )
            self.beta_cond = self.add_weight(
                name='beta_cond', shape=(cond_shape[-1], input_shape[-1]), initializer='zeros'
            )
        if self.scale is True:
            self.gamma = self.add_weight(
                name='gamma', shape=(input_shape[-1],), initializer='ones'
            )
            self.gamma_cond = self.add_weight(
                name='gamma_cond', shape=(cond_shape[-1], input_shape[-1]), initializer='zeros'
            )

[docs]    def compute_mask(self, inputs: Tensors, mask: Optional[Tensors] = None):
        return mask if mask is None else mask[0]

[docs]    def call(self, inputs: List[Tensors]) -> Tensors:
        inputs, cond = inputs
        if self.center:
            mean = K.mean(inputs, axis=-1, keepdims=True)
            var = K.mean(K.square(inputs), axis=-1, keepdims=True)
            inputs = (inputs - mean) / K.sqrt(var + self.epsilon)

        o = inputs
        if self.scale:
            gamma = self.gamma + K.dot(cond, self.gamma_cond)
            o *= gamma
        if self.offset:
            beta = self.beta + K.dot(cond, self.beta_cond)
            o += beta
        return o

[docs]    def compute_output_shape(self, input_shape: Tensors) -> Tensors:
        return input_shape[0]

    @staticmethod
[docs]    def get_custom_objects() -> dict:
        return {'ConditionalLayerNormalization': ConditionalLayerNormalization}