Class: Transformers::Distilbert::DistilBertForQuestionAnswering

Inherits:

DistilBertPreTrainedModel

Object
Torch::NN::Module
PreTrainedModel
DistilBertPreTrainedModel
Transformers::Distilbert::DistilBertForQuestionAnswering

show all

Defined in:: lib/transformers/models/distilbert/modeling_distilbert.rb

Instance Attribute Summary

Attributes inherited from PreTrainedModel

#config

Instance Method Summary collapse

#forward(input_ids: nil, attention_mask: nil, head_mask: nil, inputs_embeds: nil, start_positions: nil, end_positions: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object
#initialize(config) ⇒ DistilBertForQuestionAnswering constructor

A new instance of DistilBertForQuestionAnswering.

Constructor Details

#initialize(config) ⇒ `DistilBertForQuestionAnswering`

Returns a new instance of DistilBertForQuestionAnswering.

# File 'lib/transformers/models/distilbert/modeling_distilbert.rb', line 548

def initialize(config)
  super(config)

  @distilbert = DistilBertModel.new(config)
  @qa_outputs = Torch::NN::Linear.new(config.dim, config.num_labels)
  if config.num_labels != 2
    raise ArgumentError, "config.num_labels should be 2, but it is #{config.num_labels}"
  end

  @dropout = Torch::NN::Dropout.new(p: config.qa_dropout)

  # Initialize weights and apply final processing
  post_init
end

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, head_mask: nil, inputs_embeds: nil, start_positions: nil, end_positions: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`

# File 'lib/transformers/models/distilbert/modeling_distilbert.rb', line 563

def forward(
  input_ids: nil,
  attention_mask: nil,
  head_mask: nil,
  inputs_embeds: nil,
  start_positions: nil,
  end_positions: nil,
  output_attentions: nil,
  output_hidden_states: nil,
  return_dict: nil
)
  return_dict = !return_dict.nil? ? return_dict : @config.use_return_dict

  distilbert_output = @distilbert.(
    input_ids: input_ids,
    attention_mask: attention_mask,
    head_mask: head_mask,
    inputs_embeds: inputs_embeds,
    output_attentions: output_attentions,
    output_hidden_states: output_hidden_states,
    return_dict: return_dict
  )
  hidden_states = distilbert_output[0]  # (bs, max_query_len, dim)

  hidden_states = @dropout.(hidden_states)  # (bs, max_query_len, dim)
  logits = @qa_outputs.(hidden_states)  # (bs, max_query_len, 2)
  start_logits, end_logits = logits.split(1, dim: -1)
  start_logits = start_logits.squeeze(-1).contiguous  # (bs, max_query_len)
  end_logits = end_logits.squeeze(-1).contiguous  # (bs, max_query_len)

  total_loss = nil
  if !start_positions.nil? && !end_positions.nil?
    raise Todo
  end

  if !return_dict
    raise Todo
  end

  QuestionAnsweringModelOutput.new(
    loss: total_loss,
    start_logits: start_logits,
    end_logits: end_logits,
    hidden_states: distilbert_output.hidden_states,
    attentions: distilbert_output.attentions
  )
end

Class: Transformers::Distilbert::DistilBertForQuestionAnswering

Instance Attribute Summary

Attributes inherited from PreTrainedModel

Instance Method Summary collapse

Methods inherited from DistilBertPreTrainedModel

Methods inherited from PreTrainedModel

Methods included from ClassAttribute

Methods included from ModuleUtilsMixin

Constructor Details

#initialize(config) ⇒ DistilBertForQuestionAnswering

Instance Method Details

#forward(input_ids: nil, attention_mask: nil, head_mask: nil, inputs_embeds: nil, start_positions: nil, end_positions: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ Object

#initialize(config) ⇒ `DistilBertForQuestionAnswering`

#forward(input_ids: nil, attention_mask: nil, head_mask: nil, inputs_embeds: nil, start_positions: nil, end_positions: nil, output_attentions: nil, output_hidden_states: nil, return_dict: nil) ⇒ `Object`