Class: IrtRuby::TwoParameterModel

Inherits:

Object

Object
IrtRuby::TwoParameterModel

show all

Defined in:: lib/irt_ruby/two_parameter_model.rb

Overview

A class representing the Two-Parameter model (2PL) for IRT. Incorporates:

Adaptive learning rate
Missing data handling
Parameter clamping for discrimination
Multiple convergence checks
Separate gradient calculation & parameter update

Constant Summary collapse

MISSING_STRATEGIES =

%i[ignore treat_as_incorrect treat_as_correct].freeze

Instance Method Summary collapse

Constructor Details

#initialize(data, max_iter: 1000, tolerance: 1e-6, param_tolerance: 1e-6, learning_rate: 0.01, decay_factor: 0.5, missing_strategy: :ignore) ⇒ `TwoParameterModel`

Returns a new instance of TwoParameterModel.

Raises:

(ArgumentError)

# File 'lib/irt_ruby/two_parameter_model.rb', line 14

def initialize(data, max_iter: 1000, tolerance: 1e-6, param_tolerance: 1e-6,
               learning_rate: 0.01, decay_factor: 0.5,
               missing_strategy: :ignore)
  @data = data
  @data_array = data.to_a
  num_rows = @data_array.size
  num_cols = @data_array.first.size

  raise ArgumentError, "missing_strategy must be one of #{MISSING_STRATEGIES}" unless MISSING_STRATEGIES.include?(missing_strategy)

  @missing_strategy = missing_strategy

  # Initialize parameters
  # Typically: ability ~ 0, difficulty ~ 0, discrimination ~ 1
  @abilities       = Array.new(num_rows)  { rand(-0.25..0.25) }
  @difficulties    = Array.new(num_cols)  { rand(-0.25..0.25) }
  @discriminations = Array.new(num_cols)  { rand(0.5..1.5) }

  @max_iter         = max_iter
  @tolerance        = tolerance
  @param_tolerance  = param_tolerance
  @learning_rate    = learning_rate
  @decay_factor     = decay_factor
end

Instance Method Details

#apply_gradient_update(ga, gd, gdisc) ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 96

def apply_gradient_update(ga, gd, gdisc)
  old_a    = @abilities.dup
  old_d    = @difficulties.dup
  old_disc = @discriminations.dup

  @abilities.each_index do |i|
    @abilities[i] += @learning_rate * ga[i]
  end

  @difficulties.each_index do |j|
    @difficulties[j] += @learning_rate * gd[j]
  end

  @discriminations.each_index do |j|
    @discriminations[j] += @learning_rate * gdisc[j]
    @discriminations[j] = 0.01 if @discriminations[j] < 0.01
    @discriminations[j] = 5.0  if @discriminations[j] > 5.0
  end

  [old_a, old_d, old_disc]
end

#average_param_update(old_a, old_d, old_disc) ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 118

def average_param_update(old_a, old_d, old_disc)
  deltas = []
  @abilities.each_with_index    { |x, i| deltas << (x - old_a[i]).abs }
  @difficulties.each_with_index { |x, j| deltas << (x - old_d[j]).abs }
  @discriminations.each_with_index { |x, j| deltas << (x - old_disc[j]).abs }
  deltas.sum / deltas.size
end

#compute_gradient ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 74

def compute_gradient
  grad_abilities       = Array.new(@abilities.size, 0.0)
  grad_difficulties    = Array.new(@difficulties.size, 0.0)
  grad_discriminations = Array.new(@discriminations.size, 0.0)

  @data_array.each_with_index do |row, i|
    row.each_with_index do |resp, j|
      value, skip = resolve_missing(resp)
      next if skip

      prob  = sigmoid(@discriminations[j] * (@abilities[i] - @difficulties[j]))
      error = value - prob

      grad_abilities[i]       += error * @discriminations[j]
      grad_difficulties[j]    -= error * @discriminations[j]
      grad_discriminations[j] += error * (@abilities[i] - @difficulties[j])
    end
  end

  [grad_abilities, grad_difficulties, grad_discriminations]
end

#fit ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 126

def fit
  prev_ll = log_likelihood

  @max_iter.times do
    ga, gd, gdisc = compute_gradient
    old_a, old_d, old_disc = apply_gradient_update(ga, gd, gdisc)

    curr_ll     = log_likelihood
    param_delta = average_param_update(old_a, old_d, old_disc)

    if curr_ll < prev_ll
      @abilities       = old_a
      @difficulties    = old_d
      @discriminations = old_disc
      @learning_rate  *= @decay_factor
    else
      ll_diff = (curr_ll - prev_ll).abs
      break if ll_diff < @tolerance && param_delta < @param_tolerance

      prev_ll = curr_ll
    end
  end

  {
    abilities: @abilities,
    difficulties: @difficulties,
    discriminations: @discriminations
  }
end

#log_likelihood ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 56

def log_likelihood
  ll = 0.0
  @data_array.each_with_index do |row, i|
    row.each_with_index do |resp, j|
      value, skip = resolve_missing(resp)
      next if skip

      prob = sigmoid(@discriminations[j] * (@abilities[i] - @difficulties[j]))
      ll += if value == 1
              Math.log(prob + 1e-15)
            else
              Math.log((1 - prob) + 1e-15)
            end
    end
  end
  ll
end

#resolve_missing(resp) ⇒ `Object`

# File 'lib/irt_ruby/two_parameter_model.rb', line 43

def resolve_missing(resp)
  return [resp, false] unless resp.nil?

  case @missing_strategy
  when :ignore
    [nil, true]
  when :treat_as_incorrect
    [0, false]
  when :treat_as_correct
    [1, false]
  end
end

#sigmoid(x) ⇒ `Object`



39
40
41

# File 'lib/irt_ruby/two_parameter_model.rb', line 39

def sigmoid(x)
  1.0 / (1.0 + Math.exp(-x))
end

Class: IrtRuby::TwoParameterModel

Overview

Constant Summary collapse

Instance Method Summary collapse

Constructor Details

#initialize(data, max_iter: 1000, tolerance: 1e-6, param_tolerance: 1e-6, learning_rate: 0.01, decay_factor: 0.5, missing_strategy: :ignore) ⇒ TwoParameterModel

Instance Method Details

#apply_gradient_update(ga, gd, gdisc) ⇒ Object

#average_param_update(old_a, old_d, old_disc) ⇒ Object

#compute_gradient ⇒ Object

#fit ⇒ Object

#log_likelihood ⇒ Object

#resolve_missing(resp) ⇒ Object

#sigmoid(x) ⇒ Object

#initialize(data, max_iter: 1000, tolerance: 1e-6, param_tolerance: 1e-6, learning_rate: 0.01, decay_factor: 0.5, missing_strategy: :ignore) ⇒ `TwoParameterModel`

#apply_gradient_update(ga, gd, gdisc) ⇒ `Object`

#average_param_update(old_a, old_d, old_disc) ⇒ `Object`

#compute_gradient ⇒ `Object`

#fit ⇒ `Object`

#log_likelihood ⇒ `Object`

#resolve_missing(resp) ⇒ `Object`

#sigmoid(x) ⇒ `Object`