Class: TLearn::EM_Gaussian

Inherits:

Object

Object
TLearn::EM_Gaussian

show all

Defined in:: lib/t_learn/em.rb

Instance Attribute Summary collapse

#conv_list ⇒ Object

Returns the value of attribute conv_list.
#data_list ⇒ Object

Returns the value of attribute data_list.
#k_num ⇒ Object

Returns the value of attribute k_num.
#log_likelihood ⇒ Object

Returns the value of attribute log_likelihood.
#mu_list ⇒ Object

Returns the value of attribute mu_list.
#pi_list ⇒ Object

Returns the value of attribute pi_list.
#real_data_list ⇒ Object

Returns the value of attribute real_data_list.

Instance Method Summary collapse

#calc_ave(k, nk) ⇒ Object
#calc_conv(k, nk) ⇒ Object
#calc_first_ave_std(x) ⇒ Object
#calc_log_likelihood ⇒ Object
#create_log(cycle, likelihood) ⇒ Object
#e_step ⇒ Object
#fit(data_list, k_num) ⇒ Object
#gauusian(x, mu, sigma) ⇒ Object

gauusian distribution.
#gauusian_over_2dim(x, mu, conv) ⇒ Object

gauusian distribution over 2 dim version.
#ini_ave(ave_list) ⇒ Object
#ini_conv(std_list) ⇒ Object
#init(data_list, k_num) ⇒ Object
#m_step ⇒ Object
#make_array(i, std) ⇒ Object
#scale(x) ⇒ Object

Instance Attribute Details

#conv_list ⇒ `Object`

Returns the value of attribute conv_list.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def conv_list
  @conv_list
end

#data_list ⇒ `Object`

Returns the value of attribute data_list.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def data_list
  @data_list
end

#k_num ⇒ `Object`

Returns the value of attribute k_num.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def k_num
  @k_num
end

#log_likelihood ⇒ `Object`

Returns the value of attribute log_likelihood.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def log_likelihood
  @log_likelihood
end

#mu_list ⇒ `Object`

Returns the value of attribute mu_list.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def mu_list
  @mu_list
end

#pi_list ⇒ `Object`

Returns the value of attribute pi_list.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def pi_list
  @pi_list
end

#real_data_list ⇒ `Object`

Returns the value of attribute real_data_list.



12
13
14

# File 'lib/t_learn/em.rb', line 12

def real_data_list
  @real_data_list
end

Instance Method Details

#calc_ave(k, nk) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 114

def calc_ave(k, nk) 
  mu = Array.new(@dim)
  @dim.times{|i|
    mu[i] = @data_list.each_with_index.inject(0.0){|sum,(data, n)| 
      sum += @gamma[n][k] * data[i] 
    } / nk

  }
  return mu
end

#calc_conv(k, nk) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 125

def calc_conv(k, nk)
  conv = Array.new(@dim).map{Array.new(@dim, 0)}
  @dim.times{|i|
    @dim.times{|j|
      @data_list.each_with_index{|data, n|
        conv[i][j] += @gamma[n][k] * (data[i]-@mu_list[k][i]) * (data[j]-@mu_list[k][j])
      } 
    }
  }
  conv = conv.map{|arr| 
    arr.map{|v| 
      (v/nk) != 0.0 ? (v/nk) : 0.1
    }
  }
  return conv
end

#calc_first_ave_std(x) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 184

def calc_first_ave_std(x)
  sum_each_vec = []
  ave_list = []
  std_list = []
  x.each{|vec| 
    vec.each_with_index{|data, i|
      sum_each_vec[i] = (sum_each_vec[i] == nil) ? data : sum_each_vec[i] + data
    }
  }
  x[0].size.times{|i| ave_list.push(sum_each_vec[i]/x.size)}

  sum_each_vec = []
  x.each{|vec| 
    vec.each_with_index{|data, i|
      sum_each_vec[i] = (sum_each_vec[i] == nil) ? (ave_list[i]-data)**2 : (sum_each_vec[i]+(ave_list[i]-data)**2)
    }
  }
  x[0].size.times{|i| 
    std = Math.sqrt(sum_each_vec[i]/x.size)
    std = 0.1 if std == 0.0 
    std_list.push(std)
  }

  return {:ave_list => ave_list, :std_list => std_list}
end

#calc_log_likelihood ⇒ `Object`

# File 'lib/t_learn/em.rb', line 142

def calc_log_likelihood
  log_likelihood = 0.0
  @data_list.each_with_index{|data, i|
    sum = 0.0
    @k_num.times{|k|
      sum += @pi_list[k] * gauusian(data, @mu_list[k], @conv_list[k]) 
    }
    log_likelihood += Math.log(sum)
  }
  return log_likelihood
end

#create_log(cycle, likelihood) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 55

def create_log(cycle, likelihood)
  log = {:cycle => cycle, 
         :likelihood => likelihood,
         :mu => @mu_list.clone, 
         :conv => @conv_list.clone, 
         :pi_list => @pi_list.clone}
  return log
end

#e_step ⇒ `Object`

# File 'lib/t_learn/em.rb', line 89

def e_step()
  @data_list.each_with_index{|data, n|
    denominator = 0.0
    @k_num.times{|k|
      denominator += @pi_list[k] * gauusian(data, @mu_list[k], @conv_list[k])
    }
    @k_num.times { |k|
      @gamma[n][k] = @pi_list[k] * gauusian(data, @mu_list[k], @conv_list[k]) / denominator
    }
  }
end

#fit(data_list, k_num) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 65

def fit(data_list, k_num)
  init(data_list, k_num)
  result = []
  cycle = 0
  last_likelihood = calc_log_likelihood()
  loop do 
    e_step()
    m_step()
    likelihood = calc_log_likelihood()
    diff = (likelihood - last_likelihood).abs
    last_likelihood = likelihood
    puts "likelihood: #{likelihood}"
    result.push(create_log(cycle, likelihood))
    cycle += 1
    break if diff < 0.000001
  end
  puts "===================================="
  puts "pi : #{ @pi_list }"
  puts "mu : #{ @mu_list}"
  puts "conv : #{ @conv_list}"
  return result
end

#gauusian(x, mu, sigma) ⇒ `Object`

gauusian distribution

# File 'lib/t_learn/em.rb', line 157

def gauusian(x, mu, sigma)
  if @dim <= 1
    x = x[0]
    mu = mu[0]
    sigma = sigma[0][0]
    f1 = 1.0/(Math.sqrt(2.0*Math::PI)*Math.sqrt(sigma))
    f2 = Math.exp(-(((x-mu)**2)/((2.0*sigma))))
    return f1 * f2
  else
    return gauusian_over_2dim(x, mu, sigma)
  end
end

#gauusian_over_2dim(x, mu, conv) ⇒ `Object`

gauusian distribution over 2 dim version

# File 'lib/t_learn/em.rb', line 174

def gauusian_over_2dim(x, mu, conv)
  x = Matrix[x]
  mu = Matrix[mu]
  conv = Matrix[*conv]
  f1 = 1.0/(((2.0 * Math::PI)**(@dim/2.0)) * ( conv.det**(0.5) ))
  f2 = Math.exp((-1.0/2.0)*((x-mu) * conv.inverse * (x-mu).transpose)[0, 0])

  return (f1 * f2)
end

#ini_ave(ave_list) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 27

def ini_ave(ave_list)
  array = []
  @dim.times {|i|
    array.push(ave_list[i]*rand())
  }
  return array
end

#ini_conv(std_list) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 35

def ini_conv(std_list)
  conv = []
  @dim.times {|i|
    conv.push(make_array(i, std_list[i]))
  }
  return conv
end

#init(data_list, k_num) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 14

def init(data_list, k_num)
  @k_num = k_num 
  @data_list = data_list
  @dim = @data_list[0].size
  # @data_list = scale(@data_list)
  data_ave_std = calc_first_ave_std(@data_list)
  @real_data_list = Marshal.load(Marshal.dump(@data_list))
  @mu_list = Array.new(@k_num).map{ini_ave(data_ave_std[:ave_list])}
  @conv_list = Array.new(@k_num).map{ini_conv(data_ave_std[:std_list])}
  @pi_list = @k_num.times.map{rand()}
  @gamma = Array.new(@data_list.size).map{Array.new(@k_num, 0)}
end

#m_step ⇒ `Object`

# File 'lib/t_learn/em.rb', line 101

def m_step()
  @k_num.times {|k|
    nk = 0.0
    @data_list.each_with_index{|data,  n| 
      nk += @gamma[n][k] 
    }

    @mu_list[k] = calc_ave(k, nk) 
    @conv_list[k] = calc_conv(k, nk)
    @pi_list[k] = nk/@data_list.size
  }
end

#make_array(i, std) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 43

def make_array(i, std)
  array = []
  @dim.times {|x|
    if i == x 
      array.push(std**2)
    else
      array.push(0.0)
    end
  }
  return array
end

#scale(x) ⇒ `Object`

# File 'lib/t_learn/em.rb', line 211

def scale(x)
  sum_each_vec = []
  ave_list = []
  std_list = []
  x.each{|vec| 
    vec.each_with_index{|data, i|
      sum_each_vec[i] = (sum_each_vec[i] == nil) ? data : sum_each_vec[i]+data
    }
  }
  x[0].size.times{|i|
    ave_list.push(sum_each_vec[i]/x.size)
  }

  sum_each_vec = []
  x.each{|vec| 
    vec.each_with_index{|data, i|
      sum_each_vec[i] = (sum_each_vec[i] == nil) ? (ave_list[i]-data)**2 : (sum_each_vec[i]+(ave_list[i]-data)**2)
    }
  }
  x[0].size.times{|i|
    std_list.push(Math.sqrt(sum_each_vec[i]/x.size))
  }

  scaled_x = []
  x.each_with_index{|vec, i| 
    scaled_x[i] ||= []
    vec.each_with_index{|data, j|
      scaled_x[i][j] ||= (data-ave_list[j])/std_list[j]
    }
  }
  return scaled_x
end

Class: TLearn::EM_Gaussian

Instance Attribute Summary collapse

Instance Method Summary collapse

gauusian distribution.

gauusian distribution over 2 dim version.

Instance Attribute Details

#conv_list ⇒ Object

#data_list ⇒ Object

#k_num ⇒ Object

#log_likelihood ⇒ Object

#mu_list ⇒ Object

#pi_list ⇒ Object

#real_data_list ⇒ Object

Instance Method Details

#calc_ave(k, nk) ⇒ Object

#calc_conv(k, nk) ⇒ Object

#calc_first_ave_std(x) ⇒ Object

#calc_log_likelihood ⇒ Object

#create_log(cycle, likelihood) ⇒ Object

#e_step ⇒ Object

#fit(data_list, k_num) ⇒ Object

#gauusian(x, mu, sigma) ⇒ Object