Class: TM::Token

Inherits:

Object

Object
TM::Token

show all

Defined in:: lib/nysol/token.rb

Overview

形態素を表すクラス(双方向リスト)

Instance Attribute Summary collapse

#chunk ⇒ Object readonly

このtokenが属するchunk.
#class1 ⇒ Object readonly

Returns the value of attribute class1.
#class2 ⇒ Object readonly

Returns the value of attribute class2.
#class3 ⇒ Object readonly

Returns the value of attribute class3.
#class4 ⇒ Object readonly

Returns the value of attribute class4.
#form1 ⇒ Object readonly

Returns the value of attribute form1.
#form2 ⇒ Object readonly

Returns the value of attribute form2.
#id ⇒ Object readonly

tokenID(文字列).
#next ⇒ Object

次のtoken.
#orgWord ⇒ Object readonly

オリジナル語.
#prev ⇒ Object

前のtoken.
#word ⇒ Object readonly

原型語.

Instance Method Summary collapse

#declined? ⇒ Boolean

用言かどうか判定.
#ignoreClass? ⇒ Boolean
#initialize(xmlToken, chunk) ⇒ Token constructor

id省略時は終端目的の空tokenとして初期化する。 def initialize(id=nil,nxt, prv, word=nil,class1=nil,class2=nil,class3=nil,class4=nil,form1=nil,form2=nil,chunk=nil).
#show(fp = STDERR) ⇒ Object
#tokenCsvout(fp) ⇒ Object

Constructor Details

#initialize(xmlToken, chunk) ⇒ `Token`

id省略時は終端目的の空tokenとして初期化する。 def initialize(id=nil,nxt, prv, word=nil,class1=nil,class2=nil,class3=nil,class4=nil,form1=nil,form2=nil,chunk=nil)

# File 'lib/nysol/token.rb', line 33

def initialize(xmlToken, chunk)
	# 双方向リストの設定
		if chunk.tokens.size>0 then
     @prev = chunk.tokens.last
	else
     @prev = chunk.dummy # 終端
	end
    @next = chunk.dummy # 終端
    @prev.next = self if @prev!=nil

	# 各種メンバ変数の設定
	@chunk  = chunk
	if xmlToken==nil then
		@id = nil  # dummy Chunk(双方向リストの終端)
		@word   = ""
		@orgWord= ""
		@class1 = ""
		@class2 = ""
		@class3 = ""
		@class4 = ""
		@form1  = ""
		@form2  = ""
	else
		@id     = xmlToken.attribute("id").to_s
		@word   = xmlToken.attribute("word").to_s
		@orgWord= xmlToken.attribute("orgWord").to_s
		@class1 = xmlToken.attribute("class1").to_s
		@class2 = xmlToken.attribute("class2").to_s
		@class3 = xmlToken.attribute("class3").to_s
		@class4 = xmlToken.attribute("class4").to_s
		@form1  = xmlToken.attribute("form1").to_s
		@form2  = xmlToken.attribute("form2").to_s
	end
end

Instance Attribute Details

#chunk ⇒ `Object` (readonly)

このtokenが属するchunk



27
28
29

# File 'lib/nysol/token.rb', line 27

def chunk
  @chunk
end

#class1 ⇒ `Object` (readonly)

Returns the value of attribute class1.



21
22
23

# File 'lib/nysol/token.rb', line 21

def class1
  @class1
end

#class2 ⇒ `Object` (readonly)

Returns the value of attribute class2.



22
23
24

# File 'lib/nysol/token.rb', line 22

def class2
  @class2
end

#class3 ⇒ `Object` (readonly)

Returns the value of attribute class3.



23
24
25

# File 'lib/nysol/token.rb', line 23

def class3
  @class3
end

#class4 ⇒ `Object` (readonly)

Returns the value of attribute class4.



24
25
26

# File 'lib/nysol/token.rb', line 24

def class4
  @class4
end

#form1 ⇒ `Object` (readonly)

Returns the value of attribute form1.



25
26
27

# File 'lib/nysol/token.rb', line 25

def form1
  @form1
end

#form2 ⇒ `Object` (readonly)

Returns the value of attribute form2.



26
27
28

# File 'lib/nysol/token.rb', line 26

def form2
  @form2
end

#id ⇒ `Object` (readonly)

tokenID(文字列)



18
19
20

# File 'lib/nysol/token.rb', line 18

def id
  @id
end

#next ⇒ `Object`

次のtoken



28
29
30

# File 'lib/nysol/token.rb', line 28

def next
  @next
end

#orgWord ⇒ `Object` (readonly)

オリジナル語



20
21
22

# File 'lib/nysol/token.rb', line 20

def orgWord
  @orgWord
end

#prev ⇒ `Object`

前のtoken



29
30
31

# File 'lib/nysol/token.rb', line 29

def prev
  @prev
end

#word ⇒ `Object` (readonly)

原型語



19
20
21

# File 'lib/nysol/token.rb', line 19

def word
  @word
end

Instance Method Details

#declined? ⇒ `Boolean`

用言かどうか判定

Returns:

(Boolean)

# File 'lib/nysol/token.rb', line 98

def declined?
	return true if class1 == "動詞"
	return true if class1 == "形容詞"
	return true if class1 == "名詞" and class2 == "形容動詞語幹"

	# サ変接続名詞の体言止めは用言とする。
	# 00000001,4,1,2,D,2,消費,消費,名詞,サ変接続,*,*,*,*
	# 00000001,4,1,2,D,3,者,者,名詞,接尾,一般,*,*,*
	# 00000001,4,1,2,D,4,心理,心理,名詞,一般,*,*,*,*
	# 00000001,4,1,2,D,5,も,も,助詞,係助詞,*,*,*,*
	# 00000001,4,2,-1,D,6,急降下,急降下,名詞,サ変接続,*,*,*,*
	# 00000001,4,2,-1,D,7,。,。,記号,句点,*,*,*,*
	return true if class1 == "名詞" and class2 == "サ変接続" and self.next.word == "。"
	return false
end

#ignoreClass? ⇒ `Boolean`

Returns:

(Boolean)

# File 'lib/nysol/token.rb', line 114

def ignoreClass?()
	return true if ["連体詞", "接頭詞", "接続詞", "助詞", "助動詞", "感動詞", "記号", "フィラー", "その他", "未知語"].index(class1)
	#if class1=="名詞" then
	#	return true if class2=="数"
	#	return true if class2=="固有名詞"
	#end
	return true if word == "*"
	return false
end

#show(fp = STDERR) ⇒ `Object`

# File 'lib/nysol/token.rb', line 84

def show(fp=STDERR)
	fp.print "\t\t\tToken id=#{@id}(#{chunk.id})"
	fp.print " #{@word}"      if @word!=""
	fp.print "(#{@orgWord})"  if @orgWord!=""
	fp.print " c1=#{@class1}" if @class1!=""
	fp.print " c2=#{@class2}" if @class2!=""
	fp.print " c3=#{@class3}" if @class3!=""
	fp.print " c4=#{@class4}" if @class4!=""
	fp.print " f1=#{@form1}"  if @form1!=""
	fp.print " f2=#{@form2}"  if @form2!=""
	fp.puts  ""
end

#tokenCsvout(fp) ⇒ `Object`

# File 'lib/nysol/token.rb', line 68

def tokenCsvout(fp)
	fp.print "#{chunk.sentence.article.id},"
	fp.print "#{chunk.sentence.id},"
	fp.print "#{chunk.id},"
	fp.print "#{@id},"
	fp.print "#{chunk.sentence.article.date},"
	fp.print "#{@word},"
	fp.print "#{@orgWord},"
	fp.print "#{@class1},"
	fp.print "#{@class2},"
	fp.print "#{@class3},"
	fp.print "#{@class4},"
	fp.print "#{@form1},"
	fp.print "#{@form2}\n"
end

Class: TM::Token

Overview

Instance Attribute Summary collapse

Instance Method Summary collapse

Constructor Details

#initialize(xmlToken, chunk) ⇒ Token

Instance Attribute Details

#chunk ⇒ Object (readonly)

#class1 ⇒ Object (readonly)

#class2 ⇒ Object (readonly)

#class3 ⇒ Object (readonly)

#class4 ⇒ Object (readonly)

#form1 ⇒ Object (readonly)

#form2 ⇒ Object (readonly)

#id ⇒ Object (readonly)

#next ⇒ Object

#orgWord ⇒ Object (readonly)

#prev ⇒ Object

#word ⇒ Object (readonly)