Class: TM::Sentence

Inherits:
Object
  • Object
show all
Defined in:
lib/nysol/sentence.rb

Overview

文を表すクラス

Instance Attribute Summary collapse

Instance Method Summary collapse

Constructor Details

#initialize(xmlSentence, article) ⇒ Sentence

初期化



39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
# File 'lib/nysol/sentence.rb', line 39

def initialize(xmlSentence,article)
	#----------------------------------
	# 双方向リストの設定
	if article.sentences.size>0 then
		@prev = article.sentences.last
	else	
		@prev = article.dummy
	end
	@next = article.dummy
	@prev.next = self if @prev!=nil

	#----------------------------------
	# 各種メンバ変数の設定
	@article = article
	@chunks = []
	@dummy  = TM::Chunk.new(nil,self)
	if xmlSentence==nil then
		@id = nil  # Articleにおけるdummy Sentence(双方向リストの終端)
		return
	else
		@id     = xmlSentence.attribute("id").to_s
		@text   = xmlSentence.attribute("text").to_s
		xmlSentence.elements.each("chunk"){|xmlChunk|
			@chunks << TM::Chunk.new(xmlChunk,self)
		}
		@entryChunks = []
		#@dChunksIdent = [] # 同定用用言句を含むchunk
		@polarity=0

		@evalPols=Array.new
		@evalEnts=Array.new
		@evalCids=Array.new
	end

	# 130スクリプトでparse失敗時(ex.長過ぎる文章)は、chunkサイズは0なので何もせずリターン
	return if @chunks.size == 0

	#----------------------------------
	# 疑問文かどうか
	@isQuestion=false
	@isQuestion=true if @chunks.last.tokens.last.word == ""
	@isQuestion=true if @chunks.last.tokens.last.word == "" and @chunks.last.tokens.last.prev.word == ""
	
	#----------------------------------
	# chunkのlink(係り先chunk)をID(文字列)からchunkオブジェクトに変更
	# chunkのlined(係り元)chunkオブジェクトを登録
	@chunks.each{|from|
		from.link = @dummy if from.linkID=="-1" 
		@chunks.each{|to|
			if from.linkID == to.id then
				from.link = to
				to.linked << from
				break
			end
		}
	}

	#----------------------------------
	# Entry用言句であれば用言句,格助詞句+用言句を作成
	@chunks.each{|chunk|
		if chunk.setEntry then
			@entryChunks << chunk
		end
	}

	#----------------------------------
	# chunkに関する各種属性を設定する
	@chunks.each{|chunk|
		chunk.setAttributes
	}

	#----------------------------------
	# 逆接接続詞による極性反転フラグを設定
	# 1. 株価は上昇しているが、景気は悪化している。
	# 2. 株価は上昇しているが、景気は回復していない。
	# 3. 株価は下降はしていないが、景気は悪化している。
	# 4. 株価は下降はしていないが、景気は回復していない。
	if @chunks.size>0 then
		@chunks[0].revPol=1
		1.upto(@chunks.size-1){|i|
			if @chunks[i-1].isRevConjunction then # 前chunkが逆接接続詞なら反転
				@chunks[i].revPol = @chunks[i-1].revPol * (-1)
			else                                  # 前chunkが逆接接続詞でないなら前chunkの極性を引き継ぐ
				@chunks[i].revPol = @chunks[i-1].revPol
			end
		}
	end

	#----------------------------------
	# 否定語を伴うchunkもしくは否定語に係るchunkであればdeniedに-1をセットする。
	@chunks.each{|chunk|
		@denied=1
		if chunk.isDenial then
			@denied = -1
		end
		@denied = -1 if chunk.link.isDenial
	}

	#----------------------------------
	# 同定対象用言に印を付ける
	@chunks.last.setIdentChunk

	#----------------------------------
	# 主節(文の最後の用言chunk)
	@chunks.reverse.each{|chunk|
		if chunk.isIdent then
			@mChunk=chunk
			break
		end
	}

	#----------------------------------
	# 逆接接続詞から始まるかどうか
	@startByRevConjunction=false
	@startByRevConjunction=true  if @chunks.first.isRevConjunction
end

Instance Attribute Details

#articleObject (readonly)

Returns the value of attribute article.



23
24
25
# File 'lib/nysol/sentence.rb', line 23

def article
  @article
end

#chunksObject (readonly)

Returns the value of attribute chunks.



24
25
26
# File 'lib/nysol/sentence.rb', line 24

def chunks
  @chunks
end

#dummyObject (readonly)

Returns the value of attribute dummy.



29
30
31
# File 'lib/nysol/sentence.rb', line 29

def dummy
  @dummy
end

#entryChunksObject (readonly)

Entryを含む全chunk



25
26
27
# File 'lib/nysol/sentence.rb', line 25

def entryChunks
  @entryChunks
end

#idObject (readonly)

Returns the value of attribute id.



21
22
23
# File 'lib/nysol/sentence.rb', line 21

def id
  @id
end

#isQuestionObject (readonly)

Returns the value of attribute isQuestion.



30
31
32
# File 'lib/nysol/sentence.rb', line 30

def isQuestion
  @isQuestion
end

#mChunkObject (readonly)

attr_reader :dChunksIdent # 同定用用言chunkへの参照配列



27
28
29
# File 'lib/nysol/sentence.rb', line 27

def mChunk
  @mChunk
end

#nextObject

Returns the value of attribute next.



31
32
33
# File 'lib/nysol/sentence.rb', line 31

def next
  @next
end

#polarityObject (readonly)

文全体としての極性



34
35
36
# File 'lib/nysol/sentence.rb', line 34

def polarity
  @polarity
end

#prevObject

Returns the value of attribute prev.



32
33
34
# File 'lib/nysol/sentence.rb', line 32

def prev
  @prev
end

#startByRevConjunctionObject (readonly)

この文が逆接接続詞で始まっているかどうか



28
29
30
# File 'lib/nysol/sentence.rb', line 28

def startByRevConjunction
  @startByRevConjunction
end

#textObject (readonly)

Returns the value of attribute text.



22
23
24
# File 'lib/nysol/sentence.rb', line 22

def text
  @text
end

Instance Method Details

#caseFrameObject

文章のcorpusとcaseFrame情報を返す



274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
# File 'lib/nysol/sentence.rb', line 274

def caseFrame
	caseFrames=[]
	outChunk=[]
	@chunks.each{|chunk|
		advConj=""
		advConj=-1 if chunk.isRevConjunction # 逆接続詞
		denial = 1
		denial =-1 if chunk.isDenial
		if chunk.phraseType=="用言句" then
			cf=Hash.new
			cf["aid"]     = @article.id
			cf["sid"]     = @id
			cf["cid"]     = chunk.id
			cf["cfFlag"]  = 1
			cf["advConj"] = advConj
			cf["denial"]  = denial

			terms=[]
			terms << [chunk.phraseTok,"用言"]
			outChunk << chunk.id
			chunk.linked.each{|linkedChunk|
				if linkedChunk.phraseType=="格助詞句" and linkedChunk.caseType!="修飾格" and linkedChunk.caseType!="時間格" then
					terms << [linkedChunk.phraseTok,linkedChunk.caseType]
					outChunk << linkedChunk.id
				end
			}
			cf["terms"] = terms

			caseFrames << cf
		end
	}

	# 格フレーム以外の出力
	@chunks.each{|chunk|
		advConj=""
		advConj=-1 if chunk.isRevConjunction # 逆接続詞
		denial = 1
		denial =-1 if chunk.isDenial

		if outChunk.index(chunk.id)==nil then
			cf=Hash.new
			cf["aid"]     = @article.id
			cf["sid"]     = @id
			cf["cid"]     = chunk.id
			cf["cfFlag"]  = 0
			cf["advConj"] = advConj
			cf["denial"]  = denial

			terms=[]
			terms << [chunk.phraseTok,"OTHER"]
			cf["terms"] = terms

			caseFrames << cf
		end
	}

	return caseFrames
end

#entryCsvout(fp) ⇒ Object



266
267
268
269
270
# File 'lib/nysol/sentence.rb', line 266

def entryCsvout(fp)
	@chunks.each{|chunk|
		chunk.entryCsvout(fp)
	}
end

#evalPol(dic) ⇒ Object


辞書に登録されたEntryを含むchunkを検索し、あればchunkEntryの極性を更新する 文の極性(主節(文末のchunk)の極性)を返す。 辞書に登録がなければ0を返す。




199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
# File 'lib/nysol/sentence.rb', line 199

def evalPol(dic)
	evalPols=[]
	evalEnts=[]
	evalCids=[]
	@entryChunks.each{|chunk|
		next if not chunk.isIdent
		# chunkがdicに含まれているかを調べ、含まれていれば##文の極性##および辞書上のentoryを得る
		pols,ents = chunk.getSentencePol(dic)
		(0...pols.size).each{|i|
			evalPols << pols[i]
			evalEnts << ents[i]
			evalCids << chunk.id
		}
	}
	# 投票により文の極性を決定する
	polarity=0
	polarity=vote(evalPols,evalEnts) if evalPols.size>0

	return polarity, evalPols, evalEnts, evalCids
end

#phraseCsvout(fp) ⇒ Object



254
255
256
257
258
# File 'lib/nysol/sentence.rb', line 254

def phraseCsvout(fp)
	@chunks.each{|chunk|
		chunk.phraseCsvout(fp)
	}
end

#phraseEntryCsvout(fp) ⇒ Object



260
261
262
263
264
# File 'lib/nysol/sentence.rb', line 260

def phraseEntryCsvout(fp)
	@chunks.each{|chunk|
		chunk.phraseEntryCsvout(fp)
	}
end

#setCandidate(cand) ⇒ Object

候補辞書candに以下のentryを追加する。

  1. 文中で極性の付いたchunkで、かつentryは極性が付いていないものはchunk極性として追加



242
243
244
245
246
# File 'lib/nysol/sentence.rb', line 242

def setCandidate(cand)
	@entryChunks.each{|chunk|
		chunk.setCandidate(cand)
	}
end

#show(simple = false, fp = STDERR) ⇒ Object



333
334
335
336
337
338
339
340
341
342
343
344
345
346
# File 'lib/nysol/sentence.rb', line 333

def show(simple=false,fp=STDERR)
	if simple then
		fp.puts "#{@text}"
	else
		fp.print "\tSentence id=#{@id}(#{article.id}) ATT:qs#{@isQuestion ?1:0} pol=#{@polarity} "
		(0...@evalPols.size).each{|i|
			fp.print "Eval[#{i}]=#{@evalEnts[i].to_s}(#{@evalSid}-#{@evalCids[i]},#{@evalPols[i]},#{@evalEnts[i].iterNo}) "
		}
		fp.puts "text=#{@text}"
		@chunks.each{|chunk|
			chunk.show(false,fp)
		}
	end
end

#tokenCsvout(fp) ⇒ Object



248
249
250
251
252
# File 'lib/nysol/sentence.rb', line 248

def tokenCsvout(fp)
	@chunks.each{|chunk|
		chunk.tokenCsvout(fp)
	}
end

#updateFromHead(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object



220
221
222
223
224
225
226
227
228
# File 'lib/nysol/sentence.rb', line 220

def updateFromHead(pol, evalPols,evalEnts,evalCids,evalSid)
	return if @polarity!=0 # 評価済みならなにもしない
	@polarity=pol
	@evalPols=evalPols
	@evalEnts=evalEnts
	@evalCids=evalCids
	@evalSid =evalSid
	@chunks.first.evalPolNext(pol)
end

#updateFromTail(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object



230
231
232
233
234
235
236
237
238
# File 'lib/nysol/sentence.rb', line 230

def updateFromTail(pol, evalPols,evalEnts,evalCids,evalSid)
	return if @polarity!=0 # 評価済みならなにもしない
	@polarity=pol
	@evalPols=evalPols
	@evalEnts=evalEnts
	@evalCids=evalCids
	@evalSid =evalSid
	@chunks.last.evalPolPrev(pol)
end

#vote(pols, ents) ⇒ Object


文極性配列(pols)-辞書エントリ配列(ents)から文書極性を評価する




159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
# File 'lib/nysol/sentence.rb', line 159

def vote(pols,ents)
	# 該当する辞書エントリが一つだけであれば、対応する文極性を返す。
	# 多くの場合は、ここで決まる。
	return pols[0] if pols.size==1

	# pos,negの数を計算し、多い方の極性とする。
	pos=neg=0
	pols.each{|pol|
		if pol==1 then
			pos+=1
		else
			neg+=1
		end
	}
	if    pos>neg then
		return +1
	elsif neg>pos then
		return -1

	# 投票で決まらない場合は、辞書の登録順とする。
	# それで決まらなければ配列要素番号の若いentryとする。
	else
		minNo=99999
		minI =0
		(0...ents.size).each{|i|
			no=ents[i].iterNo
			if minNo>no then
				minNo=no
				minI =i
			end
		}
		return pols[minI]
	end
end