Class: TM::Sentence
- Inherits:
-
Object
- Object
- TM::Sentence
- Defined in:
- lib/nysol/sentence.rb
Overview
文を表すクラス
Instance Attribute Summary collapse
-
#article ⇒ Object
readonly
Returns the value of attribute article.
-
#chunks ⇒ Object
readonly
Returns the value of attribute chunks.
-
#dummy ⇒ Object
readonly
Returns the value of attribute dummy.
-
#entryChunks ⇒ Object
readonly
Entryを含む全chunk.
-
#id ⇒ Object
readonly
Returns the value of attribute id.
-
#isQuestion ⇒ Object
readonly
Returns the value of attribute isQuestion.
-
#mChunk ⇒ Object
readonly
attr_reader :dChunksIdent # 同定用用言chunkへの参照配列.
-
#next ⇒ Object
Returns the value of attribute next.
-
#polarity ⇒ Object
readonly
文全体としての極性.
-
#prev ⇒ Object
Returns the value of attribute prev.
-
#startByRevConjunction ⇒ Object
readonly
この文が逆接接続詞で始まっているかどうか.
-
#text ⇒ Object
readonly
Returns the value of attribute text.
Instance Method Summary collapse
-
#caseFrame ⇒ Object
文章のcorpusとcaseFrame情報を返す.
- #entryCsvout(fp) ⇒ Object
-
#evalPol(dic) ⇒ Object
———————————————————- 辞書に登録されたEntryを含むchunkを検索し、あればchunkEntryの極性を更新する 文の極性(主節(文末のchunk)の極性)を返す。 辞書に登録がなければ0を返す。 ———————————————————-.
-
#initialize(xmlSentence, article) ⇒ Sentence
constructor
初期化 ==========================================================.
- #phraseCsvout(fp) ⇒ Object
- #phraseEntryCsvout(fp) ⇒ Object
-
#setCandidate(cand) ⇒ Object
候補辞書candに以下のentryを追加する。 1.
- #show(simple = false, fp = STDERR) ⇒ Object
- #tokenCsvout(fp) ⇒ Object
- #updateFromHead(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object
- #updateFromTail(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object
-
#vote(pols, ents) ⇒ Object
———————————————————- 文極性配列(pols)-辞書エントリ配列(ents)から文書極性を評価する ———————————————————-.
Constructor Details
#initialize(xmlSentence, article) ⇒ Sentence
初期化
39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 |
# File 'lib/nysol/sentence.rb', line 39 def initialize(xmlSentence,article) #---------------------------------- # 双方向リストの設定 if article.sentences.size>0 then @prev = article.sentences.last else @prev = article.dummy end @next = article.dummy @prev.next = self if @prev!=nil #---------------------------------- # 各種メンバ変数の設定 @article = article @chunks = [] @dummy = TM::Chunk.new(nil,self) if xmlSentence==nil then @id = nil # Articleにおけるdummy Sentence(双方向リストの終端) return else @id = xmlSentence.attribute("id").to_s @text = xmlSentence.attribute("text").to_s xmlSentence.elements.each("chunk"){|xmlChunk| @chunks << TM::Chunk.new(xmlChunk,self) } @entryChunks = [] #@dChunksIdent = [] # 同定用用言句を含むchunk @polarity=0 @evalPols=Array.new @evalEnts=Array.new @evalCids=Array.new end # 130スクリプトでparse失敗時(ex.長過ぎる文章)は、chunkサイズは0なので何もせずリターン return if @chunks.size == 0 #---------------------------------- # 疑問文かどうか @isQuestion=false @isQuestion=true if @chunks.last.tokens.last.word == "?" @isQuestion=true if @chunks.last.tokens.last.word == "。" and @chunks.last.tokens.last.prev.word == "か" #---------------------------------- # chunkのlink(係り先chunk)をID(文字列)からchunkオブジェクトに変更 # chunkのlined(係り元)chunkオブジェクトを登録 @chunks.each{|from| from.link = @dummy if from.linkID=="-1" @chunks.each{|to| if from.linkID == to.id then from.link = to to.linked << from break end } } #---------------------------------- # Entry用言句であれば用言句,格助詞句+用言句を作成 @chunks.each{|chunk| if chunk.setEntry then @entryChunks << chunk end } #---------------------------------- # chunkに関する各種属性を設定する @chunks.each{|chunk| chunk.setAttributes } #---------------------------------- # 逆接接続詞による極性反転フラグを設定 # 1. 株価は上昇しているが、景気は悪化している。 # 2. 株価は上昇しているが、景気は回復していない。 # 3. 株価は下降はしていないが、景気は悪化している。 # 4. 株価は下降はしていないが、景気は回復していない。 if @chunks.size>0 then @chunks[0].revPol=1 1.upto(@chunks.size-1){|i| if @chunks[i-1].isRevConjunction then # 前chunkが逆接接続詞なら反転 @chunks[i].revPol = @chunks[i-1].revPol * (-1) else # 前chunkが逆接接続詞でないなら前chunkの極性を引き継ぐ @chunks[i].revPol = @chunks[i-1].revPol end } end #---------------------------------- # 否定語を伴うchunkもしくは否定語に係るchunkであればdeniedに-1をセットする。 @chunks.each{|chunk| @denied=1 if chunk.isDenial then @denied = -1 end @denied = -1 if chunk.link.isDenial } #---------------------------------- # 同定対象用言に印を付ける @chunks.last.setIdentChunk #---------------------------------- # 主節(文の最後の用言chunk) @chunks.reverse.each{|chunk| if chunk.isIdent then @mChunk=chunk break end } #---------------------------------- # 逆接接続詞から始まるかどうか @startByRevConjunction=false @startByRevConjunction=true if @chunks.first.isRevConjunction end |
Instance Attribute Details
#article ⇒ Object (readonly)
Returns the value of attribute article.
23 24 25 |
# File 'lib/nysol/sentence.rb', line 23 def article @article end |
#chunks ⇒ Object (readonly)
Returns the value of attribute chunks.
24 25 26 |
# File 'lib/nysol/sentence.rb', line 24 def chunks @chunks end |
#dummy ⇒ Object (readonly)
Returns the value of attribute dummy.
29 30 31 |
# File 'lib/nysol/sentence.rb', line 29 def dummy @dummy end |
#entryChunks ⇒ Object (readonly)
Entryを含む全chunk
25 26 27 |
# File 'lib/nysol/sentence.rb', line 25 def entryChunks @entryChunks end |
#id ⇒ Object (readonly)
Returns the value of attribute id.
21 22 23 |
# File 'lib/nysol/sentence.rb', line 21 def id @id end |
#isQuestion ⇒ Object (readonly)
Returns the value of attribute isQuestion.
30 31 32 |
# File 'lib/nysol/sentence.rb', line 30 def isQuestion @isQuestion end |
#mChunk ⇒ Object (readonly)
attr_reader :dChunksIdent # 同定用用言chunkへの参照配列
27 28 29 |
# File 'lib/nysol/sentence.rb', line 27 def mChunk @mChunk end |
#next ⇒ Object
Returns the value of attribute next.
31 32 33 |
# File 'lib/nysol/sentence.rb', line 31 def next @next end |
#polarity ⇒ Object (readonly)
文全体としての極性
34 35 36 |
# File 'lib/nysol/sentence.rb', line 34 def polarity @polarity end |
#prev ⇒ Object
Returns the value of attribute prev.
32 33 34 |
# File 'lib/nysol/sentence.rb', line 32 def prev @prev end |
#startByRevConjunction ⇒ Object (readonly)
この文が逆接接続詞で始まっているかどうか
28 29 30 |
# File 'lib/nysol/sentence.rb', line 28 def startByRevConjunction @startByRevConjunction end |
#text ⇒ Object (readonly)
Returns the value of attribute text.
22 23 24 |
# File 'lib/nysol/sentence.rb', line 22 def text @text end |
Instance Method Details
#caseFrame ⇒ Object
文章のcorpusとcaseFrame情報を返す
274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 |
# File 'lib/nysol/sentence.rb', line 274 def caseFrame caseFrames=[] outChunk=[] @chunks.each{|chunk| advConj="" advConj=-1 if chunk.isRevConjunction # 逆接続詞 denial = 1 denial =-1 if chunk.isDenial if chunk.phraseType=="用言句" then cf=Hash.new cf["aid"] = @article.id cf["sid"] = @id cf["cid"] = chunk.id cf["cfFlag"] = 1 cf["advConj"] = advConj cf["denial"] = denial terms=[] terms << [chunk.phraseTok,"用言"] outChunk << chunk.id chunk.linked.each{|linkedChunk| if linkedChunk.phraseType=="格助詞句" and linkedChunk.caseType!="修飾格" and linkedChunk.caseType!="時間格" then terms << [linkedChunk.phraseTok,linkedChunk.caseType] outChunk << linkedChunk.id end } cf["terms"] = terms caseFrames << cf end } # 格フレーム以外の出力 @chunks.each{|chunk| advConj="" advConj=-1 if chunk.isRevConjunction # 逆接続詞 denial = 1 denial =-1 if chunk.isDenial if outChunk.index(chunk.id)==nil then cf=Hash.new cf["aid"] = @article.id cf["sid"] = @id cf["cid"] = chunk.id cf["cfFlag"] = 0 cf["advConj"] = advConj cf["denial"] = denial terms=[] terms << [chunk.phraseTok,"OTHER"] cf["terms"] = terms caseFrames << cf end } return caseFrames end |
#entryCsvout(fp) ⇒ Object
266 267 268 269 270 |
# File 'lib/nysol/sentence.rb', line 266 def entryCsvout(fp) @chunks.each{|chunk| chunk.entryCsvout(fp) } end |
#evalPol(dic) ⇒ Object
辞書に登録されたEntryを含むchunkを検索し、あればchunkEntryの極性を更新する 文の極性(主節(文末のchunk)の極性)を返す。 辞書に登録がなければ0を返す。
199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 |
# File 'lib/nysol/sentence.rb', line 199 def evalPol(dic) evalPols=[] evalEnts=[] evalCids=[] @entryChunks.each{|chunk| next if not chunk.isIdent # chunkがdicに含まれているかを調べ、含まれていれば##文の極性##および辞書上のentoryを得る pols,ents = chunk.getSentencePol(dic) (0...pols.size).each{|i| evalPols << pols[i] evalEnts << ents[i] evalCids << chunk.id } } # 投票により文の極性を決定する polarity=0 polarity=vote(evalPols,evalEnts) if evalPols.size>0 return polarity, evalPols, evalEnts, evalCids end |
#phraseCsvout(fp) ⇒ Object
254 255 256 257 258 |
# File 'lib/nysol/sentence.rb', line 254 def phraseCsvout(fp) @chunks.each{|chunk| chunk.phraseCsvout(fp) } end |
#phraseEntryCsvout(fp) ⇒ Object
260 261 262 263 264 |
# File 'lib/nysol/sentence.rb', line 260 def phraseEntryCsvout(fp) @chunks.each{|chunk| chunk.phraseEntryCsvout(fp) } end |
#setCandidate(cand) ⇒ Object
候補辞書candに以下のentryを追加する。
-
文中で極性の付いたchunkで、かつentryは極性が付いていないものはchunk極性として追加
242 243 244 245 246 |
# File 'lib/nysol/sentence.rb', line 242 def setCandidate(cand) @entryChunks.each{|chunk| chunk.setCandidate(cand) } end |
#show(simple = false, fp = STDERR) ⇒ Object
333 334 335 336 337 338 339 340 341 342 343 344 345 346 |
# File 'lib/nysol/sentence.rb', line 333 def show(simple=false,fp=STDERR) if simple then fp.puts "#{@text}" else fp.print "\tSentence id=#{@id}(#{article.id}) ATT:qs#{@isQuestion ?1:0} pol=#{@polarity} " (0...@evalPols.size).each{|i| fp.print "Eval[#{i}]=#{@evalEnts[i].to_s}(#{@evalSid}-#{@evalCids[i]},#{@evalPols[i]},#{@evalEnts[i].iterNo}) " } fp.puts "text=#{@text}" @chunks.each{|chunk| chunk.show(false,fp) } end end |
#tokenCsvout(fp) ⇒ Object
248 249 250 251 252 |
# File 'lib/nysol/sentence.rb', line 248 def tokenCsvout(fp) @chunks.each{|chunk| chunk.tokenCsvout(fp) } end |
#updateFromHead(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object
220 221 222 223 224 225 226 227 228 |
# File 'lib/nysol/sentence.rb', line 220 def updateFromHead(pol, evalPols,evalEnts,evalCids,evalSid) return if @polarity!=0 # 評価済みならなにもしない @polarity=pol @evalPols=evalPols @evalEnts=evalEnts @evalCids=evalCids @evalSid =evalSid @chunks.first.evalPolNext(pol) end |
#updateFromTail(pol, evalPols, evalEnts, evalCids, evalSid) ⇒ Object
230 231 232 233 234 235 236 237 238 |
# File 'lib/nysol/sentence.rb', line 230 def updateFromTail(pol, evalPols,evalEnts,evalCids,evalSid) return if @polarity!=0 # 評価済みならなにもしない @polarity=pol @evalPols=evalPols @evalEnts=evalEnts @evalCids=evalCids @evalSid =evalSid @chunks.last.evalPolPrev(pol) end |
#vote(pols, ents) ⇒ Object
文極性配列(pols)-辞書エントリ配列(ents)から文書極性を評価する
159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 |
# File 'lib/nysol/sentence.rb', line 159 def vote(pols,ents) # 該当する辞書エントリが一つだけであれば、対応する文極性を返す。 # 多くの場合は、ここで決まる。 return pols[0] if pols.size==1 # pos,negの数を計算し、多い方の極性とする。 pos=neg=0 pols.each{|pol| if pol==1 then pos+=1 else neg+=1 end } if pos>neg then return +1 elsif neg>pos then return -1 # 投票で決まらない場合は、辞書の登録順とする。 # それで決まらなければ配列要素番号の若いentryとする。 else minNo=99999 minI =0 (0...ents.size).each{|i| no=ents[i].iterNo if minNo>no then minNo=no minI =i end } return pols[minI] end end |