どんな情報を抽出するのか

名前の同定

テキスト中の人，組織，場所などの名前や，時間表現，数量表現などを同定する.これらの情報は，テンプレートのスロットの埋める情報となる可能性が高い. また，対象領域に依存しない方法で同定することが可能である.英語に関しては，現在の技術で再現率・精度ともに 97%以上の精度で抽出可能である.

参照関係の同定

テンプレートのスロットに埋めるべき情報は場合によっては代名詞などの照応表現の形でテキスト中に現れる. このような場合は照応解消が必要となる.

部分テンプレートの情報抽出

テンプレート全体を総合評価すると，一つのスロットの誤りが波及して総合的に非常に悪い評価を受けることがある. これを避けるために，このサブタスクでは，テキスト中に出現する実体がもつ一般的な属性を抽出することを目的とする. 例えば，前述の新聞記事の例では，“大丸” や “住友クレジットサービス” などの企業の属性として，企業の名前，種別，場所，関係などが一般的な属性として定義されている. これらの属性を一般的な属性として定義しておき，それらを抽出する技術を確立できれば，企業が関係する他の対象領域のテキストにもその技術を適用して，これらの属性を抽出することが可能となる.すなわち，問題を分割することによって他の対象領域への可搬性を高くすることを目指している.MUC 7 では，これに加えて実体間の関係を抽出するサブタスクも設定されている