バルトの機能体
これって書いてなかったですよね。というわけで書きます。プロップのファンクションとか、グレマス(だっけ?)のstory grammarとかと組み合わせると、いろいろ便利だったりします。
ロラン・バルトは、物語の文(文でなくてもいいんだろうけど)に対して、こういう分類を試みていますす:
機能体 → 枢軸機能体
触媒
指標 → 指標(だったかな?)
情報提供子
枢軸機能体は、登場人物が何を決めたか、何をしたか、何をしなかったかというあたりです。理想的には枢軸機能体だけを抜き出すと、小説とかで誰が何をしたか、どういう話の流れかがわかります。基本的には色気みたいなものはなくなりますが。
触媒は、つなぎの役割をするものです。
指標と情報提供子は、雰囲気を出すようなもの。指標の方は、まぁ実際に雰囲気みたいなもの。情報提供子は、対して結構具体的なものだったりします。長さとか重さとか。
それと、ある文が枢軸機能体だったとしても、それは枢軸機能体以外ではありえないわけではなくて、一つの文がこの4つのいくつかの機能を持つ場合もあります。
さて、必ずというわけではないのですが、文を解析して、その意味表現やらなにやらを得てやると、動詞だとか動詞の種類だとか、あるいは述語の種類として、枢軸機能体とその他のものが結構機械的に分離できます。あー、まぁそうなることが期待できます。
まぁ、そこで分離できそうというのも重要なのですが、ここではついでに動詞だとか述語だとかについて書いてみます。
意味表現での動詞や述語の連鎖の統計モデルを作ったとしたらどうなるでしょうか。あー、文ではないですけど、連鎖についての簡単な例のプログラムも、いずれ公開しますけど、とりあえず、それは置いておきます。
「エッセイ1」の「人格の転写とか、知能の転写とか」(http://book1.adouzi.eu.org/n9931cp/14/)で書きましたが、このような方法で、個人のではないものの、考えの連鎖のモデルを作るとも可能でしょう。たぶん、意味表現の動詞やら述語の連鎖を作り、それぞれの動詞やら述語から、んー、バックワードにその動詞を用いる文を構成する統計モデルも作るとか。
まぁ、それはそれとして。
枢軸機能体とそれ以外は分離できそうっぽいというところに戻ります。すると、多くのコーパスから枢軸機能体となる文を分離し、その連鎖を求めるとかできます。それができると、「何が起きた、あるいは起きなかった」という連鎖が得られます。枢軸機能体はそもそも、それだけを抜き出しても話がだいたいわかるというものですから、モデルがうまく作れれば、「何が起きた、あるいは起きなかった」というような粗筋か、もちっと細かいものをそのモデルを使って出力できるかもしれません。
バルトのこれだけでやるのも方法ではありますが、プロップのファンクションや他のものも合わせて使うと、もちっとそれらしいモデルとか出力が得られるかもしれません。




