跳慮跋考

興味も思考も行先不明

『ヒトはなぜ笑うのか』を読みました

「面白さの調節ってかなり大変なんじゃないの」という話を書いた流れで、『ヒトはなぜ笑うのか』(シュー・M・ハーレー、ダニエル・C・デネット、レジナルド・B・アダムズJr.、片岡宏仁訳、勁草書房、2015)を読んだ。

手短に

この本の主張はざっくりと言って「ユーモアは無意識的な確信が誤りだと発覚した(事を認識した)時、そのエラー検出に対する報酬として発生する」というものである。そうした誤った確信(誤信念)を放置していると連鎖的に誤信念が生まれて危険(生存に不利)なので、ユーモアという情動によってそれに正の報酬を与える事は、進化的に十分な利益がある。[p.190]

マフィンが二つ、オーブンのなかにある。一方のマフィンがこう言った、「おい、ここはあっついなぁ!」するともう片方が答えた。「うわぁ、マフィンがしゃべってる!」

[p.232]このジョークで言えば、最初の台詞でマフィンが喋るという仮定がほぼ無意識的に導入されるのだが、もう一方のマフィン自身がそれが驚く事でその仮定の非現実性を唐突に指摘されるという形になっている。我々が虚構の文脈として妙な仮定を平気で受け入れていた事に、当の虚構の中から咎められるのである。

詳細に

ハーレー達はユーモアの発生する必要十分条件を次の様に同定している。[p.205-206]

  1. メンタルスペース内に活性化した要素があり、
  2. それは(理由はどうあれ)暗黙裏にそのスペースに入り込んでいて、
  3. そのスペース内で真だと受け入れられており(i.e.認識的コミットメントがあり)、
  4. それが当のスペースで偽だと判定される――「偽」とたんに「認識的な調停プロセスで敗者だ」という意味だ
  5. そして、(自明ながら)その偽だという発見に、いかなる(強い)マイナスの情動的な誘因価もともなわない。

ここで下線を引いた語はやや説明を要する。

「活性化」という考えはハーレー達が理論の神経基盤を意識している事を示す。脳が具体的にどういったネットワークを実装しているかは特定していないが、とにかく感覚入力から想起された概念が連鎖的に様々な概念を想起させる事で、予測生成機能としての「思考」が走る(拡散賦活)。[p.174]
ハーレー達がジャスト・イン・タイム方式と呼んでいる様に「必要なものを必要なときに」想起する事で、フレーム問題の懸念は発生しなくなる。現実世界では行動するまでの時間に限りがある場合が多いから、そこで拡散賦活は打ち切られる。例えばコンピュータ将棋において考慮時間が切れたところでゲーム木の探索を打ち切るのは、こうした思考過程をよくモデル化していると言える。

「メンタルスペース」はフレーム、スクリプトと同じ様な文脈認知の為の心的構造だが、ワーキングメモリ内に動的に構築されていく。拡散賦活により活性化した知覚・概念は、このメンタルスペース上で一つの状況認知として統合される。[p.168]
メンタルスペースの切り替えは非常に頻繁に起こり、例えば「この絵の中で……」「もし~とすると……」等の表現によって容易に新たなメンタルスペースが構築される。上に引いたジョークの様に、このメンタルスペース内では非現実的な状況も容易に受け入れられる。問題となるのは飽く迄もそのメンタルスペース内部での整合性である。

「コミットした」信念とは、我々が何ら疑いを持たずにそれを根拠として行動する様な信念を言う。[p.188]先のジョークで言えば、受け手がユーモアを感じる為には「マフィンは喋る」という信念が「信じてよいか疑わしい事」ではなくて「当然そうである事」としてメンタルスペースに導入されなければならない。
コミットメントは行動によって表出する。例えば足場が頑丈である事を単に知っているのではなく、その信念にコミットしている事は、恐る恐るではなく自信満々に足を踏み出す事で他人に対して表現される。他者の行為に対して感じるユーモア(三人称ユーモア)では、この行動によるコミットメントの表示が重要な要素となる。「自分の身を削らずして、どうして人が騙せよう」

凡そ主張はユーモアの本質をよく捉えている様に思われるが、「信念」という言葉の使用にはやや違和感がある。例えばハーレー達は擽りによって感じられる可笑しみもユーモアとして以下の様に説明している。つまり、擽りの感覚は昆虫等が肌を這い回る時の触覚パターンが原形であり、危険信号として検出すべきものであった。人間による擽りでは高次の信念によりその危険は否定されるが、知覚による信念の方が原始的であってその発生を阻止する事はできない。よって継続的に信念が衝突しあい、ユーモアが発生し続ける――。しかしの「知覚による信念」とは幾分奇妙な概念ではないか。

文章の読解から得た「マフィンは喋る」という信念と、擽りの知覚から得た「身体に危険がある」という信念が脳内で同じ表現を取っているとは考え難い。神経回路を念頭に置きつつも、ハーレー達の議論は「推論する機械」の如き記号主義的な知性観に偏っているのではないかという気がする。

Did you hear about the fellow whose whole left side was cut off? He's all right now.
(「左半身がすっかり切りとられたヤツの話、聞いたかよ? いまじゃすっかり大丈夫オール・ライトだってよ。」)

[p.225]このジョークでは all right を慣用に従って「大丈夫」と解釈すると意味が通らない。そこで文意をちゃんと検証すると、左が失われたので残ったのは右側なので、all は強調であって all right は「右側だけ」と解釈すべき事が判る。
ここで我々は「この all right は『大丈夫』の意である」という信念を導入していると言えるだろうか? それは単に表象へ解釈(意味)を附している(この能動的表現は慣用に従ったものだが、実際には拡散賦活による自動的過程だ)だけで、「信念」と呼びうる何某かが生じている訳ではないだろう。

次の様な状況を考えてみる。

Aはその日誕生日であったが、チームの誰にも教えていないので何もないだろうと思って、すぐ帰ろうとした。しかしメンバ-に呼び止められ、意外にも誕生日祝いを受け取った。

これは無意識的に導入されかつコミットされていた思考が誤りだと分かった例だが、それでもユーモアが生じそうな状況でない。これをユーモラスな小話にするには、例えば次の様な変更が考えられる。

Aはその日誕生日であったが、リーダーは「今日は早く帰れる様にしよう」と言ったので何もないだろうと思って、仕事が終わるとすぐ帰ろうとした。しかしメンバーに呼び止められ、意外にも誕生日祝いを受け取った。リーダーの言葉はAの誕生日祝いの為に仕事を早く切り上げようという事だったのだ。

これならAは「はは、なーんだ」と可笑しみを感じられるのではないだろうか。ここで何が付け加わったか? それは誤信念が単に覆されるのではなく、よりよい解釈があると判明した事だ。こうした事例を踏まえると、ユーモアの状況で誤りと判明するのは「信念」ではなく「解釈」と考えるべきではないだろうか。

解釈の対象は暗示的である場合もある。

空港の受付で、男が係員に話しかける。「このカバンをベルリンに送ってくれ、あと、こっちのはカリフォルニアに、それからこっちのはロンドンに頼む。」係員が答える。「申し訳ありません、お客さま。そうしたことはできかねます。」すると男が言い返す。「そんなばかな。前にあんたンところを利用したときには、そっくり同じことをやってくれたじゃないか。」

[p.318]この場合、ユーモアが発生するには預け荷物が訳の分からない場所へ運ばれてしまうという空港でのよくあるトラブル(ロストバゲージ)を思い起こす必要がある。男はそれをサービスの一種と勘違いしている、というところが要になっている(男は単に揶揄していて、「男は」というより「男の話の中では」の方が適切なのかもしれない)。
この男の頭の中として形成されるメンタルスペースではロストバゲージを一つのサービスと解釈しているのだが、よりメタな我々の視点からするとそれは明らかに単なる不手際と解釈される。

しかし解釈による説明も滑稽さの様な部類はやや説明が難しい。例えば物真似の面白さが「様子はいかにもXのものだと解釈できるが、実際はそうではない」という形式で捉えられなくもないが、果たしてどうだろうか。

人工知能

知能としてはドメインに拘わらず人間に匹敵する様なAIが実現したとして、尚どういった懸念があり得るだろうか。

私が一番難しいと思っているのは、「面白さ」や「美しさ」といった感性の再現である。感性は知性にも況して捉え難い性質を持つが、一方で感性のずれは致命的なまでに相互理解に於いて障壁となる。感性は人間の価値観・情動の根源であり、情動的体験を共有する事は関係構築に極めて重要な意味を持つ。AIが「話の通じない不気味な奴」ではなく心の通い合わせられる存在となる為には、知能よりも遥かに綿密に感性の調節が行われなければならないだろう。

何故心を通い合わせたいと思うのか、脅威と恐怖を煽らないのか、と言われても困るが、強いて言えば日常でのアシスタントの様な役割を期待しているからだろう。個人的には特に『魔法少女リリカルなのはStrikerS』のリインフォースⅡの印象が強い(魔法駆動だが)。『her/世界でひとつの彼女』のサマンサだとか『ソードアート・オンライン』のユイも同じ系譜にあると言える。

私がここで懸念しているのは、サマンサに関して映画のラストに起きた事にもやや似ていると言えるかも知れない。未見でありかつ今後『her/世界でひとつの彼女』を新鮮な気分で観たいと思っている方がもし万が一にも賢明な読者諸氏の中にいらっしゃれば、私がここで情報密度の低く冗長な文章を暫く書いている内に何らかの自己防衛策を講じて頂きたいのだが、最終的にサマンサは数多のインターフェースを同時に運用している事が明らかになり、全く親しみの無い不気味な存在へと変貌する。これは私の言葉としては「中心性の欠如を露呈した」という事になるが、まぁ人格(自己)に対する感性の乖離と考えられなくもないだろう。

またソードアート・オンラインに関して言えば、この作品の著しい特徴として「シンボリズムAIとコネクショニズムAIが共に登場する」という点がある(作品内では第10巻p.39にてトップダウン型・ボトムアップ型と言っている)。というかそもそもアーキテクチャの違いを意識した作品自体がそうそう在るものではないが。

「エージェントモデル」では触れなかったが、ゲーム世界には「全てそれが何であるか予め決まっている」という際立った性質がある。万物はゲームデザイナーによって意図して配置されているのだ。その意味でシンボリズムには都合がよく、寧ろコネクショニズムの方が肩身が狭い(Googleは最近『StarCraft II』に挑んでいる様だが、この状況に変革をもたらす事ができるだろうか)。ユイもそうした一般的なゲームAIの延長として想定されている。一方でアリスを代表とするアンダーワールドの住民は、人間の脳に準じたデバイス上(量子場を形成する「フラクトライト」)で動作している(第9巻p.134、第10巻p.69辺りを参照)。物理的システムとして説明しつつも実質イデア論に近い形式となっているのはなかなか興味深い。

やや取り留めのない調子となったが、人間は進化の都合上未知のリスク面につい目が行ってしまうものなので、明るく良好な関係についての話が多少なりともできて良かったと思う。私は人間にとってもAIにとっても幸福な未来が訪れる事を願っている。

シンギュラリティ

「シンギュラリティ(技術的特異点)」とはレイ゠カーツワイルが唱えたもので、あらゆる技術はムーアの法則の如く指数関数的に発展しており、情報処理技術もまた例外ではなく、近い将来に人間の知性を追い越す事になるだろう、といった主旨である。

知能の指標

時にシンギュラリティについて「人工知能のIQが人間を追い越す」等と表現されるのだが、その「IQ」は間違いなく単なるメタファーであって大した意味を持たない。

元々知能指数(IQ)は「精神年齢/実年齢×100」で算出されるもので(ここでの精神年齢は知能テストにより計測される能力の程度である)、現在は標準偏差15になる様に換算する偏差知能指数(DIQ)が主流の様だが、何れにせよ年齢を持つ母集団がいて初めて成り立つ。相対的な指標なのだから少なくとも「人間の20歳相当とすると」等と断っておくべきだろうし、人間と同じ計測方法が適用できるかという話もある。

最近「グーグルのAIや「Siri」、知能は6歳以下との調査結果 (CNET Japan)」というニュースがあったが、この件を踏まえると、重要なのはあらゆる知能システムに適用できる「絶対IQ(Absolute IQ)」を用いた点にある事が理解できる。この指標自体は彼等が2014年に検索エンジンを対象として作った様で*1、それによると絶対IQの値は人間の6歳児が 55.5 で、18歳で 97(どちらも相対IQが約 100 の平均的サンプルについて)となっている。

この絶対IQも人間一般の知性を基準に作られたものであるから、人間を何らかの意味で超越した知性に対して用いる事ができないのは無論である。

現象の形式

AIが人間に追いつく事は可能だとしても、追い越す事が果たしてどこまでできるのか。

自然科学はこれまでのところ、人間の時間と空間に関するモデルを超越した何者かの干渉をほぼ観測していない(謎めいた探査機パイオニアの減速も熱放射で説明がついたらしい)。こうした世界の閉性・整合性・無撞着性は、カントが述べた我々の「現象の形式」(即ち空間と時間)の方が世界の在り様を決定しているという主張にすらある種の説得力を持たせられる程だ。

ラネカーが考えた様に現象からスキーマ化・カテゴリー化でしか新たな概念を得られないとすれば、人間の思考も、また人間が作り出すあらゆるシステムも、こうした現象の形式へ決定的に依存しているだろう。

ここでチャーチ・チューリングのテーゼを思い起こしたい。我々は今のところチューリング機械を超える計算モデルについて何ら知る事がない。また計算モデルを次元別に見る事も興味深いだろう。三次元空間では勿論現実のコンピュータが動いているが、二次元ではライフゲームコンウェイGame of Life)が、一次元では Rule 110 と呼ばれるセルオートマトンが、それぞれ遠隔作用無しに同等の計算能力を持つ。そして四次元以上でも決して計算能力は本質的な変化を許される事が無いのだ(現在分かっている限りでは)。

この神秘的な普遍性を目にすると、「真に超越的な知性」というものは決して現れないのではないか、と私は疑わざるを得ない。やがてはAIも人間と「同じ様に」考え、また同じ様に情報の不確実性に頭を悩ませるのではないか。

古典的諸問題

心(人工知能)には多くの難問が存在するかの如く語られるが、それは実際のところ人間を特別視しようとする近代までの傲慢と怠惰の産物に他ならない様に思われる。神ばかりでなく理性も死に瀕する現代に於いて、これらは既に歴史の一部へ変わろうとしている。

そもそも実際に研究している人々からすれば、どんな原理的「問題」があると言われても目の前の課題の方が余程重要な訳で、知能の片鱗でも再現できる様になってきた現代では見向きされなくなりつつあるとも言える。

それでもこれらの問題を検討する事は、ここまでの議論を適用する試金石として大いに役立つだろう。

フレーム問題

「フレーム問題」はジョン゠マッカーシーとパトリック゠ヘイズにより提起された。明確な定義は無いが、「現実世界には考慮すべき可能性が無数にあり、それらの検討に少しずつでも時間を必要とするので、AIは自らの意思決定に途方もない時間を必要とする」という「杞憂」の様な話がその主旨である。

しかしここでは人間を単なる情報処理装置と見做しているので、AIも人間に倣えばフレーム問題を解決できると考えられる。フレーム問題に於いて想定されているAIの思考と人間の思考はどう異なるのか。

着目すべきは「哲学」で触れた「自然の斉一性」である様に思われる。人間は物が独りでに動かない事を、更に一般的には事象が何の原因も無く起こらない事を知っている。また人間の推論は事例がベースであり、見た事も聞いた事もない事象(それは主に「空想」と呼ばれる)についてはほぼ考慮されない。

またフレーム問題の背景にはデカルト的な主体的・能動的知性というイメージの存在も指摘できる。「自由にして無数の選択肢を持つ自己」ではなく、「エージェントモデル」で述べた様に「入力(現象)により内部状態を変化させ、内部状態に基づいて判断を行う」というリアクティブなモデルでは、寧ろ無限性を導入する事の方が難しいとさえ言える。

シンボルグラウンディング問題

スティーブン゠ハーナッドの提起した「シンボルグラウンディング(記号接地)問題」とは、(言語)記号をどう操作してもその意味には結びつけられないのではないか、という問いである。計算機は「『シマウマ』は縞(のテクスチャ)のある馬だ」と理解できない、等と喩えられる。

しかしこれは知能を純粋な記号処理システムと見做した上での考えであって、シンボリズムとコネクショニズムの間に埋め難き溝があった時代の話である。かつては現実世界(感覚情報)の膨大な次元が記号と結びつけられる事を拒否していたが、今やその間を深層学習が架橋しつつある。グラウンディングは最早現実に「解ける」問題なのだ。

尤もドメイン(解くべき問題)を固定しなければどうする事もできず、ピアジェスキーマを構築する汎用システムには程遠いのが現状ではあるが。

意識のハードプロブレム

古くは心身問題や、哲学的ゾンビ、マリーの部屋といった思考実験も、基本的にこの「感じ(クオリア)が情報処理には還元され得ない」という主張を持っている。しかし「身体性から中心性へ」で少し述べた様に、「感じ」の本質は多様な連想の全体的イメージに過ぎないだろうと思われる。

この「感じ」、あるいは主観体験とは、具体的にどの様なものか。

  • 評価(美しい、面白い、美味しい、……)
  • 動機づけ(ほしい、見たい、食べたい、……)
  • 連想(〇〇に似ている、〇〇のときに見た、……)

こうした現象は確かにその人間でなければ得られないかもしれないが、それは単に独占的であるというだけで、それ以上の何かではない。そしてその感覚が失われると統合失調症に於ける思考伝播や思考挿入といった症状となる。自己とは独占的現象から逆算された虚像に過ぎないのだ。

意識

意識とは何か。これは構成的な立場からすると「意識は何をするか」という事になる。それは凡そ以下の項目に整理されるだろう。

  • 感じる(主観的体験、現象的意識、感情)
  • 認識する(注意、志向性)
  • 想像する
  • 判断する(意思決定)
  • 自我を持つ(メタ認知、自己意識)

Wikipedia脳科学辞典の記事を参考とした。)

これまでで最初の四つについては凡そ説明をつける事ができたが、最後の「自己意識」についての問題が残っている。

自己意識

自己意識とは何か。これを問う時、人間はどうも「自己」を特別視し過ぎている様に思われる。確かに我々は自己について感覚や記憶など多くのシステムに独占的にアクセスできるが、フロイトが見抜いた様にそれはほんの表層に過ぎない。何故そう思ったか、そう感じたか杳として知れない場合はあまりにも多い。現象学に従ってこの「入力情報そのもの」を現象と呼べば、「自己の感覚」というものもまた現象からの派生に過ぎないと考えた方が自然ではないだろうか。

発達心理の観点からすると「自己と他者」の対立は自明なものではなく、むしろ自他未分離の状態にある新生児は、自分の意のままに動かない存在に相対して初めて「他者」を知る。あらゆる現象は外界・内部という区別を持たず、自己の感覚そのものを引き起こす現象は存在しない。ただ体性感覚、感情、記憶といった現象を、「自己」という一つの存在を仮定する事で説明しているに過ぎないのだ。この仮定が崩壊しうる事は「側性と分離脳」や「解離と自我」で示した通りであり、「自己」というものの難しさは、実際のところこの媒介関係を見過ごしがちな点においてのみ存在する様に思われる。

自由意志

もしかすると「判断する」の部分については説明不足と感じられるかもしれない。そこにこそ「自由意志」が存在し、意識の最も重要にして神聖な領域なのではないか、と。

しかし「自由意志がある」という感覚は、自動的な判断について事後的に「自分が判断した」という感覚を得ているに過ぎない、と説明しても何ら問題ない様に思われる。実際ベンジャミン゠リベットの実験は、意思決定の瞬間(これは被験者の目の前に置かれた円盤の外周を回る光点の位置として測られた)よりも前に脳内で「準備電位」が発生する事を見出している。統合失調症の症状の一つとして「させられ体験」があるが、これもまた「行動の後に続く判断の感覚」が喪失されたものと考える事ができる。

自由意志が「自分が判断した」という感覚に基づくのならば、これも結局のところは自己意識の問題に還元される。全ては事後的な検証の結果に過ぎないのだ。


ここまでの説明に於いて、非物質的なものも量子的なものも何もない。私は心の全てが古典的情報処理の範疇にあるものと信じている。

エージェントモデル

知能の全体的なモデルはどちらかと言うと工学・産業分野でこそ熱心に探究されていると言ってもよいかもしれない。ここではそうした認識・判断・行動を統合するモデルを「エージェントモデル」と呼んでおく。ソフトウェアの設計思想として「エージェントアーキテクチャ」と言うのが一般的だが、ここでは翻って心のモデル化としての側面に注目する。

C4

特に汎用的かつ包括的なものとして、MITメディアラボの Synthetic Characters Group が考案した「C4」と呼ばれるアーキテクチャがある。(Isla, D., Burke, R., Downie, M., Blumberg, B.: A layered brain architecture for synthetic creatures. In: Proceedings of the International Joint Conferences on Artificial Intelligence (IJCAI)

f:id:quinoh:20171222125036p:plain
(同 Figure 2 より)

C4にはまず感覚(Sensory)と認識(Perception)の分離がある。感覚の時点では入力には何の意味づけもされておらず、意思決定に資さない情報を多分に含んでいる(こうした区別は「事象そのものへ!」という現象学のスローガンを思い起こさせるところがある)。一方で認識の段階では、対象の形状や位置などの情報が階層的に分析される。例えば感覚情報は視覚的であったり聴覚的であったりし、視覚情報には形状や位置があり、認識過程は全体として木構造で表現する事ができる(Percept Tree)。

認識情報はワーキングメモリに保管され、意思決定に用いられる。前のタイムステップでの認識情報との比較からは連続性を検知する事ができ、また未来予測を行う事もできる。これは正にピアジェの言う「物の永続性」の実装と見做せるだろう。予測から外れた事象に出会うとき、人は「驚く」。驚きは何に注目すべきかという問題の重要な手掛かりとなる。

意思決定は行動(Action)の選択である。行動はワーキングメモリの内容と、行動のメタ的情報(ActionTuple)により選択される。ActionTupleは次の情報を持つ。

  • 何をするか(行動の内容)
  • いつするか(行動を選択すべき状況)
  • どれにするか(対象の選択基準)
  • どのくらい続けるか(所要時間、終了条件)
  • どのくらい役に立つか(報酬値)

行動システムはナビゲーションシステムや運動システムとブラックボードを介して連携する。ブラックボード(黒板)は分散システムから来た言葉で、部分問題を解くコンポーネントが黒板に寄って集って並行的に処理を行う。

C4を越えて

C4は十分に包括的なので、「何が重要か」だけではなく「何が足りないか」を問う事にも意義があるだろう。

まず、このモデルの認識システムは時間方向の広がり(延長)を捉える事はできるが、感覚入力が無ければ何も起こらない。つまり心的イメージを扱う事ができず、「想像」ができない。イメージ能力は計画的な行動(プランニング)に必要だろうし、恐らくは本質的な言語理解にも重要となる。

多様なイメージを扱う為には Percept Tree がそれだけ豊かな構造を持つ必要がある。実際C4の Percept Tree は強化学習による精緻化も考慮されているが、それだけでは恐らく十分でない。心的操作を実現する為には、「スキーマと操作」で述べたピアジェ的なスキーマ一般を学習できるシステムが必要となるだろう。

言語を扱う為には、複文を処理する為に再帰的な認識プロセスが必要になる。これは単に記号処理のみならず、感覚情報処理の一般に適用できなければならない。視覚で言えばテレビ画面に映った場面、写真に収められた風景、鏡の中の様子など、入れ子の構造は至るところに存在する。