2026/02/13号 2面

DHSSコロキウム「『文学』を読む/書く方法 デジタルと世界文学」レポート

DHSSコロキウム「『文学』を読む/書く方法 デジタルと世界文学」レポート 報告=須田永遠/橋本健広/日比嘉高/ホイト・ロング/秋草俊一郎  加速するグローバル化とデジタル化の波は、文学研究に何をもたらすのか。二〇二五年一二月一〇日、名古屋大学にて開催されたDHSSコロキウム「『文学』を読む/書く方法 デジタルと世界文学」は、こうしたアクチュアルな問いへと応答する試みであった。  フランコ・モレッティが国民文学の枠を超えた「世界文学」のプログラムを実現するために導入した計算機による読解=「遠読」は、既存の読みのモードに揺さぶりをかけたが、近年の、かつてない量と深さで自然言語を扱うことのできる大規模言語モデルの普及は、私たちの「読む/書く」という営みをどう変えるだろうか。正典の解体、ビッグデータとしてのテクスト、そしてAIとの共創――。  これらの論点をめぐり、最前線で実践を行ってきた五名の研究者による刺激的な対話の記録をここに報告する。 (記事構成=須田永遠・写真提供=原田そら) ■数理的に読む――直観を問いなおすものとしてのデジタル技術 須田永遠  本発表では、計算機を用いてテクストを読解する=「数理的に読む」というアプローチが、文学研究における「直観」をいかに問いなおすか、について論じた。個人の知識や価値観に依存する人間の読書に対し、計算機やAIを「異質な読者」として招き入れることは、主に二つの側面で我々の知を再考する契機となりうる。  第一は「直観の検証」という側面である。自身の研究から、Wikipediaの影響関係データから二〇世紀フランス思想家のネットワークを構築・分析した結果、ドイツ哲学からの強い影響という従来の思想史的通念が、中心性という指標で定量的に裏付けられた事例を報告した。第二の側面は「直観の意識化」である。ParkらによるWikipediaの記述バイアスの可視化や、Sapらによる「記憶と想像」の物語構造の違い(予測可能性)の研究を紹介し、これらの研究が、人間が意識せずに行う「読み」や「語り」を、計算可能な手続き(アルゴリズム)へと翻訳する過程で、我々が自明としてきた概念の構造を浮き彫りにすることを論じた。結論として、あるDH研究者の言葉「学問のデジタル化とは『お引越し』である」を借用し、デジタル技術の導入は、慣れ親しんだ人文学の「家財道具(方法論)」の「棚卸し」を迫るものであり、自身の研究基盤を批判的に再構築する実践であることを述べた。 ■大規模言語モデルの文学研究への適用可能性――影響やインターテクスチュアリティは分析できるか 橋本健広  文学の分析研究、特に精読にかかわるテクスト間の影響(具体的な語句や文のまとまりに互いに関連があること)やインターテクスチュアリティの分析に大規模言語モデルは活用できるだろうか。モデルは計算と読みの関係性にどのように寄与するだろうか。この問題に対処するため、二つの試みを行った。一つは文学テクストの影響分析を生成AIに行わせ、その出力を検討することである。もう一つは影響のデータセットを作成し、GPTやBERTをファインチューニングして、人間の判断と同じ出力が生じるかを調べることである。  一つめの調査では、商用GPTが出力する影響のパターンや使用した外部資料、分析の妥当性などを二〇回試行して調べた。その結果、幻覚や確率の誘導がみられ、事実上の分析が行われていないという問題はあるものの、影響があるテクストどうしの分析は一定程度の有効性がみられた。機械支援により人間の判断に役立てることは有効であると考えられる。  二つめの実験では、文学テクストの注釈から四〇四件の影響のデータセットを作成し、モデルを調整した。双方ともわずかながら改善が見られ、人間の判断への近寄りが見られた。データセットの量を増やすことで人間の判断に近づけられるだろう。  計算と読みの関係性を考えた場合、文学テクストの精読に関しては、複雑さを保つ計算の仕組みといった異なる種類の単語埋め込みが必要となると考えられる。今後は批判的なモデルの活用が期待される。 ■TEIタグ付けで小説を読み直す――夏目漱石の長篇小説の場合 日比嘉高  日比は、TEIを用いてタグ付けを行った夏目漱石の長篇一一作品について、どのような分析が可能なのかを報告した。前半においては、複数作品を横断的に比較分析する遠読的なアプローチをとった。今回のTEIタグ付けは山岸郁子、嚴仁卿とともにJPPの支援を受けて行ったプロジェクトだが、一般的なタグに加えて「解釈タグ」を設定している。これを足がかりにすることにより、たとえば 「こころ」「坊つちやん」「抗夫」「草枕」一万字あたりの解釈タグ出現頻度や、長篇一一作品における解釈タグのヒートマップ(頻度)、同一一作品の会話文字数の比較(平均値と中央値)などが示せる。後半は、量的な解析を超えて、いかに精読に踏み込めるかという課題を掲げ、「草枕」の読解を試みた。やはり解釈タグを起点にし、「芸術」「身体」「感情」「旅」などのタグがどの章でどれだけ使われているかをグラフ化し、変動を観察した。その結果、最終章における「旅」タグの動きが他の多くのタグの動向と異なっていることがわかった。最終章における「旅」にあらためて注目することで、「草枕」の読み直しにつながりうるという見通しを提示した。 ■文化的なエージェントとしての大規模言語モデル ホイト・ロング  本発表では、大規模言語モデルに関する三つのプロジェクトを紹介する。それぞれが異なる視点からLLMを「文化的エージェント」として捉え、人間の文化との関わりを検討する研究である。流暢で人間らしい言語出力を生成する能力によって、LLMは人間の意味生成プロセスに組み込まれ始めている。意図や意識の有無にかかわらず、このプロセスに統合されつつある限り、すでに「文化的エージェント」の役割を果たしていると言える。文学への影響を理解するため、私はLLMを作家、指導者、読者として捉える共同研究に取り組んでいる。第一のプロジェクトでは、一〇一人の作家をLLMでシミュレートし創作させた。LLMは社会的多様性の重要性を語るものの、実際の文体では表現できず、表面的な配慮に留まった。第二の実験では、LLMに八〇〇の小説の一節を評価させた。両モデルとも男性やプロ作家の作品を高く評価し、既存の文学界の美的ヒエラルキーを内面化していることが明らかになった。第三の実験では、詩の精読におけるLLMの影響を調査した。AIは全員の成績を向上させたが、経験者は満足度が低く、未経験者は楽しみと自信が増した。これらは初歩的な研究であり限界もあるが、LLMを文化的エージェントとして理解するには人文学の知識に基づいた実証的研究が不可欠である。こうした研究は、LLMの強固な理論の確立につながるだけでなく、創造的活動における人間とLLMのより良い関係の在り方を選択することを可能にする。 ■外国文学の正典形成――出版、世界文学全集、教科書 秋草俊一郎  外国文学についての統計は、過去さまざまな分野で、ばらばらな目的のために行われ、利用されてきた。今回、そうしたデータを紹介しながら、外国文学の正典がいかに作りあげられてきたのかを、出版・世界文学全集・教科書の三つの角度から検討した。日本における文芸翻訳出版は、明治期には刊行点数では一時創作をもしのぐほどだった。戦後すぐの時期は翻訳の刊行点数が新刊の二割ほどもあり、文芸翻訳の存在感は強かったが、その中心は仏文学だった。五〇年代中盤以降、英米のエンタメ・ジャンル小説の翻訳が盛んになり、他の各国文学と分量の面で大きく水をあけていく。他方で出版不況の影響もあり、現在では新刊に占める割合は六パーセントほどで最早日本は翻訳大国の地位を失った。このような出版の流れは、世界文学全集にも影響をあたえている。戦後、全集ブームの火付け役になった新潮社の『現代世界文学全集』では、仏文学の占める割合は半分程度と高かった。これが六〇年代、七〇年代になると米文学の比率が増していく。これまで外国文学受容の観点から国語教科書はあまり注目されてこなかった。戦後、GHQの指導のもと、国語教科書に外国文学教材が並ぶことになった。その比率は文学教材全体の約四分の一に達していたが、学習指導要領の改訂や種々の理由により高校では七〇年代以降急速に減少し、現在では五パーセントを切る。なお小学国語・中学国語ではこの限りではなく、理由として外国文学の定番教材の存在、六〇年代初頭に広域採択制度が導入されたことで教科書会社の淘汰が起こり、教材の平準化が進行したことが理由ではないかと思われる。 ■ラウンドテーブル記録  日比 秋草先生に二点、伺いたいことがあります。一点目は、翻訳文学が減っていく傾向についてです。雑な解釈をすれば「日本人の関心が内向きになったから」と考えたくなったりするわけですが、実際には教科書には学習指導要領があり、全集には出版の事情があるなど、複数の事情が重なっていそうです。先生は、こうした「翻訳の減少」と「社会状況」の連動をどう捉えておられますか?  二点目は「漢文」の立ち位置です。漢文は「書き下し文」という独特の翻訳技法で読みますが、あれは中国文学なのか、それとも国語の一部なのか。かつて漢詩文が東アジアの「世界文学」だったことを踏まえ、先生は漢文をどう見ておられますか?  秋草 まず一点目ですが、翻訳文学の減少を単に「日本が内向きになったから」と片付けることはできません。ここで参考になるのが、イスラエルの翻訳研究者イヴァン・ゾーハーの「ポリシステム理論」です。彼は、翻訳は通常、文学システムの中で「従(サブ)」の位置にありますが、自国の文学が未発達だったり、空白があったりする場合には一時的に「主」の座を占めると説きます。戦後日本の教科書もこれに当てはまります。終戦直後は、戦争を直接扱った日本文学を教材として使いにくい「空白」の時期があり、そこを埋めるために外国文学が採用されました。  しかし時が経ち、優れた戦争文学が評価され、検定でも使えるようになると、「日本文学でいいじゃないか」と置き換えられていった。また、制度的な側面として、大学の国文学科で近現代文学を学んだ学生が教員になり、「自分が学んだ日本文学を教えたい」と考えるようになる。こうして「国語」というシステムが自己完結していく過程で、翻訳文学が押し出された面があると思います。  二点目の漢文についてですが、実は日本の外国文学研究者は国語教育に関心が薄いのですが、中国文学の研究者は非常に強い関心を持っています。平たく言えば、高校に「漢文」の授業があるおかげで、大学に中国文学の教員ポストが維持できているからです。制度と学問の維持は密接に関わっています。漢文の「曖昧さ」に関連して面白い事例があります。九〇年代に三省堂が前衛的な古典の教科書を作ろうとして、アイヌのユーカラや『オデュッセイア』、ロシアの『イーゴリ遠征物語』などを入れようとしたことがありました。しかし、検定で「古典の教科書である以上、古文か漢文以外は認められない」と不合格になったのです。「国語」の輪郭が制度によって厳密に管理されていることの証左であり、その中で漢文だけが特権的な位置を占めているのは興味深い現象です。  日比 なるほど。国語というシステムが持続していく中で、教材も「日本人が書いたものを模範として日本語を学ぶ」という、ある種純粋培養とでも言いたくなる方向へ進んでいるのかもしれませんね。  須田 ロング先生に一つ質問させてください。先生は著書『数の値打ち』の冒頭で、一九世紀末の医学界のエピソードを引かれています。当時、医学に統計的手法が導入された際、医師たちは「患者は一人ひとり違うのだから、統計で一括りにはできない。医者のアート(技巧)こそが重要なんだ」と猛反発した。この構図が、現在の文学研究におけるデジタル技術への反発とよく似ている、というお話です。先生は、医学がやがて統計を受け入れたように、文学も大量のコーパスを扱う必要性に迫られて、定量的な解析を受け入れていくだろうと論じられています。  しかし、私はそこに少し疑問があります。医学には「人の命を救う」という、誰もが合意する明確な目的があります。だから人の命を効率的に救えるなら受け入れる。でも、文学を読む目的は何か。仮に「作家の本質が一瞬で分かる」技術ができたとして、文学研究者はそれを「効率的だから」といって受け入れるでしょうか?  ロング 鋭い指摘です。(翻訳者の秋草先生を見つつ)本来は訳者に答えてもらってもいいのですが(笑)。まだ明確な答えはありませんが、一つ言えるのは、あの本を書いたのはChatGPTが登場する前だったということです。この数年で世界は激変しました。ChatGPTが登場して以来、デジタル・ヒューマニティーズの専門家だけでなく、人文学全体がこの技術にどう対応すべきか迫られています。  重要な変化は、LLMによって定量的なデータを「定性的」に、つまり対話的に扱えるようになったことです。以前のように単に数値やグラフを突きつけられるのではなく、AIと対話しながら解釈を深めることができる。この対話性こそが、これからの文学研究を変えていく鍵になる気がします。状況は以前よりも、研究者が受け入れやすい方向に進んでいるのではないでしょうか。  日比 須田さんの質問は、「文学作品は自分でじっくり読むものだ」という前提に基づいていますよね。私たち文学好きにとってはそうです。しかし、その前提が社会全体でいつまで続くかは分かりません。あらゆるコンテンツが短く切断され、サマライズ(要約)されていく方向にある。その中で、「『吾輩は猫である』は長すぎて読めないから、ChatGPTにあらすじを聞いて読んだことにする」という人は確実に出てきます。そしてAIはそれを上手に要約してしまう。  我々研究者は「絶対に原文を通読すべきだ」と言い続けますが、文化全体の流れは止められないかもしれません。  橋本 僕は二つの点から、変化は避けられないと思います。一つは、「文学」の定義自体の変化です。昔のイギリスでは、文学(HighArt)といえば詩と悲劇だけで、小説は今の漫画のような大衆娯楽扱いでした。それが時間をかけて、小説こそが文学の中心になった。それと同じように、今は「計算を入れるなんて」と思われていても、文学という領域の定義自体が変われば、計算も当たり前のものとして受容されていくでしょう。  もう一つは、技術の「透明化」です。新しい技術も、時間が経てば生活の一部になり、透明になります。上の世代は「コンピュータなんて」と反発しても、生まれた時からそれがある世代にとっては「なぜ使わないの?」となる。かつて医学で起きた論争が今では過去のものとなったように、「なぜ文学でコンピュータを使うのか」という問い自体が、技術の浸透とともに消滅していく未来が来るのではないかと思います。  須田 議論は尽きませんが、時間になりましたので、このあたりで閉会したいと思います。長時間にわたりご参加いただいた皆様、どうもありがとうございました。(おわり)  ★すだ・とわ=名古屋大学特任准教授・フランス文学。  ★はしもと・たけひろ=中央大学教授・イギリス文学。  ★ひび・よしたか=名古屋大学大学院教授・近現代日本文学・文化。  ★ホイト・ロング=シカゴ大学教授・近代日本文学。  ★あきくさ・しゅんいちろう=日本大学大学院准教授・比較文学。