ますですブログ

思ったことや感じたことなど。

11月が終わっていた

前回記事のタイトルは「10月のおわり」。今回の記事のタイトルは「11月が終わっていた」。つまり、1か月間このブログを更新していなかったことになる。あれだけ定期的にブログを書くように習慣づけると豪語しておきながら、丸々1か月ブログを更新していなかったわけだから、お恥ずかしいばかりである。そんな人はいないとは思うが、もしも、仮に、万が一、この1か月間ブログの更新を心待ちにしていた人がいるのであれば、お詫び申し上げたい。

 

しかし、11月中一度もブログを更新できなかったのには割と正当な理由がある。ということでこの場をお借りして、僅かばかりの弁解(言い訳)をさせていただきたい。

 

実は、11月中、僕はひたすら論文を書いていた。ここでは論文の詳しい内容について触れないが、簡単に言えばグローバル化が利益団体に与えた影響を分析する論文を書いていた。こう書くと「利益団体」って何じゃいなという話になるが、農協とか労働組合とか市民団体とか、その辺のものをイメージしてもらえばいい。もう内容はどうでもいい。とにかく僕はこの1か月間死に物狂いで論文を書いていたのだ。

 

論文を書くということはつまり、長時間パソコンとにらめっこしながらキーボードを延々叩き続けることである。そんなことを続けている間はとてもじゃないが、そこまで緊急性のない文章を書く余力は無い。実際、何度か11月の間にブログを書こうと思ったこともあったのだが、そのたびに脳内に住んでいる「もう1人のボク」が「余計な文章を書く暇があったら論文を書け!」とやかましく怒鳴ってきてブログなんて書けたもんじゃなかった。ということで、この1か月の間、別にブログのことを忘れていたわけではないということを主張しておきたい(ちなみに「もう1人のボク」は遊戯王をイメージして書いたものであって、僕は別に多重人格者ではない)。

 

論文を書く上で大変だったのは、この論文が指導教授との共著論文であったということだ。今回やってみて分かったのだが、共著論文を書くということはものすごく大変な作業だ。今回の例でいえば、まず指導教授が大枠を定め、その大枠に従って僕が実際に分析を行ったうえで文章を執筆し、それを指導教授が確認してダメな点を修正する……という作業を何度も繰り返すのだが、このループが身体的にも精神的にも相当キツかった。詳しくは書かないが、ちぎっては投げちぎっては投げ、という感じで何度も修正を要求されたのでかなり堪えた。自分の能力不足が大きいのだが、「えっ、その修正をこの段階でやるんですか……」というのが何度もあって、終盤のミーティングでは僕の表情筋は完全にお亡くなりになっていた。

 

とはいえ、論文に関しては業績に繋がる話だし、何より非常にいい経験になったので、今となっては苦い思い出みたいなものである。

 

論文を書くだけであれば、もう少し余裕があったのかもしれない。しかし、論文執筆に加え、大学でのTA(ティーチング・アシスタント)業務が笑えるくらい激務だったことも、11月の余裕のなさに拍車をかけた。あまり詳しく書くと色々と不都合があるような気がして詳しくは書かないが、今学期からTAとして受け持ったゼミで(何故か今年から)動画編集を行うことになり、そのレクチャーのお仕事を全面的に僕に一任されてしまったのだ。そして運悪く授業計画上、動画編集関連のゼミが全て11月中に割り当てられていたため、僕は論文執筆と動画編集のレクチャーを並行して行わなければならなくなった。これがかなり肉体的にキツかった。

 

というのも、僕は大学3年生の時(4年前!)にサークルの都合で動画編集を「軽く」したことがあった程度で、まさか人様に動画編集のやり方をレクチャーできるようなスキルは持ち合わせていなかったからだ。というか、動画編集ソフト(AdobeのPremiere Pro )の使い方も半分くらい忘れていた。だからゼロから自分で動画編集のやり方を復習しながら、基本的な作業を配布用のレジュメにまとめていかなければならなかったのである。下に一部キャプチャしたものを添付するが、こんな感じのレジュメを毎週作っていた。ちなみに言い忘れていたが、僕が受け持っているゼミは「法律学科」のゼミであり、映像学科のゼミではない。僕自身、なんでこんなことをやっているのかよく分かっていない。

f:id:highsucceed:20181206034404p:plain

レジュメの一部

レジュメを利用する講義が合計4回あったから、こんな感じのレジュメを11月の間に4回作成していたわけである。今振り返っても、尋常ではない作業量だった。ついでに言えば、これに加えて講義の際に使用するスライドも作成していたので、作業量はもっと増えた。うちの大学では1つの講義につき、ひと月に18時間までであればTA勤務に対する給与が発生するのだが、どう考えても18時間なんかでは収まりきらない労働時間だったように思う(ちなみに溢れた労働時間は翌月に繰り越すことが可能なので、ちゃんと賃金は発生する)。動画編集のレクチャーはまだ終わっていないので、これが成功(ゼミ生全員が動画作品を作り上げる)に結び付かなかった場合のことを想像すると死にたくなるものだ。

 

ここまで書けば、僕が11月に1つもブログを書けなかった理由が理解できるのではないだろうか。論文執筆と授業準備の並行作業がハードすぎて、1週間のうち3回、家に帰れなかった日があった週もあったほどだ(11月全体で5回研究室に泊った)。僕は社会人経験がないから比較はできないのだが、多分その辺の社会人と同じくらいか、下手すればそれ以上にハードな1か月を送っていたんじゃないかと思っている。少なくとも、今年の11月が僕の人生で最もハードな1か月だったのは間違いない。ということで、今後僕に「院生って暇なんでしょ?笑」とか言ってくる人間には容赦なく鉄拳を浴びせていきたいと思う。全然暇じゃねえわ!!!

10月のおわり

10月が終わる。

 

この10月を一言で表すとすれば何だろうかと軽く考えた結果、「パソコン」かな、という結論に至った。うん、パソコン。

 

知らない人もいるかもしれないので言っておくと、今月僕は新しいパソコンを手に入れたのだ。ちなみに僕が買ったパソコンはこれ(Inspiron 13 5000)。まあまあスペックにこだわって構成を組んだ結果8万強したんだけど、統計ソフト回してもサクサク動くし指紋認証もめちゃくちゃ便利だしで、割と満足してる。ていうか、こんな感じの内容を開設記で書いたような気がするな。まあついでということであの時書いていなかったことをここで書いておくとすれば、DELLでパソコンの購入を考えている方は、納品にめちゃくちゃ時間がかかることを覚悟されたほうがいいということだろうか。多分、誇張抜きで100回以上お客様サポートのページ見返した。

 

パソコンを買っただけなら、別に今月を表す一言が「パソコン」になったりはしない。パソコンを買ったことで、色々と生活に変化が生じたからこそ、パソコンを10月を表す一言に挙げたのだ。どんな変化が生じたかというと、大体次の2つ。1つは、パソコン購入をきっかけに、このブログを書き始めたこと。そしてもう1つは、パソコンを買ったことで、研究室だけではなく家でも研究を進めることができるようになったことだ。振り返ってみれば、この2つによって、僕の生活はこれまでとはかなり異なった生活になった気がする。

 

まずブログを書き始めたことについてだけども、そのおかげで、まあまあの長さの文章を書くことにちょっと慣れ始めたような気がする。ただ、文章を書くことについてはちょっと前に記事(文章を書くということ)にしたので、わざわざ繰り返さないでおこう。まだ触れてない点について挙げるとすると、ブログの閲覧数とかかな。僕が使っているはてなブログでは、ブログの管理ページで閲覧数を確認できるのだが、これを見た感じ、かなりの人がこのブログを見てくれているようだ。正直なところ、最初は閲覧数に自分のアクセス数も含まれてるんじゃないかと疑ったのだが、調べてみると自分のアクセスは除外されるみたいだ。よかった。こんなよく分からないブログをわざわざ読んでくれている人がいるのみたいなので、この場を借りてありがとうございますと感謝の気持ちを述べたい。

 

特に、前回の記事(テキストマイニングによるツイート分析)はまあまあ反響があった。Twitterでも触れたが、言語文化学の教授の方があの記事をご覧になられていたようで、本当にビックリした(多分「テキストマイニング」の検索ワードに引っかかったんだろう)。あと、フォロワーの中で実際にKH coderをダウンロードして、ツイートをテキストマイニングした人もいたりして、ちょっと嬉しかった。普段、僕はTwitterなどで学問的にどんなことをしているかについてほとんど発していないが、大体あんな感じのことをやっていると思っていただければいいと思う。もちろんあれが全てではないし、むしろほとんど趣味に近いのだけども……。

 

次に、研究室だけでなく家でも研究できるようになったことについてだが、これは僕のこれまでの研究生活にとってかなり大きな革命だった。最初に書いたパソコンが届くまで、僕は研究活動の全てを研究室で行ってきた。こう書くと当たり前のように見えるのだが、研究室で実験をすることが多い理系の院生とは違い、実験するわけでもない文系の院生が研究室で研究する必要は、正直言ってあまりない。じゃあどうして研究室に行くんだという話になるわけだが、その理由は実に単純な話で、僕が持ち歩きのできるパソコンを持っていなかったせいで、家にいても研究が全く進まないからだ。実験しない文系院生とはいえ、さすがに手書きで論文を書いたりはしないのである。

 

さて、実際に持ち歩きのできるノートパソコンを手に入れてしまうと、特に実験をするわけでもない文系院生の僕は研究室に通う必要がなくなってしまう。というわけで、最近は研究室における僕の出没率は以前の半分ほどに低下している。ただ、この半月ほど実際に家で研究をしてみて(はやりのリモートワークというやつだろうか)分かったのだが、家で長時間集中するというのはなかなか難しい。書斎のような部屋やデスクワークのできる大きな机と椅子があれば別だろうが、しょせん我が家は家賃4万ちょいのワンルームで、机の機能を果たせるものはコタツくらいしかない。コタツで研究が捗るかというと、当たり前だが全く捗らない。どうも僕にはリモートワークは向いていなかったようだ。11月からはまた研究室に通う生活が再開しそうである。

 

ということを書いているうちに、11月になってしまった。パソコンを手に入れて変化したことが2つあると述べた。文章を書くことに慣れてきたことと、家で研究するようになったことの2つだ。しかしながら、よく考えれば僕は10回ほど記事を書いてもいまだに「綺麗にまとまった文章」を書くことができていないし、前述のように、結局来月からは家ではなく研究室で研究をするスタイルに戻りそうだ。要するに、やはり人間は1か月という短い期間ではそんなに大きく変わることはできないのだろう。

テキストマイニングによるツイート分析

この記事は、僕のTwitterアカウントのツイートをテキストマイニングにかけてみた結果を紹介するものである。よって、僕のTwitterアカウントとは関係のない人にとっては、ほとんど何の意味もない記事となることをお断りしておきたい。あと今回の記事、めちゃくちゃ長い(9000字弱ある)ので、その点についても注意されたい。多分読んでる人のほとんどは半分くらいで読むのをやめそうな気がする。

 

さて、僕のTwitterをフォローしている人は知っていると思うが、僕は10月17日あたりに「自分のツイートをテキストマイニングにかけ、その結果を分析してみようと思う」と高らかに宣言していた。しかし、それから10日間僕は色々と理由をつけて自分の宣言から逃げ続けていた。単純に、めんどくさかったからだ。しかし自分でやると言った手前上、実行しないのは許されない。ということで今日、僕はついに重い重い腰を上げ、ツイートのテキストマイニングを実行した。

 

ということで、本題に入ろう。

 

そもそも「テキストマイニング」という単語が何を指しているのか分からない人もいるのではないかと思う。僕が説明するのもひとつの手だが、ここは専門家の言葉を借りて説明した方が確実なのでそうしたい。以下に引用する(ちなみに、細かいことはどうでもいい!と方はずっと下まで読み飛ばしてもらって問題ありません)。

テキストマイニングとは、文章(テキスト)から有益な情報を発掘(マイニング)するための方法である。テキストマイニングでは、自然言語処理の手法を用いて、文章を単語や句に分割し、単語の出現頻度や単語間の関係を統計的に解析することにより、文章から情報を抽出するということを実施する。したがって、テキストマイニングは、大量のテキストデータを効率的・客観的に分析するという目的を実現するのに有効な手段と考えられ、アンケート調査における自由記述式回答の解析、消費者から寄せられる要望や苦情の解析、Webサイトへの書き込み文章の解析、業務日報の解析などに有効である。

(内田治ほか(2012)『SPSSによるテキストマイニング入門』ⅲ頁) 

 要するに、大量の文章を統計的に解析する手法のことだ。

 

ちなみに上記引用文は、IBMの統計解析ソフトであるSPSSを用いて行うテキストマイニングを解説する入門書だが、今回の分析では、「KH coder」を用いる。なぜKH coderを用いるかというと、このソフトがフリーソフトだからだ。このソフト、無料で使用できる上に非常に使い勝手がよく、そしてこのソフトを用いた先行研究の数も実に豊富である(詳しくはKH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェアを参照)。これは本当に素晴らしいソフトで、多くの使用者から絶賛の声を受けている。KH coderを用いた面白い分析の例としては、とりあえず以下の3つを挙げておくので、興味のある方はこちらも参考にされたい。

 

①デリヘル譲の紹介文を解析し、「当たり」のデリヘル譲に特徴的な語と「ハズレ」のデリヘル譲に特徴的な語を突き止めたもの。ちなみにこの分析はタモリ倶楽部でも紹介されている。テーマがテーマなので、一応閲覧注意ということにしておこう。

shirotodotei.hatenablog.com

 

②マンションの広告ってすごい独特のポエムっぽいやつ多くないですか?下の記事は、そんなマンションポエムにはどのような特徴があるのかを分析したものだ。個人的に面白かったのは、関西と首都圏ではマンションポエムの特徴語がかなり異なるということ。この記事が一番無難かもしれない。

dailyportalz.jp

 

③筆者のブログに対する「ヤフーコメント」「はてなブックマークのコメント」「Twitterでのコメント」の3つを分析し、それぞれの特徴を解析した記事。匿名性の高いSNSほど、コメントが陰湿になるのが視覚的に見えて面白かった。

prehyou2015.hatenablog.com

 

この3つを読んでもらえば分かるのだが、このテキストマイニング、本当に奥が深くてものすごく面白い分析手法なのだ。今のうちに身につけておけば、将来的に何かの役に立つんじゃないかとも思っている(研究職に就けなかったらこれで何とかしたい)。で、こんな面白い分析手法があるのなら、ぜひとも自分でも使ってみたいと思うのが僕の性分なもので、さっそく自分の過去のツイートを全てダウンロードして加工を加え、実際にテキストマイニングにかけてみた。ちなみに、ツイート履歴の取得方法についてはこちら(自分の全ツイート履歴をダウンロードする | Twitterの使い方 | ぼくらのハウツーノート)を参照のこと。

 

テキストマイニングに入る前に、僕のツイートの基本的な統計情報を示しておきたい。僕が主に使用しているアカウントは2013年3月に開設されたものなので、開設してからおよそ5年半運用していることになる。で、僕がツイート履歴をダウンロードした10月16日時点で総ツイート数は7180件だった。5年半の日数を大雑把に計算すると365×5+180=2005なので、7180÷2005=3.58と、大体1日当たり3.58ツイートしている計算になるだろうか。こう見るとなかなかたくさんツイートしているように思える。

 

続いて下の図は、1か月あたりのツイート数の推移をグラフ化したものだ。

f:id:highsucceed:20181029014645p:plain

この5年半、僕がどのようにTwitterと付き合ってきたかが一目でわかるグラフだ。ちなみに、2013年の4月から大学2年生で、2014年4月から3年生、2015年4月から4年生、2016年4月から大学院修士1年目、2017年4月から大学院修士2年目、2018年4月から大学院博士1年目である。

 

このグラフの特徴をまとめるとすると、①大学2~3年生の頃の僕はかなりTwitterにのめり込んでいたのか、しばしばひと月に200ツイート以上することがあった、②大学のゼミが始まった2014年の10月~11月あたりから月当たりのツイート数が減少し始め、月に200以上ツイートすることがなくなった、③卒論に忙しかった2016年から大学院に進学して現在まで、月当たりのツイート数は低落傾向にある、の3点だろうか。自分の生活の変化がこのように客観的に確認されて、非常に面白い。というか、2013年10月から2014年10月までの自分、Twitterしすぎじゃないか。

 

それでは実際にテキストマイニングに入ろうと思う。

 

最初に確認するのは、僕のツイートで頻繁に用いられている単語、すなわち頻出語である。総合的な頻出語リストを示しても、あまり面白くないので、品詞別の頻出語リストを示したい。なお、あまり長いリストを示してもアレなので、各品詞の上位10位までの頻出語を示すことにする。まずは「名詞」「サ変名詞(~するで動詞になる名詞)」「地名」「組織名」の上位10位の頻出語を見てみよう。ちなみに分析結果では「人名」もリストアップされるのだが、ここで公表するには色々と弊害がありそうな結果が出たので、残念ながら割愛した。

f:id:highsucceed:20181029024151p:plain

名詞の最頻出語は「バイト」だった。確かに日々のツイートではバイト関係のことをよくつぶやいている気がする。バイトを含め、「ゼミ」「大学」「スキー」というように、僕の大学生活でかなりの位置を占めたコミュニティが上位に来ている。「女子」が10位にランクインしているのが笑えるところだ。続いてサ変名詞の最頻出語は「研究」だった。研究なんて大学院に入ってからしかツイートしていないはずなので、そう考えると最近はよほど研究のことばかりつぶやいていると思われる。地名の最頻出語は「京都」だった。というかこのリストでは名字や出身地などかなり僕のプライバシーに関わることが示されていて、正直公開するのをためらったのだが、まあそこまで隠すようなことでもないと思い、公開している。やはり僕の大学についての地名が多い。組織名の再頻出語は、謎の「パ」であった。詳しく調べてみると、KH coderの辞書に登録されていない「たこパ」の「パ」や「パワプロ」の「パ」などが、独立で組織名に分類されてしまったようだ。ということでこれを無視すると、「同志社」になってしまう。やはり大学名が強い。10位に「松屋」がランクインしているのは、僕の食生活を表しているようだ。

 

次に、動詞や形容詞など、名詞以外の品詞の頻出語を確認してみよう。

f:id:highsucceed:20181029025531p:plain

 まずは形容動詞、最頻出語は「マジ」だった。3位の「めちゃくちゃ」にしろ、実に現代の若者感のある形容動詞である。そしてこの結果を見る限り、僕はTwitterで47回も「好き」とつぶやいているようだ。何が好きだったのだろうか。次に、動詞の最頻出語は「思う」だった。どうやら僕は普段から、あまり断定口調を好んでいないであろうことが読み取れる。そして、僕が驚愕したのが形容詞だ。なんと形容詞の最頻出語は「可愛い」だった。確かに「可愛い」とつぶやくことは多いかもしれないが、まさか「楽しい」や「多い」よりも上位に「可愛い」が来るとは思わなかった。先ほど名詞の10位が「女子」だったことを鑑みれば、僕は相当可愛い女子が好きなのだろう。副詞の最頻出語は「多分」だった。やはり、僕がTwitter上で断定口調を好んでいないことがここからも分かる。後、「全然」や「全く」などの強調語を多用しているのも興味深い。

 

以上が、僕の全ツイートにおける「頻出語」だ。次に、年ごとの「特徴語」を確認してみよう。特徴語とは、特定の語や特定の変数と強い関連を示す単語のことである。で、今回の記事では年ごとの特徴語を析出するわけだが、これをわかりやすく言い換えると、例えば2013年の1年間に特徴的に表れた単語を抽出してリストアップするという作業を、全ての年で実行するということだ。ちなみに特徴語を析出する上で用いる指標には「確率差」を用い(Jaccard係数を用いるつもりだったが、確率差の方が面白い結果が出たため)、上位10位までの特徴語を示すこととする。

f:id:highsucceed:20181029070333p:plain

各年の特徴語については箇条書きでコメントしていく。

  • 2013年はかなり特徴的なリストになっている。最も特徴的な単語は、「ゼミ」だった。この年にゼミ選考があったので、それを反映しているのだろう。あと、分割されているがこの年「宅建」の試験を受けたので、それも反映されている。「練習」や「筋肉」が入っているのは、この年は比較的、サークルの練習に参加していたことを示している。
  • 2014年は、特にサークル関係の単語が多く検出されている。「企画」「広報」「写真」「更新」はどれも、サークルでの役職に関するものだ。最も特徴的だったのは「笑」だが、これはリプライが多かったことを示しているのではないかと解釈した。「飲む」が多いのは、この年は比較的リア充だったことを示しているのではないか。
  • 2015年になると一転してサークルの色が薄くなり、「バイト」や「卒論」がランクインしている。実際、この年は4回生だがサークルにほとんど参加せず、バイトやゼミ活動に力を入れいていた記憶がある。あとなぜか10位に「死ぬ」がランクインしているのだが、この点については謎である。
  • 2016年も引き続き、サークル関係はほとんどなく「バイト」や「卒論」が特徴的である。「城崎」は、城崎旅行に行ったことが反映されている。ちなみに「合コン」が6位にランクインしているが、僕は生まれてこの方合コンには一度も参加したことはない。今でも合コンは都市伝説だと思っている。
  • 2017年は完全に大学院関係のツイートばかりになるので、特徴語にも「研究」が2位に挙がっている。あと、読者の方は突然「髪」がランクインしていて謎に思われるかもしれないが、僕はこの年ロン毛だったので、髪の毛に関するツイートを多くしていたことを示しているのだろう。
  • そして今年、2018年だが、やはり「研究」が多い。あと、分割されているが「モンハン」も特徴的だ。実際、今年の2月にモンハンを買って1か月ほどずっとのめり込んでいたので、それが表れているというわけだ。ただ、2018年だけやたらと動詞が多く、特徴的な名詞が少ないのが若干気になるが、なぜかは分からない。

 

以上が、各年の特徴語である。全体的に見ると、2013年から2014年はサークル関係のツイートが、2015年から2016年はバイトや学業(主にゼミ)関係のツイートが、2017年から2018年は大学院関係のツイートがより多く観測されていることが読み取れる。特徴語を見ている限り、2014年から2016年までの3年間は割と充実したツイートを頻繁にしていただろうことが読み取れる。逆に言えば、あの頃と比較すると大学院に入ってからは腐ったようなツイートが多くなっているということだ。心当たりがないわけではないが、なんということだ。

 

そして最後に、KH coderの本領発揮ともいえる「共起ネットワーク分析」である。共起ネットワーク分析とは、文書内での各単語の出現パターンを解析し、そのパターンの似通った単語(これを「共起の程度が強い」という)同士を線で結んだ図を描くことで、その文書において、それぞれの語がどのような用いられ方をされているのかを視覚的に確認することのできる分析である。要するに、「そのテキストデータにおいて、どんな言葉が多く出現していて、どの言葉とどの言葉が一緒に用いられているかを視覚的に表す」手法だ。これはもう図を先に見たほうが早いので、先に示してしまおう。

f:id:highsucceed:20181029044145p:plain

これは、僕の全ツイート(7180件)を分析の対象として描いた共起ネットワーク図である。線で結ばれた語が、僕のツイートでよく一緒に用いられている語で、円の大きさはその語の出現数を示している。特徴語として拾われたフォロワーのIDを除外するかどうか迷ったのだが、入れておいた方が解釈しやすいのでそのままにしておいた。ちなみに当事者である僕からすれば、このネットワーク図は怖くなるほど僕のツイートの傾向を表している。

 

例えば濃い緑のサブグラフ(線で結ばれた単語の集団)を見ると、ここに挙がっているフォロワーとのリプライでは頻繁に「笑」を用いていたことが分かる。あと、このサブグラフはサークル関係の語が多くまとめられている。あと、自分でもビックリしたのだが、僕はかなり自分の大学のことを「クソ大学」と表現してツイートしているようだ。「マジ」も線で結ばれているので、よほど大学のことを「クソ」だと思っているのだろう。他にも、ピンク色のサブグラフでは「月」「提出」「字」が線で結ばれているが、これは去年、修論を提出するまでの残り日数とその日書いた字数をTwitterに記録していたことが表れている。あと、「@yodoyan_ydk」のIDと「行く」が線で結ばれているのは、このアカウント主と頻繁に「ラーメンに行くぞ」とのリプライを飛ばしあっているからである。まさかここまで再現されるとは。

 

ということで、ここからは各年ごとに共起ネットワーク図を描いていこうと思う。その年ごとに、特徴的なネットワーク図が描かれていて、個人的には非常に面白い結果となっている。なお、フォロワーのIDは除外しないことにした。

 

【2013年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029045755p:plain

先ほど特徴語分析でも確認できたように、この年のツイートはサークル関係のものがほとんどであるように見える。というか、半分以上はサークル関係の単語だ。下の方に「iPhone」とあるが、これを見てそう言えば2013年の11月の学園祭の時期にiPhone4Sをパクられたなぁと懐かしい気分になった。あと、この頃は「笑」ではなく「www」や「wwww」に見られるように、いわゆる「草」を生やして笑いを表現していたのが読み取れる。こんなところまで分かるのだ。

 

【2014年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029054407p:plain

2014年の共起ネットワーク図はかなりいびつというか、あまり綺麗な図にはならなかった。特定の語の出現数が突出したことにより、全体的に語を囲む円が小さくなったことが要因だ。どうもこの年は特定のフォロワーに対し、かなり多くのリプライを送っていたようだ(1つの語の大きさから推測するに、特定のIDと300回ほどリプライしている)。そしてこの年も、サークル関係の語が多い。特に面白いと感じたのは、「ドイツ語」という語が抽出されていることである。これを見て思い出したが、そういえば僕は第二外国語のドイツ語を再履修しまくっており、3回生であるこの年もドイツ語の試験に追われていたのだ。嫌な記憶だ。

 

【2015年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029055229p:plain

この年の共起ネットワーク図の特徴は、フォロワーのIDの数がかなり多いことだろうか。つまり、この年は前年と比較すると、かなり幅広いアカウントとリプライを交わしていることが読み取れる。また、特徴語分析からも読み取れたことではあるが、2015年からサークル関係の語が全体に占める割合が減少し、代わってバイトや学業関係の語が増加している。なお、「入れる」と「感じる」が結ばれていてヤバい感じになっているが、「居候入ってる時の1日めっちゃ長い、下界にいるときの2倍くらいに感じる」等のツイートを反映した結果であって、ヤバいツイートではない。

 

【2016年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029060701p:plain

これまでとは打って変わって、大学院に進学した2016年のツイートではやはり研究関係の語が多く確認される。「大学院」「研究」「教授」「論文」「卒論」などの語が抽出されており、印象がガラッと変わっている。図の上の方に「今」「死ぬ」といった語が表示されているが、これは大学院生活に順応できていなかった若き日の僕の怨嗟の声といったところだろうか。あと、前述のようにこの年はロン毛だったので、しっかり「髪」が右上に示されている。

 

【2017年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029061258p:plain

最初に示したグラフを見ても分かるように、2017年以降、僕のアカウントのツイート数は顕著に減少している。その結果、この図のように、それぞれの語の出現数が小さくなっている。それにしてもこれ以前の図とは大きく異なった、実にいびつな共起ネットワーク図である。まず、フォロワーのIDが1つしか抽出されていない。これは、これまでと比べてリプライの数が減少したことを示している。また、サブグラフ(線で結ばれた語のまとまり)を構成する語の数がきわめて少ない。おそらくこれは、それぞれのツイートの内容がバラバラになっており、各ツイートの類似点が検出されにくかったのだろう。逆に、灰色のサブグラフを見ればわかるように、「進捗」「状況」「字」「提出」「期限」などの語はそれぞれ濃い線で結ばれている。これは、下の画像のように同じような修論の進捗状況に関するテンプレート文を一定期間量産していたためである。この画像を見ると、共起ネットワーク分析の正確さが伝わるのではないだろうか。

f:id:highsucceed:20181029062249p:plain

 

【2018年のツイートを元に作成した共起ネットワーク図】

f:id:highsucceed:20181029062538p:plain

そして最後にこれが、2018年、つまり最近の共起ネットワーク図である。再び、割と綺麗にまとまった図になったようだ。リプライの数も若干増加しているようである。図を見たところ、特にモンハンに関するリプライが多かったらしい。僕はこの年から大学院博士課程に進学したのだが、それに伴って、「研究」「学会」「論文」「指導」「教授」などの語が特徴的な語として観測されているようである。ただ、ここでも左上の方に「死ぬ」という語が出現しているのが何とも言えない気持ちになる。あと、地味に左の真ん中らへんに「結婚」という語が表れているのも、自分が歳を重ねるにつれて結婚に関するツイートが増えていることを示しており、これまた何とも言えない気分になる。

 

さて、以上が僕のTwitterアカウントのツイートをテキストマイニングにかけ、分析を行った結果である。これまで見たように、テキストマイニングを用いれば、自分でも意識していなかったりとうの昔に忘れてしまったようなことを、客観的な形でなおかつ視覚的に確認することができる。今回は頻出語および特徴語の確認と、共起ネットワーク図の描写の3点しか行わなかったが、KH coderはその他にも様々な機能を備えており、より豊富な手段を用いてテキストデータを分析することができる、本当に素晴らしいソフトである(しかもこれが無料で使えるのだから、便利な世の中だ)。この記事を見てテキストマイニングに関心を持った人は、ぜひとも一度実際に自分で利用してみてほしい。自分のツイート履歴を分析してみたら、きっと面白い結果が出るはずである。

 

ただ、哀しいかな、自分のツイートを分析してみて一番面白いのは自分自身であり、他人からすれば恐らくそこまで面白いものではない。僕自身、ここまで文字数にして9000字弱、実に6時間近く記事を書き続けているが、ただの自己満で終わりそうな気がしてならない。

文章を書くということ

それなりの長さの文章を綴るというのは、意外と時間を要するものだ。

 

このブログを始めてから大体半月ほどたっただろうか。今まで書いてきた記事は7本である。それぞれ長さはバラバラだが、短い記事でも500字ほど、長い記事だと3500字ほどの文章を書いている。ちゃんと計算はしていないが、大体平均1500字くらいの記事を書いているんじゃないだろうか。

 

で、平均1500字と聞くとそんなに長くないような気がするものだが(そして実際に記事を読んでみても短い記事に見えるのだが)、実はそれぞれの記事を書くのにはかなりの時間と労力を割いている。特に費やしているのが、時間だ。例えば、前の記事(リアルとネット - ますですブログ)は大体1500字の記事なのだが、これを書くのに大体2時間かかった。その時間に研究を進めろよと指導教授から言われかねない時間のかけ方である。1日の12分の1をブログ執筆に費やしていると考えてみると、ヤバさが伝わるかもしれない。

 

なぜこんなに記事を書くのに時間がかかっているかというと、普段から文章を大量に書くような習慣がないというのもあるのだが、一番要因として大きいのは推敲をアホほど重ねているからである。推敲といっても、原稿が完成した後に何度も確認を繰り返しているのではなく、原稿が完成する前から一行書いては振り返り、一行書いては振り返りを何度も繰り返しているタイプの推敲だ。一行書くたびに誤字はないか、論旨にズレが生じていないか、書いてはいけないようなことは書いていないか、なんてことを何度も確認しながら文章を書いていくわけだから、そりゃあ時間もかかるわなという感じだ。(あと、あまりテーマとは関係ない無駄な記述を色んなところに挟んでいるから、文章が冗長になって執筆時間も増える、という理由もあるかもしれない)

 

文章書くのに無駄に時間がかかるとなると、ブログを書くことに対する心理的抵抗も生まれてくる。それで結局、今日は課題が山積みだし~とか、今日はたくさん動いて疲れてるし~などの言い訳をつけてブログを書かなくなってしまうのだ。しかしそれではよくない。別に義務感でブログをやっているわけではないが、ブログ開設記にも書いたように、このブログは自分に生じた変化を後から確認できるように設けたものだ。だったらやっぱり、定期的に自分の考えやその日起こったことなんかを記録し続けることが望ましい。

 

何より、こうしてブログを書き続けることで、それなりに長い文章を書くという習慣が身につき、将来的には短時間でそれなりの長さの文章をまともに書けるようになるかもしれない。そういったスキルは、研究職を目指すうえで必須でもある。じゃあやっぱり書くしかないよね。とりあえず現時点で目指すのは、ブログを書くことに対する心理的抵抗を低減させることだ。

 

と、自戒の意を込めつつ、今後の方針を宣言してみた。ちなみに今日はもう1個記事書きます。

リアルとネット

「この前の飲み会でブログの話になりましたよ」その言葉を聞いた瞬間、頭皮がざわざわするような、えも言われぬ感覚を覚えた。

 

いつかこの時が来るだろうとは考えていた。しかしいざその時が来てみるとなかなか心に「クる」ものがあるもので、後輩の前にもかかわらず無様にも「あああああ!」と叫び声をあげてしまった。そう、僕はネット上での発言や叙述について「リアル」で言及されるのが死ぬほど苦手なのだ。いや、苦手というか、言及されるのがめちゃくちゃ怖い。じゃあわざわざ自分の発言をネットに公開するなよというツッコミも当然予想されるが、そういう問題ではないので、ここでは取り上げない。

 

なぜネット上での自分の発言に言及されるのが苦手かと言うと、理由は簡単で、僕はネット上とリアルでは違う人格を使い分けている「気でいる」からだ。ちなみに、リアルの人格はキレイに取り繕った人格で、ネット上の人格の方が素の自分に近い。だから、リアルでネット上の発言に言及されると、何重もの鉄のベールで覆い隠している素の自分の思考に直接触れられているような気がして、とても心がざわざわしてしまうのだ。

 

僕はネット上では割と色々なことを書いていて、ときに現実では到底口にもできないような発言をしたりすることもある。例えば、修論執筆で心身ともに疲れ切っていた去年のある夜、ふとお姉さんにひざまくらして欲しくなって勢いで「歳上のお姉さんにひざまくらしてもらいながら『よく頑張ったね~偉い偉い』て言って欲しい。」とのツイートをした。他にも、割と長い僕のネット人生を辿れば、思い出すのも恥ずかしいような様々な発言をしている。時を遡れば遡るほど酷くて、実際、大学1年生の頃にはTwitter上での発言で派手にやらかしたこともあった。あれは本当にアホだった。

 

僕はこういう発言をリアルで全くしないわけではないが、基本的には言わないようにしている。僕にもいわゆる良心というものが備わっているのもそうだが、何より、僕がリアルで設定している人格は「キレイに取り繕われた人格」であって、そうした発言はこのような人格にそぐわないからだ。実際そう認識されているかどうかはさておき、僕はリアルでの人格に、思慮深く冷静沈着で大人びている設定をもうけている。だから、その設定にそぐわないような、例えば自身の欲求を露骨に表出するような発言は控えるようにしているし、ゆえにお姉さんにひざまくらして欲しいなんてまず口にしない。

 

で、困るのが、自分が「思慮深く冷静沈着で大人びた人格」を装っているつもりなのに、相手がより素の自分の人格に近いネット上の発言を知っているときである。分かりやすく例えて言えば、自分では「クールなジェントルマン」を装っているつもりでいるが、相手は僕が本当は「年上のお姉さんにひざまくらして欲しい変態」だということを知っているときだ。それで「本当はお姉さんにひざまくらして欲しいんだね笑」なんて面と向かって言われでもしたら、もう苦し紛れの言い訳をくどくどと開陳し続けるか、思い切ってリアルの人格を変態紳士路線に切り替えるかしかない。もちろん、ほとんどの場合僕は前者を選択する。こうして、より訳の分からない複雑な人格が形成されていくわけである。

 

自分で書いていて収拾がつかなくなってきたのでこの辺りで筆を置こう。ちなみにこの記事を読んでしまうと、僕との会話の中でブログの内容に触れることはタブーのように思われそうだが、全然そんなことはなく、むしろ感想などをいただきたいところでもあるので、忌憚なきコメントをお待ちしております。

一人称問題

日本語の特徴の1つは、一人称が無駄に多いことだ。

 

いちいち全部挙げていけばきりがないが、例えば男性であれば代表的な「俺」あるいは「僕」、「私(同じ私でも『わたし』と『わたくし』でまた違う)」「自分」「ワシ」「ワイ」「それがし」「小生」「拙者」……などなど、後半に挙げたものは実生活ではほとんど使うことはないとはいえ、実に多彩な一人称がある。大体の日本人男性であれば、基本的には「俺」「僕」「私」の3つを使い分けることが多いんじゃないだろうか。

 

僕の場合であれば、基本的に普段の日常会話では「俺」を使い、目上の人と会話するときは「僕」を使い、メールや何らかの文書の中では「私」を使う、といった使い分けだ。そんなに珍しい使い分けでもないと思う。

 

で、どうしてまた一人称についてわざわざブログの記事にしたのかというと、ブログ上での一人称をどうするべきか、まだ自分の中で判断しきれていなかったからだ。ここ4回分くらいの記事では基本的に「僕」を使うようにしているが、実は初回の投稿(ブログ開設記 - ますですブログ)を見てみると、一人称は「私」「僕」「俺」と見事にバラバラになっている。これは特に一人称を意識しなかった結果だ。あとついでに言えば、文体も文語調であったり口語調であったり、実にバラバラだ。この点については、今書いているこの記事にも当てはまる。

 

ということで、今後このブログでは一人称として基本的には「僕」を使用することに今決めた。文章で「俺」にはかなり違和感があるし、「私」にするとかなりかしこまった感じがしてそれもまた違和感を覚えるからだ。文体については、特に決めなくてもいいかな、と思う。ずっと「である」調で書かないといけないような格式高いブログでもないしね。

 

わざわざブログにする必要もない内容な気がするが、拙者の心の整理ということで、わざわざ記事にした次第で候。

近況報告記

やってしまった。前回の投稿から、約一週間ブログを放置してしまっていた。

 

言い訳をするわけではないが、僕は決してこのブログの存在を忘れていたわけではない。3日くらい前にTwitterでつぶやいたように、自分の過去5年(?)分のツイートをテキストマイニングにかけ、その結果をブログの記事にするつもりでいた。ところがどっこい、私生活でバタバタしているうちに更新する機会を失ってしまった。しかも実際のところ、上記テキストマイニングの件は何も進んでいない。よって、今回の記事は全く関係のないことを書くことになる。かといって残念ながら最近何か特筆すべきようなことがあったわけでもなかったので、この一週間の振り返りをしたいと思う。「おめーの生活なんて興味ねーよ」という方はブラウザバック推奨である。

 

前回の記事は10月14日(日)に銭湯に行ったことについての記述だったので、15日(月)まで時計の針を戻してみよう。

 

【 10月15日(月)】

前日の夜、銭湯で2時間ほどリフレッシュしていたせいもあり、目が覚めると15時だった。寝る前にブログを書いていたら5時になっていて、慌てて布団に入ったのを記憶しているのでおよそ10時間は寝ていたことになるだろうか。サウナはもちろんのこと、風呂に長時間入り続けるというのはなかなか体力を消費するもので、いつも以上に深い眠りにつけたような気がした。ただ、起きたら太陽が既に傾きかけていたときの「時間を無駄にした感」というのもまた凄まじいもので、いつも以上に寝覚めは悪かったような気がした。とりあえず、この日の僕は溜めに溜め込んだバスタオル計8枚を洗濯せねばならなかった。お天気も悪くない。若干時間は遅いがとりあえず洗濯してから16時頃に干し、研究室へと向かった。研究室では、現在僕が進めている利益団体調査の結果に関する報告書をまとめる作業を行った。なかなか面白い結果が出たこともあって僕は作業に没頭してしまい、結局家路についたのは翌16日(火)の朝6時だった。そして朝6時、14時間前に干したバスタオル8枚を確認してみると、夜露でビショビショになっていた。心なしか前日に干した頃よりも湿り気が増しているような気がしたので、僕は再びバスタオルを洗濯機に放り込んだ。

 

【 10月16日(火)】

前述の通り、朝6時に家に帰ったこともあって結局「就寝」時間が朝7時になってしまい、目を覚ますと再び15時だった。完全に生活リズムが終わってしまったと憂鬱な気分でメールボックスを確認すると、指導教授からメールが届いていた。15日(正確に言えば16日)に作成・提出した報告書に対するフィードバックだったのだが、かなり良い評価をいただけたようだった。どうやらこの内容をうまくまとめれば、来年出版される予定の調査報告書の一章分に組み込んでいただけるかもしれないとのこと。僕は心の中でガッツポーズをしながら、極めて冷静な体を装ったメールを返信した。そのあと大学に向かい、17時から図書室の受付アルバイトをこなした。20時に解放されてからは研究室インしたものの全く研究に対するやる気が出ず、ぼーっとTwitterを見ていた。そうすると、ふと、自分のツイートをテキストマイニングにかけてみたらどんな結果が出るだろうかと思った。ということで、Twitterのツイート履歴取得機能を利用して自分のツイートデータを全て取得し、2時間ほど加工してから家に帰った。ちなみにこの加工作業がまあまあめんどくさかった。

 

【 10月17日(水)】

16日も結局夜更かししてしまったため、またしても15時起床となってしまった。自分でも学習能力が無いなぁと思いながら身支度をし、17時から大学で行われる政治史の講義に出席した。この講義は僕が大学院で唯一主体的に受講している講義で、レベルがとても高く、そして非常に面白い。2年連続で受講(正確には聴講だが)していて、例えば去年は1900年代初頭のイギリス駐日公使の日記(当然英語の日記である)を読解したし、今年の春学期には「平民宰相」で有名な原敬の日記を読解した。ちなみに今学期は教授が書いているテキストを掘り下げて輪読した後、再び先ほどのイギリス駐日公使の日記を読解する予定である。この日扱ったテキストのテーマは歴史認識問題だった。来週、すなわち10月24日には僕が第二次世界大戦について報告することになっている。講義が終わった後は研究室に戻り、5時まで来週の報告の準備を進めてから家に帰った。結局この日も布団に入ったのは6時だった。

 

【 10月18日(木)】

この日は指導教授から15時に大学院の講義に出席するよう指示されていたこともあり、13時に起床した。政治と司法の関係についての講義だった。講義が終わった後、16時半から19時半まで3時間、研究指導を受けた。指導の大半は、先日提出した利益団体調査の報告書についてで、かなり色々とアドバイスをいただけた。また、論文化のGOサインもいただき、11月末までを論文提出の目途とすることとなった。これで、来月いっぱいは締め切りに追われることになりそうだ。研究指導を受けた後は12時まで研究室で報告の準備を進め、翌日2限に予定されているTAの授業に間に合うように2時に寝た。普段の僕からすれば、2時に寝るというのはとても珍しいことだ。

 

【 10月19日(金)】

この日はなんと朝9時に起きた。普段15時起床の生活を繰り返しているこの僕が、なんと朝の9時に目を覚ましたのである。僕は金曜2限のTAを絶対に遅刻することができない。なぜなら、秋学期が始まる前、担当の教授との打ち合わせ(しかも16時からの)を寝坊してすっぽかしてしまった経験があるからだ。僕が人生で初めて人に「菓子折り」を持って行ったのが、あの時だった。幸いなことに、あれ以来、まだ遅刻してはいない。TAが終わった後14時から18時まで研究室で報告の準備をして、その後はバイトだった。もともとはバイト先の新人歓迎会に参加する予定だったのだが、シフトに空きが出てしまうということで僕が代わりにそこに入った。後輩に説明してもほとんど理解を示してもらえないのだが、僕がシフトに入ることで、後輩が代わりに飲み会を楽しめるのであればそれでいいのだという考え方の下に僕はこのような行動を取っているわけで、別に飲み会が嫌いとかそういった理由ではない。ところで、この日飲み会に行かず代わりにシフトに入ったことで、今までしっかりと話してこなかったとある人物と落ち着いて話す機会を得て、そしてその人がとても個性的で面白い人だということに今更気が付いた。もっと早くから気付いておくべきだった。ただただ残念だが、卒業してしまう前にその面白さの片鱗を見れたというだけで、飲み会を欠席しただけの価値はあった(「酸っぱい葡萄」ではない)。で、この日は朝が早かったこともあり、1時くらいには眠りについた。

 

【 10月20日(土)】

眠りについたのが早かったのもあって、今日も朝の9時に目が覚めた。非常にいい傾向である。もっとも、今このブログを深夜4時に更新している時点で、明日9時に起きれる可能性は消滅している。明日はせめて11時には起きたい。今日は朝10時から16時まで、大学の図書館の受付アルバイトだった。先ほどもこのアルバイトが出てきたが、このアルバイト、来室者さえいなければ基本的に自分の研究をしていても構わない。そして土曜日に図書室(ちなみに大学の図書「館」ではなく、研究棟の図書「室」である)に来る人間など、そんなに多くはない。よって、今日は静かな環境で研究を進めながら、給料をいただくことができる素晴らしい日だった。前から進めていた報告の準備もほとんど完成し、後は論点などを詰めるのみである。受付アルバイトが終わると、16時から21時まで研究室で読書した。読んだのは井上寿一『昭和の戦争 日記で読む戦前日本』(講談社学術文庫)で、単純に次週の報告担当箇所が第二次世界大戦であったからである。ここでは文献のレビューをするつもりはないが、戦争に至るまでの過程を様々な人物の日記から検討しているだけあって、これまでに読んだ第二次大戦関係のどの文献よりも「現実味」があった。どうしても歴史上の人物となると彼らはみな非常に合理的で、熟考を重ねたうえで歴史的「選択」を行うものであると思いがちであるが、日記を通して等身大の彼らを見ることで、そんなことは全くなく、歴史上の人物もしばしば非合理的で、視野狭窄に陥ったまま「選択」を行ってしまうものであるということがよく分かる。さて、22時から日をまたいで1時までは飲食のアルバイトをした。後から考えれば、今日は1日アルバイトデーであった。1日で1万円くらいは稼いだんじゃないだろうか。

 

ということで、1週間を振り返ってみたが、いざ振り返ってみると意外と3500字くらいにはなるようである。であれば毎日500時くらいのコンパクトな記事を書いた方が、絶対に楽で時間もかからず合理的なのだが、やはり僕もまた非合理的で視野狭窄な人間ゆえ、こんな選択をしてしまうのだ。