iamaheroのブログ

iamaheroのブログ

オーストラリア在住者が書くブログ

MENU

英会話を伸ばしたい方必見!英語字幕のテキスト解析から示唆されたこと | 日本人のための英語習得Tips


スポンサードリンク


『日常的な英会話で頻用される語句を何とかピックアップできないか?そしてそこから何かおもしろい発見があるかもしれない』

そんなことを思っていたときに、ふと、「英語字幕のテキスト解析」をしたら、日常会話での頻出語句をピックアップできるのではないかと考えついた。

当記事では、筆者がおこなった字幕のテキスト解析とその結果、結果から示唆されたことを共有したい。ちなみに、目新しい大きな発見などはなく、「一般に英語学習者向けに言われていることが、テキスト解析からも支持された」というような内容となることを、あらかじめ断っておきたい。

なお、YouTubeの動画としても、より簡潔な形で当内容を発信しているので、短時間で結果の概要を知りたい方は動画を見ていただいてもよいかもしれない。

日本語 ver.  https://youtu.be/W2ElWHWnj5U
英語 ver.  https://youtu.be/gGrSYEmteK8

解析方法の概要

下記のとおり、解析方法として2つの段階を踏んだ。

1.YouTube動画からの字幕データ取得
YouTubeの動画50本を対象に、英語字幕の文字データ(テキストデータ)を取得した。動画は、英語圏で人気な「The Ellen DeGeneres Show」、「The Tonight Show Starring Jimmy Fallon」など、セレブとホストのあいだで自然な会話が繰り広げられているものを対象とした。ニュース番組やスピーチなどは、フォーマルな表現が多いと推察されたことから対象から除いた。また、英語Dialects(英語方言)のバイアス(偏り)をなるべく除くために、アメリカ英語だけでなく、可能な限りイギリス英語、オーストラリア英語、アイルランド英語が話されている動画も選んだ。また、性別によるバイアスも除くことを考え、動画に出演している英語ネイティブの男女比に大きな偏りがないように選んだつもりである。

2.字幕データのテキスト解析ツールへの投入
取得した文字データをひとまとめにして、テキスト解析ツールに投入し、解析にかけた。解析ツールとしては、オンラインのフリーソフト、「Text Analyzer(Online-Utility.orgが提供)」を使用した。

結果

下記のとおり大きく3つの結果が得られた。結果の詳細は、下記リンクからExcelファイル(編集は不可)としてダウンロードできるので、詳細まで見たい方はそちらをご覧いただきたい。
結果ダウンロード: Dropbox - The Results of the Text Analysis of Subtitles

■ 頻出語句のほとんどが、易しい英語表現
 おそらく、高校卒業までに覚えることとなっている英単語、英熟語によって、『動画で5回以上使用されていた英語表現』の90%以上をカバーしているのではないかと推測される。10回以上使用されていた英語表現となると、中学卒業までに覚える表現でも9割近くをカバーしていると推測される。

■ 英会話でよく使用される英語表現がピックアップされた

- 固定的なフレーズ

 you know(使用されていた回数:217回)、I mean(94回)、kind of(62回)、sort of(40回)、something like that(8回)など、日常会話でよく耳にする固定的なフレーズをピックアップできた。

- 特定の副詞表現
 definitely(使用されていた回数:21回)、absolutely(20回)、exactly(13回)など、共感・同意するときや、相槌を打つときに使う副詞が高頻度で使われていた。また、obviously(22回)、basically(11回)、literally(10回)など、会話文を修飾する(会話文そのものに微妙なニュアンスの違いを与えるような)副詞も使われていた。これらの副詞句は、特に英会話を習得し始めたばかりの方の口からは、ぱっと出てこないようなものと推察される。

- 仮定法・仮定法過去の表現
 would have been(使用されていた回数:9回)、that would be(9回)、it would be(6回)、it would have been(6回)など、仮定法表現(仮定法過去も含む)の出現頻度がそこそこ高かった。この仮定法表現は、そこそこ英会話を習得してきた人であっても、スムーズに使いこなせる人はあまり多くないと思われるものである。

■ 5語以上から成る熟語については、固定表現がほぼ抽出できなかった
5語以上となると、話題特有の表現が多くピックアップされ、話題に関わらず広く使用されるような固定フレーズはほぼ抽出されなかった。そんな中でもピックアップされたものの例としては、thank you so much for(使用されていた回数:5回)、you know what i mean(4回)、I haven't seen you since(3回)などである。

結果から示唆されること

■ 高校卒業までの語彙力だけでも、大まかに話せて、聞けるはず
「中学レベルの英語力(文法、語彙力)があれば、日常的な英会話は十分可能」
読者の方も、こうした類の話を一度は耳にしたことがあるだろう。私は、こういう類の話を聞くたびに、「んなわけあるかい!」と思っていたが、少なくとも筆者がおこなった解析の結果を見る限り、大きく外れてはいないようだ。語彙力に関していうと、中学、高校レベルのもので十分ということができるかもしれない。あるいは、最低限、高校卒業までに習得する語彙力(筆者がこれまで易しい単語・熟語と書いてきたもの)がないと、なかなか英語をスムーズに話したり日常的な会話を理解したりするのは難しいとも言えるかもしれない。そしてもちろん、『易しい表現を知っていれば十分』というのは、自分の言いたいことを大まかに伝えたり、大まかに会話の内容を理解したりするためには十分という意味で、やはり、微妙なニュアンスや詳細を伝えたり聞いたりするためには、高校卒業までの語彙力では足りない場面も往々にしてあるはずである。

■ 会話特有の表現の習得が英会話力の向上につながる
結果から、頻用されていた固定フレーズ、副詞、仮定法表現などがピックアップされた。それらは、筆者個人の見解からすると、書かれることが少ない英語表現であった。特にフォーマルなニュースやエッセイ、論文等の中では、書かれることが少ないはずだ。このことから、日常会話で頻用される表現というのが『書かれる英語表現』とは別であることが示唆され、それら表現使いこなせていない方は、使いこなせるようになることで、会話力を伸ばすことができると思われる。 

■ 話す(スピーキング)力、聞く(リスニング)力を伸ばす最初の段階として必要なこと
日常会話でよく使用されている語句は、簡単なものがほとんどだという結果が得られた。このことから、特に英会話を習いはじめたばかりの方で、「スムーズに英語が話せないし、なかなか聞きとれない」という方の英語習得にとって、下記の段階が重要だと思われる。

スピーキングについて、『話す際に、いかに簡単な語句を使いこなせるようになるか』。話す力を伸ばそうと思い、難しい文法を覚え、語彙力を増やそうとしている方は、今一度、「自分が知っている範囲の語句を会話中で使いこなせているか」を見直してみるとよいかもしれない。「いかに使いこなせるようになるか」という点については、英語ネイティブの会話を生で、あるいはYouTube等の動画でたくさん見ることで覚えていくことが最も良い方法だと筆者は考えている。

リスニングについて、『いかに簡単な語句を聞き取って理解できるようになるか
。こちらもスピーキングについてとほぼ同様である。聞く力を伸ばそうと思い、文法力や語彙力を上げようとしている方は、「自分が知っている範囲の語句を会話中から聞き取れているか」を見直すとよいだろう。「いかに聞き取って理解できるようになるか」については、これも、英語ネイティブの会話をたくさん聞いて覚えていくことが最も良い方法だと考えている。
特に英語ネイティブの会話から覚えるべき点は、「頻用される単語の組み合わせ」、「発音」、「使われる場面」の3つである。最近筆者が、日常会話で聞き取れなかったものの中で強く印象に残っているものを1つ例に挙げると、職場の同僚(イギリス出身)と話していて、「I haven't seen much of him」の「much of him」が聞き取れなかった。「much of him」というように「易しい単語が組み合わせて使われる」ことを知らず、そしてその「発音」にも馴染みがなく、「使われる場面」も合わせて知らなかったことから、2回言われても理解できなかった。3度目はかなりゆっくり言ってもらえるように頼んだのでやっと聞き取れた。

以上が、私が行った英語字幕のテキスト解析とその結果、そして結果からの示唆である。「すごく新しい!」というような発見はなかったが、『日常会話で使われている英語は簡単』ということについて、ある程度客観的な結果が得られたこと、自身の疑いが晴れたことが1つ収穫かなと思っている。また、こうして、英会話を習得中の方にも参考にしてもらえそうな情報を提供できるに至ったのも大きな収穫である。みなさんの英語習得にとって少しでも役立つ情報であったなら筆者としては嬉しい。