話題別コーパスが拓く日本語教育と日本語学 ひつじ書房 2023年12月

これは何?

話題によって使用される語彙が変わるのは当然ですが、実は文法もかなり話題の影響を受けているのではないか? 私の過去の研究からこのような疑問が浮かび上がり、これを解決するために話題ごとに言語形式を調査するのに特化した二種類の言語資源『日本語話題別会話コーパス:J-TOCC』と『話題別日本語語彙表』を構築しました。
この2つの資源の完成記念シンポジウムが2022年3月に開かれましたが、そこで発表された言語形式と話題の意外に密接な関係に関する知見の数々を収めた論文集です。J-TOCCは(おそらく)世界初の話題別会話コーパスで、様々な目的に使用することができます。本コーパスを使用して研究される際にはぜひご一読ください。

どんな内容が書かれているの?

3部構成になっており、「第1部 『日本語話題別会話コーパス:J-TOCC』と『話題別日本語語彙表』」「第2部 話題と言語現象」「第3部 話題と日本語教育」です。各部に収められている具体的な論文の執筆者とタイトルはひつじ書房さんのページをご覧ください
また、第1部の内容のうち主要な部分は、シンポジウムでの趣旨説明として動画公開をしております。本書の問題意識を知るには良いと思います。もちろん、これは本書のごく一部であり、「話題」という補助線をいれることで、日本語学・日本語教育双方に有益な知見が得られるということが、本書全体で示されます。論文の方向性が多様なのは意図的で、「話題」という新しい研究領域を拓くために、執筆者各自の考えで書いていただきました。

ミニストーリーで覚える JLPT日本語能力試験ベスト単語N1 合格2600 ジャパンタイムズ 2023年10月

JLPTでN2を目指す人のための単語帳です。「食事」から「科学」まで27のトピック。それぞれのトピックでよく使われる語をユニークな例文で楽しく学びましょう!最新のコーパス言語学の知見を生かし、科学的に「よく出る組み合わせ」を1つの例文でまとめて提示することにより、少ない文で効率的に単語が覚えられます。また、【例文⇒単語】の形式で、読解力も同時に身に付きます。

英語・中国語・ベトナム語訳つき。単語・文の音声はYou Tubeで聞くことができます!Kindle版もあります。

ミニストーリーで覚える JLPT日本語能力試験ベスト単語N2 合格2400 ジャパンタイムズ 2022年11月

JLPTでN2を目指す人のための単語帳です。「食事」から「環境・科学」まで23のトピック。それぞれのトピックでよく使われる語をユニークな例文で楽しく学びましょう!最新のコーパス言語学の知見を生かした一冊!

英語・中国語・ベトナム語訳つき。単語・文の音声はYou Tubeで聞くことができます!Kindle版もあります。

ミニストーリーで覚える JLPT日本語能力試験ベスト単語N3 合格2100 ジャパンタイムズ 2021年10月

JLPTでN3を目指す人のための単語帳です。「食事」から「社会」まで17のトピックに別れていますが、それぞれのトピックでよく使われる語を『話題別日本語語彙表』や『日本語話題別会話コーパス:J-TOCC』といった最新のデータを基に選択していることが特徴です。話題ごとに抽出された語を基に短文を作り、ストーリーやトピックの力を借りて単語を覚えることができます。

英語・中国語・ベトナム語訳つき。単語・文の音声はYou Tubeで聞くことができます!Kindle版もあります。

『場面とコミュニケーションでわかる 日本文法ハンドブック』 ひつじ書房 2021年5月

これから日本語教師を目指す人や新人日本語教師のための、日本語文法の解説書です。従来のハンドブックとの違いは、例えば各種教科書ではその形式はどのように扱われているのかといったことや、教案の流れなどが書かれている点にあります。また、各種コーパスのデータも駆使されています。教育実習も含む日本語教員養成で活躍する本です。

中俣は「引用」「自他」「モダリティ」「のだ」の原案執筆と、それから全項目について母語話者のコーパスデータを提供しました。例えば、「のだ」については詳細な文法的解説よりも先に、「~んですけど」というフレーズがコミュニケーションにおいて非常に重要な役割を果たしていることを解説しています(最初はこれさえマスターすればOK!)。他にも、日常会話でよく使う形容詞ベスト20などのデータもあります。

『「中納言」を活用したコーパス日本語研究入門』 ひつじ書房 2021年4月

これは何?

「中納言」とは国立国語研究所が開発した、世界に誇るコーパス検索のためのwebアプリです。『現代日本語書き言葉均衡コーパス』をはじめ、『日本語歴史コーパス』『日本語日常会話コーパス』『日本語緒方言コーパス』『多言語母語の日本語学習者横断コーパス』など様々なコーパスを検索できます。今後、およそ「日本語」に関係する諸分野の研究で、コーパスの情報を一切参照しないということは考えられなくなると思います。この「中納言」は研究者が自分でプログラムを書いて検索するよりもはるかに簡便なアプリですが、何の知識もない状態から直感的に使いこなせるほどシンプルでないこともまた事実です。本書はその「中納言」の初めての解説書です。

どんな情報が掲載されているの?

全部で190ページほどの本ですが、実は「中納言」自体の検索方法について書かれているのは最初の60ページほどにすぎません。なぜでしょうか。それは、多くの学生たちを見ている中で、中納言を使用する困難点には大きく3つあると考えたからです。それは、「1.中納言での検索のしかたがわからない」「2.検索して得られたデータをどのように読み解けばいいのかわからない」「3.操作方法はわかったが、どのようなテーマを設定して、何を調べたらいいかわからない」の3つです。本書はこれに対して「第1部 検索してみよう」「第2部 データを処理してみよう」「第3部 研究してみよう」の3部構成で答えるものです

以下に、目次の一部を示します。

第1部「検索してみよう」はいわば、中納言のマニュアルです。以下のようなことがわかります。

  • 語彙素、書字形出現形などの用語の意味は何か
  • 形状詞、フィラーといった見慣れない品詞は何を意味しているのか
  • 検索したけど0件だった時にどうしたらいいのか
  • コロケーションを調べる時にはどのような検索条件を設定すればよいのか

第2部「データを処理してみよう」はいわば、中納言で検索したデータをダウンロードしたところから始まります。このデータはエクセル形式であり、第2部の大変はエクセルのテクニックの解説です。以下のようなことがわかります。

  • ダウンロードした例文がそもそも読みにくいのだがどうしたらいいか
  • 画面いっぱいに広がる例文から数を数えるにはどうしたらいいか
  • とても読み切れない多数の例がダウンロードされて心が折れそうな時はどうしたらいいか
  • 前文脈や後文脈にどんな語が多いかを知りたい時はどうしたらいいか

以下に、本文のサンプルをの一部を示します。左下はダウンロードしたそのままのデータだと、表の幅が狭すぎて例文が読みづらいという問題の対処法です。本書はただのマニュアルではなく、こうしたデータ分析時のちょっとした問題にも対応しています。

第3部「研究しよう」は主にこれから研究を始める人のためのヒントですが、その他にも以下のようなことを書きました。

  • 卒論ではどんなことを調べればいいのか
  • エクセルで計算したら小数点第7位まで出てきたけど、そのままレポートにはりつけてよいのか
  • コーパスの例文を引用する時は、出典はどう書けばいいのか
  • ログイン画面にある「まとめて検索」という窓は、どういう風に使うものか

どう使えばいいの?

すでに書きましたが、今後、日本語研究にとってコーパスを検索するというのは基本スキルになると思います。様々なデータが整備されているため、計量研究を専門としない方でも、「とりあえず」「念の為」コーパスのデータを確認するという機会は増えてくると思います。計量研究を専門としないけど、最低限押さえておきたいスキルとして読んで頂ければと思います。(本格的な計量研究のためにはまだまだ必要なスキルがたくさんあります)また、コーパス研究は「うまくいかない」ことの連続です。その際にも、本書を読めばスピーディーに解決できるだろうと思います。

動画、公開します

本書に準拠した、中納言やエクセルの解説動画を>You Tubeの「中俣尚己の日本語チャンネル」で公開しています。(授業動画を基に編集したものです)。授業などでもご自由に利用下さい!また、オンライン・オフラインを問わずセミナー講師も行いますので、気軽にご相談ください!
以下は宣伝用の動画です。

正誤表

正誤表につきましては、ひつじ書房のサイトよりダウンロードしてください。

『中国語話者に教える』 webjapanese 2021年3月

特に中国国内で日本語を教える人に対して、中国の教育制度、語学、日本語の学習環境から、中国語話者にとって難しいところ、言語が似ていることから来るトラップ、微妙に違う漢字、中国語で説明したほうが早いところなどを0から整理した本です。Amazonの電子媒体のみの販売です。出版社による解説はこちらから

私も中心メンバーになっている中国語話者のための日本語教育研究会のメンバーで執筆しました。私は中国の教育事情や学習者特性について書きました。

『コーパスで学ぶ日本語学 日本語教育への応用』 朝倉書店 2018年9月

日本語教育への応用

共著で作り上げたコーパス言語学の入門的な教科書です。特に日本語教育に関心のある方が、最初にコーパスに触れる際におすすめの一冊です。

私は「学習者話し言葉コーパス分析」を担当。『日中Skype会話コーパス』を題材に、テキストエディタのみを使って分析を行っています。日本人は否定する時に「いいえ」を使わない!?など読むだけでも面白いトピックを揃えました。

『中国語話者のための日本語教育文法を求めて』 日中言語文化出版社 2017年11月

中国語話者のための日本語教育文法を求めて

大学院時代にお世話になった張麟声先生の還暦を記念して、関係者で作った論文集です。特に、張先生が提唱する対照研究(記述言語学)・誤用観察(コーパス言語学)・検証調査(第二言語習得)の3つからなる三位一体の習得研究を実践することを目指しました。

私は学友の陳建明氏と共著で副詞に関する論文を一本と(私の担当はコーパス調査)、あとがきで張先生との思い出を振り返りました。

『コーパスから始まる例文作り』 くろしお出版 2017年5月

コーパスから始まる例文作り

これは何?

『現場に役立つ日本語教育研究』シリーズの第5巻として出版した論文集です。ハンドブック寄りの論文集で、中上級の日本語教育、特にアカデミックライティングで必要になる項目に焦点を当て、 『文法コロケーションハンドブック』同様にコーパス調査のアプローチで、「この項目は実際にはどのように使われることが多いのか?そもそも本当に使うのか?」をまとめ、例文作りに役立つ情報を提供します。文法研究や日本語教育の現場で実績を持つ10人で執筆し、1人10形式以上扱うため、ハンドブックよりも情報量は多くなる予定です。「現場で使える」ようにするために、「先行研究の節をなくす」「まとめと今後の課題をなくす」「見出しをキャッチ―に」など編者としていろいろ無茶な注文を出しました。私は編集に加え、前書き、序章(解説)、条件・逆接条件の章、原因・理由の章を担当します。

どんな情報が掲載されているの?

扱っているのは、中上級項目119で、以下の10の章に分類されています。

  • 話題・対象を表す表現
  • 状況・場合を表す表現
  • 時を表す表現
  • 様子・予想・傾向を表す表現
  • 条件・逆接条件を表す表現
  • 原因・理由を表す表現
  • 逆接を表す表現
  • 意志・願望・判断を表す表現
  • 伝聞を表す表現
  • 否定を表す表現

各章で、平均12ほどの形式を扱っています。各章の最初のページは以下のようになります。

それぞれの項目について、以下の情報を元に、典型的な使われ方と類義表現との違いを示しています。

  • 頻度(よく使うかどうか)
  • 前接語の品詞の割合(動詞文が多いか、形容詞文が多いか)
  • 前接語(どんな組み合わせで使われるか)
  • 前文脈・後文脈に多い語(同じ文に多い副詞や、文末の形は何か)
  • レジスター(硬い文章に多いのか、柔らかい文章に多いのか)
  • 生産性指数(使えるシチュエーションは多いのか、限られているのか)

以下は、各節の冒頭の見本です。文法コロケーションハンドブックでも中心だった前接語は、全形式に掲載しています。

以下は、各節の後半部の見本です。巷の論文にありがちな<2.1 「としたら」>のような無味乾燥な見出しだけでなく、<●思考の枠組みを提供する「とすると」、真偽が定かでない「とすれば」>のようなキャッチーな見出しを適宜つけ、ぱっと見て内容がわかるようにしました。

どう使えばいいの?

この本は例文集そのものではありません。むしろ、例文を考える材料として使っていただければと思います。例えば、前接語のリストは具体的な例文を考える時に役に立ちます。また、自分で作ってみた例文がしっくりこないという経験は教師の方なら誰しもあると思いますが、 「状態を表す語と相性が良い」「文末はテイル形が多い」という傾向レベルのルールに違反していて、そのせいで「引っかかる例文」になっていることがあります。そういったチェックに使えます。本書で採用した「生産性指数」(詳しくはこの論文をご覧下さい。)は生産性の低い項目の指標になります。生産性の低い項目とは、限られた項目としか(実は)接続しない項目です。一例を挙げると、「どう~ても」は生産性の低い項目で、「どう考えても」「どう見ても」「どうやっても」ぐらいしか コーパスでは多く出現しません。そうすると、「どう~ても」というスキーマに学習者に自由に動詞を入れさせて、例文を作らせるような練習は悪手である言えます。「どう~ても」の生産性指数を計算すると2.81となり、生産性が低いことがわかります。

セミナー、やります!

一見とっつきにくい本ですが、使い方やさらなる解説を話すセミナーを行っています。どこでも執筆者がかけつけますので、お気軽にお声掛け下さい。
2018年3月4日に聖心女子大学で行われたワークショップの資料がダウンロードできます。
発表スライド(zipファイルです。解凍するとpptファイルが出てきます)
内丸の動画   (vimeoというサイトに飛びます。パスワードは”reibun”です)

『日本語文法研究のフロンティア』 くろしお出版 2016年5月

日本語文法研究のフロンティア

私の指導教員でもある野田尚史氏の還暦を記念して編まれた論文集です。様々な分野の第一線の研究者が「新たな領域を開拓する」ための論文を寄せて下さり、大変読み応えのある一冊となっております。私は評価的意味研究に関する提言的な論文1本と、あとがきとして大学院生時代のエピソードを掲載しております。実はこのエピソードにはさらに続きがあるので、いつかどこかで公開できればと思います。

『日本語並列表現の体系』 ひつじ書房 2015年2月

日本語並列表現の体系

これは何?

私の博士論文を科研費の研究成果公開促進費を受けて出版したものです。日本語に存在する多種多様な並列表現についての記述を初めて1冊の本としてまとめました。

どんなことが書かれているの?

本書は日本語の並列表現を「包括的」かつ「体系的」に記述しました。

まず、包括的とは多数の形式を扱ったとういうことです。本書では3つの品詞カテゴリーを扱い、具体的には「並列助詞」として「と」「や」「も」「、」「か」「とか」「やら」「だの」「だか」「なり」「に」、「並列を表す接続助詞」として「ば」「し」「て」「連用形」「たり」「わ」、「並列を表す接続詞」として「それから」「そして」「また」「さらに」「しかも」「それに」「そのうえ」「φ」「一方」「次に」「なお」「または」「あるいは」「もしくは」「ないし」「それとも」と33種類の形式を扱っています。より詳しくはひつじ書房のページで目次を確認することができます。これだけ多数の並列表現形式を一度に扱った研究は、本書が初のものです。

次に、体系的とはどの形式に対しても同じ用語で説明を行ったということです。異なる形式に異なる用語を使っていては体系性は見えてこないからです。本書では主として「網羅性」と「集合の形成動機」の2つに注目しました。

網羅性とは、並列表現によって結びつけられた要素が常にセットとして扱われるか否か、という概念です。例えば、「私は毎日ビールとワインを飲む」では、ビールとワインの両方を毎日必ず飲むという解釈になるのに対し、「私は毎日ビールやワインを飲む」ではどちらか一方でも構わないという解釈になります。これを「と」は「+網羅性」、「や」は「-網羅性」と表現します。一方でこの網羅性は統語的位置によっても変化し、「1組と2組の男子」のように名詞句の中に入れると、同じ「と」でも1組か2組のどちらか一方でも構わなくなるという面白い現象がいくつもあります。

集合の形成動機とは並列される要素がもともと意味的にどのような結びつきがあるのか、という概念です。例えば、「数学や体育が好きだ」は「数学や理科が好きです。」よりも許容度が下がりますが、これは「や」が類似性を必要とするからと説明できます。他方、「と」はそのような制約をもたないので、「数学と体育が好きです。」は文脈なしに容認できます。

この2つの概念に加え、「事態の提示方法」や「排他的推意」(後者は従来の一部列挙・全部列挙という概念に相当しますが、これは便宜的ではあっても本質的な区別ではありません)といった特性も考慮し、体系化を行いました。その結果は、ぜひ本書を読んでご確認下さい。

どんな特徴があるの?

本書の方法論としては心理実験やコーパス調査を行っています。特にコーパス調査は得られた用例に重層的に11種類のタグを付与し、そのパターンから各形式の体系を作るという手法を用いており、BCCWJ完成前の2008年に行われた研究としてはかなり独創的なものです。

もう一つの特徴として、日本語教育への応用を念頭に置いた平易な記述を心がけました。また、例えば読者が「それに」について知りたいときは、他の章を読まずに「それに」の章だけ読んでも私の主張が伝わるようにしました。十全なものとは言えませんが、ハンドブック的な使い方も想定しています。また、類義表現の比較の表もあります。

手に入れるには?

本書の表紙バナーからどうぞ。Amazonにリンクしています。

日本語教育のための文法コロケーションハンドブック くろしお出版 2014年11月

日本語教育のための文法コロケーションハンドブック

これは何?

初級で扱うことの多い約100項目の分布項目と共起することが多い実質語をコーパスを使って調査し,まとめた本です。例えば,「てある」だったら,「書いてある」が圧倒的多数を占めます。また,「ておく」だったら「しておく」の次に「入れておく」が非常によく使われるということがわかります。

全ての項目についてよく共起する動詞/形容詞・名詞を調べました。使用したコーパスは『現代日本語書き言葉均衡コーパス』で検索には「中納言」を利用しています。また,代表的な教科書7冊で扱われている例文を調査し,それが実際にどれぐらい使われているかも掲載しています。 (以下の見本の左下に表があります。左半分がコーパスに多い動詞で,右半分が教科書に多い動詞です。)

どんな情報が掲載されているの?

メインの情報はその文法項目と共起する動詞,形容詞,名詞(これを文法コロケーションと呼びます)ですが,その他にも必要に応じて以下の情報が掲載されています。

  • 名詞+動詞+文法項目まで拡大したコロケーション。
  • 後ろの形。丁寧体で使われるのか,普通体で使われるのか。ル形が多いのか,タ形が多いのか。
  • 複数の用法がある場合,各用法の割合。
  • どんなジャンルに出現するのか。

また,国立国語研究所領域指定型プロジェクト「学習者コーパスから見た難易度に基づく語彙・文法シラバスの構築」共同研究会で行ったポスター発表にも具体的な情報がありますので,参考にして下さい。 PDFファイルを見る。(472kb)

何の役に立つの?

元々の構想では,授業で例文を作る時に役に立つのではないかと考えていました。特にノンネイティブの教師の方が,教科書に頼らずに例文や問題を作る時に役に立つと思います。

扱ったのは初級項目ですが,書き言葉を扱った結果,初級では扱わないような実質語も出現しました。しかし,これは非常に重要なポイントです。例えば,確かに「ている」は初級で扱っていますが,しかし初級で扱ったからといってそれ以降「ている」の学習をしなくてもよいかというと大間違いです。一例を挙げると,「~が問題になっている」というコロケーションが文章の書き出しに多く使われます。これは非常に重要な「ている」の使い方です。この本はそういった応用的な使い方にも光を当てています。

また,これがきっかけで文法研究にも新しい光が当たることを期待しています。共起語の意味まで含めた記述が可能になると思われます。

最後に面白いネタを紹介しましょう。先程も紹介したアスペクト形式「てしまう」ですが,これは(完了ではなく)いわゆる「後悔」の意味を表す用法が圧倒的に多く,「なってしまう」が一番多い組み合わせです。では,その前はどのような語が来るでしょうか?イ形容詞では確かに「悪くなってしまう」「少なくなってしまう」など,悪い意味の語が多く出現します。しかし,ナ形容詞の結果は,予想外のものでした。

そう,『ロミオとジュリエット』のような関係を表すときにも「てしまう」は使われるのです。「てしまう」の本質は後悔とか悪い事ではなく,「意図していなかった」という一点にあることがこのことからもわかります。

そんな訳で,元々は駆け出しの日本語教師の方が例文を作る参考になればと思って始めた企画ですが,日本語の読み物としても楽しめる一冊になったのではと自負しております。

手に入れるには?

本書の表紙バナーからどうぞ。Amazonにリンクしています。

セミナー、やります!

この本の使い方やさらなる解説を話すセミナーを行っています。お気軽にお声掛け下さい。過去の資料の一例です。