Praat備忘録

Praat備忘録  その1
Praat 6.2.14ではサウンドエディターから選択範囲の時間を求めるために開始時刻と終了時刻から計算をしていましたが,Praat 6.3.03 (以降) では「Time」のタブができていて,便利になりました。DurationやPauseの時間を計る際,便利です。

Praat備忘録 その 2
Praat 6.3.03と,6.4.07ではピッチ曲線の出力結果が異なります。

Ver. 6.3.03 (Pitch setting 100-400Hz)

Ver. 6.4.07 (Pitch setting 100-400Hz)

パルスの結果も異なっています。

6.4.07 はデフォルト設定でも聴覚で確認した音に近く,Pitch setting を変えるとより聴覚通りの音に表示されるようです。

備忘録 Prosody Proの使い方

Prosody Proの使い方についての備忘録です。
スクリプトファイル (_ProsodyPro.praat) をダウンロード。
任意のフォルダを作成し,スクリプトファイルをフォルダ内に移動させる。
分析したい音声ファイルもフォルダ内に移動させる。

「1. Interactive labeling」を選択すると,フォルダ内のwavファイルを検出し,テキストグリッドを作成できる。複数ファイルがあるときは,テキストグリッドの記述を終えた後「next」をクリックする。
テキストグリッド記述後,諸データが作成される。
「ファイル名.actutimenormf0」「ファイル名.actutimesemitonef0」は,テキストグリッドの各項目内を10カ所に分け,実際の時間とfoが抽出されたタブ区切りテキストファイル。縦方向に記述される。

「3. Get ensemble files」を選択すると,以下の分析結果がそれぞれtxtファイルで出力される。

Ensemble files saved (以下,拡張子は全て.txt)
1) normf0txt
2) normtime_semitonef0
3) normtime_f0velocity
3a) normtime_f0acceleration
4) normtimeIntensity
5) normactutime
6) maxf0
7) minf0
8) excursionsize
9) meanf0
10) duration
11) maxvelocity
12) finalvelocity
13) finalf0
14) meanintensity
15) samplef0
16) f0velocity
16a) f0accleration
17) maxf0_loc_ms
18) maxf0_loc_ratio

「normf0.txt」には,「ファイル名.actutimenormf0」の時間の記述がなく,生周波数のみ記述される。「normtime_semitonef0.txt」は同様だが,セミトーンで記述されている。いずれも横方向に出力される。

I want a new pencil case. (単語数6 音節数7)

actutimesemitonef0

Z scoreを算出

(参考)各音節のZ score

Pitch setting 75-600

Pitch setting 100-400

Pitch setting 50-200

なお,外れ値の検出はサウンドエディターのピッチ曲線を参照するのがよいと思われる。

文: I want to be a pharmacist. (単語数6, 音節数8)

こちらはPitch setting75-600なので,設定次第で変わるかも。

Here We Go! 5 の3学期単元構成について

3学期の授業を実施しての,備忘録です。
5年生の3学期に,光村図書出版 Here We Go! 5 のUnit 7 (の後半), 8, 9を実施しました。
Unit 7は “What would you like?” Unit 8は “Where is the gym?” Unit 9は “My hero is my brother.” です。
どの単元も楽しく活動ができます。
Unit 7, 8は,カードや教具を用いて買い物の活動をしたり,教室内の机を並び替えて道案内をしたりと,様々なアクティビティを通じて学習できる単元です。
一方,Unit 9は,あこがれの人についての発表に繋げられる単元です。
3学期はUnit 7→ 9→ 8の順に実施すると,活動中心,発表中心,活動中心の構成となり,メリハリがつき,評価も実施しやすくなると思いました。

部活動における club と team (以前の記事に追記しました)

光村図書 Here We Go! 6 Unit 9 では、中学校生活がテーマとして扱われています。
部活動の表現として、 “team” と “club” があります。
Club
・ art club, computer club, dance club, drama club, kendo club, newspaper club, science club
Team
・ baseball team, basketball team, soccer team, track team, volleyball team

「クラブ」と「チーム」の違いは何でしょうか。
児童に尋ねると、様々な考えと反論がでます。

・ クラブは「文化部」、チームは「運動部」 → 「剣道部」は運動部では?
・ クラブは「屋内」、チームは「屋外」 → 「バスケットボール」「バレーボール」は屋内では?
・ クラブは「個人」、チームは「団体」 → 「陸上部」は個人では?

ALTに確認したところ、部活動は「クラブ」という大きな枠があり、その中の「競技的な (competitive)」ものは「チーム」になると感じる、とのことでした。

では、「剣道は競技では?」という疑問があります。
「剣道は武道 (martial arts) だから、競技とは異なる」との答えでした。
ALTの考えを伝えると、児童も納得できたようでした。

この考えを使うと、教科書に挙げられていない部活にも応用できます。

・ tennis は? → 競技だから “team”
・ table tennis は? → 競技だから “team”
・ judo は? → 武道だから “club”

ちなみに、 kendo はイタリック体で書かれています。理由を尋ねると、「日本語だから」と即答できました。では、「judo は?」と尋ねると、ほとんどの児童は「イタリック体になる」と答えます。
実は、柔道はイタリックになりません。教科書の以前のページに扱われていたのですが、柔道は英語となっていますので外来語扱いにはなりません。

以前用いられていていた We Can! と比較すると、面白いことに気づきます。 Here We Go! では dance club ですが、 We Can! では dance team になっています。児童に紹介すると、「おかしい」という意見が聞かれます。

ALTに尋ねると、「楽しむための団体はクラブであり、競技で勝つための団体はチームだと感じる」との答えでした。
確かに、Here We Go! のイラストは「ダンスを楽しんでいる」感じがあり、 We Can! のイラストでは「同じユニフォームを着て競技に参加している」感じがします。

“Where is the gym?” の授業を実施してみて

光村図書 Here We Go! 5 のUnit 8 “Where is the gym?” の授業を実施して感じたことです。
中学年外国語活動教材 Let’s Try! 2 や, 以前高学年外国語活動で使われていた We Can! 1 では、 “Turn right.” “Turn left.” “Go straight.” しか用いられていません。We Can! 1 では交差点ごとに点があり、 “Go straight.” で点まで移動するという手法で道案内をしています。「右に曲がってください」「左に曲がってください」「まっすぐに行ってください」の3つの表現のみです。

参考
道案内の目印シール
Where is the treasure?

一方、Here We Go! では “Go straight for two blocks.” “Turn left at the second corner.” “You can see it on your right.” 等、表現が増えています。「2ブロック直進してください」「2つ目の角を左に曲がってください」「右側に見えますよ」等、実際の道案内で使われるであろう表現が扱われています。
この単元では、表現のみでなく、概念、語順を指導する必要があります。

まず、「ブロック」という概念が、日本語にはあまりありません。コンパスローズ英和辞典によると、blockとはstreetで囲まれた1区画を指します(下図参照)。

2ブロック先を右折する指示は、 “Go straight for two blocks. Turn right.” となります(下図参照)。交差点と交差点の間は1ブロックなのか、2ブロックなのかが少し分かりにくく、図で見ると「1.5」ブロックに見えますが、自分がいる場所も「1ブロック」に入りますので、2つ先の角は2ブロック先になります。

1ブロック先の(次の)角を曲がるときは、すぐ角ですから “Go straight for one block.” とは言いません。”Turn right.” で伝わります(下図参照)。
※ “one block” は言わない、というのはポイントになります。

では、目的地が次の位置にある場合(下図参照)、どう表現するでしょうか。

右折してから2ブロック先に目的地があるので、右折してから “Go straight for two blocks. You can see it on your left.” となります(下図参照)。図で見ると1.5ブロックに見えますが、2つ目のブロックなので、 “two blocks” になります。

では、目的地が次の位置にある場合(下図参照)、どう表現するでしょうか。右折してから1ブロック目なので、 “Go straight for one block.” は言いません。単に “You can see it on your left.” となります。

「ブロック」の表現を練習させた後、 “Turn right at the second corner.” を指導します。日本語の感覚からすると、「2つ目の角を曲がってください」と言う方が自然に思えます(下図参照)。

簡単そうですが、この表現には3つの難しさがあります。
1つ目として、序数を使うということです。 “One, two, three…” はすぐに言えても、 “First, second, third…” はちょっと考えないと発音しにくい児童が多いです。
2つ目として、日本語は「『2つ目の角を』『左に』曲がってください」という語順ですので、 “second corner” “turn right” の語順で言いがちです(それでも通じますが)。
3つ目として、「語順が逆になる」と意識すると、”Turn right” と言った後、しばらく考えてから “at the second corner.” と言いがちなので、聞いている児童は「1つ目の角?」「2つ目の角?」と混乱します(下図参照)。
“Turn right at the second corner.” は一続きで成立する文なので、途中で切ってしまうと “Turn right.” として認識されてしまいます。

“Turn right at the second corner.” の文は、発音するのには難しさがありますが、聞くだけならこちらの方が簡単です。
「2つ目の角を曲がってください」という言い方は、「ブロック」の表現を練習し、充分に聞いた後、挑戦させる方が負担が少ないようです。

各社の教科書を見てみると、ブロックの表現が使われているのは、Here We go! 5 (光村図書)、NEW HORIZON Elementary! 5 “Where is the post office?” (東京書籍)、 CROWN Jr. 5 “Try 道案内” (三省堂) でした。
“Turn right at the second corner.” (2番目の角)の表現が使われているのは、Here We go! 5 (光村図書)、NEW HORIZON Elementary! 5 (東京書籍)、 CROWN Jr. 5 (三省堂)、 ONE WORLD Smiles 5 “Where is the station?” (教育出版)でした。

「ケン」と「キャーンt」

「できる」「できない」を表す助動詞 “can” “can’t” は、聞き取りが難しい音です。

教科書のリスニング問題で “I can …” “I can’t …” が混じった発話を聞いて「できること」を選ぶ問題では、多くの児童が「分からない」と困惑していました。
何となく、 “can” は「キャン」 “can’t” は「キャント」という音だと思いがちです。ところが「キャント」の「ト」の音がほとんどしないから、難しく思えます。

私はPraatを用いて、”can” “can’t” の音を提示しました。
まず、”can” “can’t” が登場する動画を見せました。
以下の動画が秀逸です。

“WHAT CAN YOU DO?”
https://www.youtube.com/watch?v=a91oTyA0Oq8&t=36s

この動画の “I can smile.” をPraatのサウンドエディタで表示したところ、以下のようになりました。

“can” の部分のみ再生すると、「ケン」のように聞こえます。

一方、”I can’t swim.” を表示すると、以下のようになりました。

“can’t” のの部分のみ再生すると、「キャーンt」のように聞こえます。

長さを比較すると、「ケン」は約0.17秒、「キャーンt」は約0.41秒と、約2.4倍の違いがあります。
また波形を見ると、「ケン」は弱く、「キャーンt」は強いです。

つまり、”can” は「ケン」という音になり、短く弱い音です。
“can’t” は「キャーンt」という音になり、強く長い音です。

日本語でも、肯定するときは普通に話しますが、否定するときは強めに言いますね。
(例:同じ注意をするとき:肯定「廊下を歩きます」 否定「廊下を走りません」)

LongmanのPronunciation Dictionary (Wells, 2008) を確認すると、以下のようになります。
can → strong form [kæn] weak form [kən]
can’t → [kænt] ※アメリカ発音、[kæn] ※子音の前(母音の前もあり得る)
canと違い、弱形はないと明記されています。

“can” が「ケン」、”can’t” が「キャーンt」で、ある程度近い音になっているといえます。”can’t” に関しては、「キャーンt」と板書しながら /æ/ 音の発音を聞かせると、児童はかなり近い音を発音できるようになると実感しました。

また「キャント」の「ト」が聞こえにくいのは、次の子音や母音と連結するため、聞こえにくいのではなく、そもそも /t/ の音がないことも分かります。つまり、 “can” “can’t” の弁別は語尾の /t/ ではなく、母音の音質と母音長で行われていることになります。

Longmanに明記されているように “can” の弱形が「ケン」なので、 “Yes, I can.” のcanは「ケン」ではなく /kæn/ になります。ですので、”can” は強形、弱形、どちらも練習する必要があります。
「”Yes, I can.” の”can” が聞こえたら『できる』の意味だ」と考えていると、確かに “I can…” “I can’t…” が混在している文で児童は混乱してしまいますね。

なお、Longmanによるとcan’t のイギリス発音は[kɑːnt]で、この音も動画の中に登場します。

Wells, J. C. (2008). Longman pronunciation dictionary (3rd ed). Pearson/Longman.

ELANで動画に注釈を付ける例

ELANは動画や音声に注釈を付けることができるフリーソフトです。
複数の動画や音声を同期させ、分析を行うことができます。
ELANの操作については、「ELAN入門」(細馬・菊地, 2019) がとても分かりやすいです。

ELANで動画に注釈を付ける例を紹介します。
まず、ELANに動画ファイルを読み込ませましょう。

もし、動画ファイルの音声書き起こしがあれば、ELANに読み込ませておくことで作業しやすくなります。音声を書き起こしたファイル(csv等)をエクセルで開き、「開始」「終了」時間を設定し、ざっくり時間を入力しましょう。時間の単位は「ミリ秒」です。

これを改めて「csv」ファイルとして保存します。

ELANに、先ほどのcsvファイルを読み込みます。
データのタイプを選択します。
1行目が見出しなら、「1行目のデータ」を2に設定します。
すると、アノテーションが読み込まれます。
注釈を調節するときは、「opt」を押しながらマウスで端を動かします。

選択範囲を再生させる際、「Shift スペース」が便利です。「Shift Ctrl スペース」で、前後1秒も合わせて再生させることができます。
「縦ズーム」の比率を大きくすることで、波形が見やすくなります。波形を確認しながら注釈をつけることが、スムーズにアノテートするコツです。
「自動バックアップ」を入れておくと、いざという時安心です。
「格子」を表示させると、注釈を一覧表示させることができます。

注釈を付け終えたら、書き出しましょう。「タブ区切り文書ファイル形式」で出力します。
書き出したい注釈層を選択します。
書き出されたファイルを確認します。
エクセルで読み込むと、一部文字化けしています。「UTF-8」で出力しましたが、エクセルは「Shift JIS」で読み込もうとするためです。
テキストエディタで文字コードを変更してもいいのですが、エクセルからUTF-8を読み込むことができます。
エクセルの、「データ」→「テキストファイル」を選択します。

「Unicode(UTF-8)」を選択しましょう。
発話者の順に並んでいますので、列C(開始時間)を基準にして、データを並べ替えましょう。
セルの表示形式を「ユーザー定義」、種類を「ss.0」にすると、「3.8(秒)」の様に表示させることができます。

会話分析でほしいデータは、発話間の間隔です。そこで、列BにDurationを表示させます。セルB2に、以下の書式を入力しましょう。

=TEXT(ABS(C2-D1),IF(C2<D1,”-ss.0″,”ss.0″))

※TEXT: 数字を文字列に変換します。オーバーラップした発話には「-(マイナス)」をつけるためです。
ABS: 数字の絶対値をとります。
IF: 真偽判断。オーバーラップしていたら「-(マイナス)」をつけます。”ss.0″は、「3.8」(秒)の様に表示させるセルの表示形式です。

最後の行まで、数式をコピーさせましょう。
1行目に列の名前を付け、エクセル形式で保存したら完成です。

細馬宏通・菊地浩平 (2019). ELAN入門 : 言語学・行動学からメディア研究まで. ひつじ書房.

MacのELANデータをWindowsでうまく再生できない問題について

アノテーションソフトELANは、会話分析に欠かせないアプリです。
私は主にMacで使っていますが、研修講師や発表をする際はレッツノートにデータを移します。ところがレッツノートに移した途端、うまく再生できなくなってしまうことが多々ありました。
理由を一つずつ調べたところ、Macで編集したmp3ファイルを、Windowsがうまく処理できないことが原因のようでした。
私は複数の映像データと音声データをPluralEyesで同期し、Final Cut Proでトリミングをして、その上でELANに読み込ませています。どうやらこの行程に原因があるようです。
そこで、mp3ファイルをwavファイルに変換してELANに読み込ませたところ、レッツノートでも同様に再生させることができました。
WavファイルだとELANで波形表示もされます。

追記:Final Cut Proから映像を書き出すと,mov形式になります
このままではWindows版のELANに読み込ませることができません。
mp4形式に変換させる必要がありますが,これはファインダー,もしくはエクスプローラーでファイル名を変換させるだけで可能です (mp4形式は,mov形式のサブセット)。

PraatでVOTを観察しよう

日本語の「ペン」と英語の “pen” は同じ音でしょうか、それとも違う音でしょうか。
発音記号で書くと、どちらも /pen/ です。撥音「ん」は子音のみの特殊モーラですので、語末が母音にならないため、日本語の「ペン」と英語の “pen” は同じ発音記号になります。
実は、日本語と英語は同じ音ではありません。無声閉鎖子音 /p/ の破裂の強さが違います。Praatで録音し、比較すると、違いが明らかになります(図1)。

(図1)

よく似ていますが、赤四角で囲った範囲の広さが異なります(図2)。

(図2)

英語の方が、/e/ の音が開始されるまでの時間が長いことが分かります。
波形(wave form)に表示されている青縦線をパルスといいますが、これは声帯振動を表しています。また、声帯振動が起きている証拠として、スペクトログラムの低い周波数帯にエネルギーが確認されます(川原, 2018)。この、口の閉じた状態を解放してから声帯振動が始まるまでの時間をVOT (Voice Onset Time) といいます(Lisker & Abramson, 1964)。/p/ は、無声閉鎖子音で、母音 /e/ が開始されるまでの時間が、英語の方が長いことが分かります。
/p/ の開始地点のスペクトログラムを観察すると、日本語より英語の方が幅広い周波数に渡って強く出現しているので、定規で引いたようにまっすぐな線で始まっていますね。じっくり観察すると、英語の方が母音 /e/ の持続時間が長いことも分かります。
語頭の破裂音でVOTが観察されます。有声閉鎖子音の方がVOTが短く、無声閉鎖子音の方が長くなります。
破裂音のVOTは、様々な単語で観察されます。

図3は、「タイム」と “time” です。やはり、赤線で囲ったVOTの長さが異なります。
日本語は /a/ と /i/ の2つの母音ですが、英語は /aɪ/ の二重母音になっているため、スペクトログラムに母音の特徴が現れています。

(図3)

図4は、「ポスト」と “post” です。VOT が異なるほか、日本語は一文字ずつに母音が挿入されいることがスペクトログラムから読み取れます。また「ポスト」は語末の母音 /o/ が現れていますが、英語には語末母音がないこともスペクトログラムから読み取れます。

(図4)

図5は、「ブック」と “book” です。日本語と英語では VOT が異なります。また、「ブック」には促音「っ」が入っており、「ク」の前に空白が観察されます。日本語の促音は、直後の子音前に発音を止めることであることがよく分かります。

(図5)

このように、Praatを用いると日本語と英語の破裂音の違いが観察できます。
英語の語頭閉鎖音を練習するには、ティッシュの端をつまみ、口の前に持ってくることで破裂の強さを体感する方法があります。日本語で「ペン」と言っても、ティッシュペーパーはあまり揺れません。しかし、英語は破裂が強いので、ティッシュペーパーが勢いよく動きます。あまりティッシュペーパーが揺れなかった方は、揺れるように意識すると、強く破裂できるようになります。

川原繁人(2018). 『ビジュアル音声学』三省堂.
Lisker, L., & Abramson, A. S. (1964). A Cross-Language Study of Voicing in Initial Stops: Acoustical Measurements. WORD, 20(3), 384–422.

Praatでピッチ曲線を見てみよう

Praatでピッチ曲線を見てみましょう。
“How are you?” を録音してみましょう。
録音の操作は、Praatで逆再生をしてみようの、「1. Sound untitled」が表示されるところまで同じです。

ピッチ曲線を表示し、音の高さを見てみます。
以下の項目のチェックを入れます。
「Pitch」→「Show pitch」
以下の項目のチェックを外します。
「Spectrum」→「Show spectrum」
「Intensity」→「Show intensity」
「Formant」→「Show formant」
「Pulses」→「Show pulses」

上の画面は波形 (waveform) を表しています。
下の画面に表示されている青い線がピッチ曲線です。
ピッチ曲線は音の高さを表します。横軸が時間、縦軸が周波数です。

“How are you?” は、真ん中がbe動詞の3語文です。内容語は “how,” 機能語は “are” と “you” ですので、理屈からすると “how” のピッチが最も高くなりそうですが、Wells (2006) によると、真ん中がbe動詞の3語文はなぜかbe動詞に焦点が当たり、最もピッチが高くなります。
このパターンは、”Who is she?” “What is it?” 等、小学校外国語活動で頻出します。
いかがでしょうか? “are” のピッチが最も高くなっているでしょうか?

次に、「Spectrum」→「Show spectrum」のチェックを入れましょう。
すると、スペクトログラムが表示されます。スペクトログラムは、横軸に時間、縦軸に周波数が表示され、色の濃淡が強さを表しています。

“How are you?” の母音 /au/ /ɚ/ /u/ や、聞こえ度 (sonority) の高い流音 /j/ は濃度の濃い部分があり、線のように見えますね。ここからフォルマントを算出すると、調音点の位置を推察することもできます。

次に、問い返す言い方の “How are you?” を録音しましょう。相手から尋ねられて “I’m fine.” と答えた後、「あなたはいかがですか?」と問い返す際、 “you” に対比的焦点があたり、ピッチが高くなります。

いかがでしょうか? “you” のピッチが最も高くなっているでしょうか?
この状態でスペクトログラムを表示すると、音の高さは先ほどと異なりますが、模様はほとんど同じであることが分かります。

ところで、 “you” の先に不自然な線があることに気づきましたでしょうか。

ピッチとは声帯の振動数(F0)ですが、音には倍音があるので、正確に算出するのは難しいようです。ProsogramというPraat scriptを用いると、人間の聴覚に近いピッチ曲線を算出することができます。こちらの記事のピッチ曲線は、Programで作成しています。

Wells, J. C. (2006). English intonation : an introduction. Cambridge: Cambridge University Press.