ELANは動画や音声に注釈を付けることができるフリーソフトです。
複数の動画や音声を同期させ、分析を行うことができます。
ELANの操作については、「ELAN入門」(細馬・菊地, 2019) がとても分かりやすいです。
ELANで動画に注釈を付ける例を紹介します。
まず、ELANに動画ファイルを読み込ませましょう。
もし、動画ファイルの音声書き起こしがあれば、ELANに読み込ませておくことで作業しやすくなります。音声を書き起こしたファイル(csv等)をエクセルで開き、「開始」「終了」時間を設定し、ざっくり時間を入力しましょう。時間の単位は「ミリ秒」です。
これを改めて「csv」ファイルとして保存します。
ELANに、先ほどのcsvファイルを読み込みます。
データのタイプを選択します。
1行目が見出しなら、「1行目のデータ」を2に設定します。
すると、アノテーションが読み込まれます。
注釈を調節するときは、「opt」を押しながらマウスで端を動かします。
選択範囲を再生させる際、「Shift スペース」が便利です。「Shift Ctrl スペース」で、前後1秒も合わせて再生させることができます。
「縦ズーム」の比率を大きくすることで、波形が見やすくなります。波形を確認しながら注釈をつけることが、スムーズにアノテートするコツです。
「自動バックアップ」を入れておくと、いざという時安心です。
「格子」を表示させると、注釈を一覧表示させることができます。
注釈を付け終えたら、書き出しましょう。「タブ区切り文書ファイル形式」で出力します。
書き出したい注釈層を選択します。
書き出されたファイルを確認します。
エクセルで読み込むと、一部文字化けしています。「UTF-8」で出力しましたが、エクセルは「Shift JIS」で読み込もうとするためです。
テキストエディタで文字コードを変更してもいいのですが、エクセルからUTF-8を読み込むことができます。
エクセルの、「データ」→「テキストファイル」を選択します。
「Unicode(UTF-8)」を選択しましょう。
発話者の順に並んでいますので、列C(開始時間)を基準にして、データを並べ替えましょう。
セルの表示形式を「ユーザー定義」、種類を「ss.0」にすると、「3.8(秒)」の様に表示させることができます。
会話分析でほしいデータは、発話間の間隔です。そこで、列BにDurationを表示させます。セルB2に、以下の書式を入力しましょう。
=TEXT(ABS(C2-D1),IF(C2<D1,”-ss.0″,”ss.0″))
※TEXT: 数字を文字列に変換します。オーバーラップした発話には「-(マイナス)」をつけるためです。
ABS: 数字の絶対値をとります。
IF: 真偽判断。オーバーラップしていたら「-(マイナス)」をつけます。”ss.0″は、「3.8」(秒)の様に表示させるセルの表示形式です。
最後の行まで、数式をコピーさせましょう。
1行目に列の名前を付け、エクセル形式で保存したら完成です。
細馬宏通・菊地浩平 (2019). ELAN入門 : 言語学・行動学からメディア研究まで. ひつじ書房.