Repoのデータは、表組み項目は1項目として扱われていますし、複数回答(MA)項目も1項目として扱われています。
厳密に言えば、複数回答(MA)データは、Repo内部では、半角&記号で連結された状態となっています。
(選択肢の1,4,7を選択した複数回答の場合は、「1&4&7」という値として保存されている)
このため、一般的なCSVテキスト形式のデータファイルをそのまま読み込んでも、項目ズレが起きるなどして、分析できません。
このような場合、対応策として、3つの方法があります。
- データ定義を作成して、一気に変換読み込みを行う
- とりあえず、データをそのまま読み込んだ上で、MA変換機能で変換する
- その他の方法で変換する
ここでは、様々なデータ形態に応じて、どの方法で読み込めばよいかを説明します。
Repoで簡単または比較的簡単に対応できるデータ形式は、次のケースです。
複数の方法がありますが、ここでも最も簡単な方法を説明します。
例として、次のデータの場合で説明します。例では全て、表組み項目は分解された状態とします。
「Q1はSA型で回答値は2、Q2はMA表型でサブ項目3、選択肢5で、それぞれの回答値が、(2,4)、(1,4)、(3,5)」
尚、ここでは便宜上、タブ記号はtと、半角空白文字や_等の他の記号はxと表記して説明します。
MAデータの形式 |
項目間の
区切り |
データ形態例 |
方法 |
A |
B |
C |
MAは1項目 |
11
|
1項目内で該当選択肢Noがカンマ区切りで区切られている場合 |
タブ |
3t2,4t1,4t3,5 |
A |
- |
- |
12
|
1項目内で該当選択肢Noが特定の記号や空白文字で区切られている場合(右例では空白区切り) |
カンマ |
3,2x4,1x4,3x5 |
A |
- |
- |
タブ |
3t2x4t1x4t3x5 |
A |
- |
- |
13
|
1項目内で各選択肢がすべて0または1で列記されている場合 |
カンマ |
3,01010,10010,00101 |
- |
B |
- |
タブ |
3t01010t10010t00101 |
- |
B |
- |
14
|
1項目内で固定バイト数ごとに格納されている場合(例、2バイトごと) |
カンマ |
3,0204,0104,0305 |
- |
B |
- |
タブ |
3t0204t0104t0305 |
- |
B |
- |
15 |
各選択肢がすべて0または1の項目に任意の記号で分解されている場合 |
カンマ |
3,0x1x0x1x0,1x0x0x1x0,0x0x1x0x1 |
- |
- |
C1 |
タブ |
3t0x1x0x1x0t1x0x0x1x0t0x0x1x0x1 |
- |
- |
C1 |
MAは分解 |
21
|
各選択肢がすべて0または1の項目に分解されている場合 |
カンマ |
3,0,1,0,1,0,1,0,0,1,0,0,0,1,0,1 |
A |
- |
- |
タブ |
3t0t1t0t1t0t1t0t0t1t0t0t0t1t0t1 |
A |
- |
|
22
|
各選択肢が選択肢Noで分割格納されている場合(非該当時はゼロまたは空白) |
カンマ |
3,,2,,4,,1,,,4,,,,3,,5
または
3,0,2,0,4,0,1,0,0,4,0,0,0,3,0,5 |
A |
- |
C2 |
タブ |
3tt2tt4tt1ttt4tttt3tt5
または 3t0t2t0t4t0t1t0t0t4t0t0t0t3t0t5 |
A |
- |
C2 |
Aの方法
- まず、データ定義を完成させて下さい。(Excel質問設計書などから取り込み、MA項目は1項目化、表組み項目もできるだけ1項目化して下さい。)
- 下記方法で指定して、読み込んで下さい。
データタイプ |
項目間の区切り |
読み込みデータの状態 |
11 |
タブ |
表組み項目は分解状態にチェック
MA項目はカンマ区切りにチェック |
12 |
カンマ |
表組み項目は分解状態にチェック
MA項目は記号区切りにチェックし記号入力 |
タブ |
表組み項目は分解状態にチェック
MA項目は記号区切りにチェックし記号入力 |
21 |
カンマ |
表組み項目は分解状態にチェック
MA項目は分解状態(0/1SA群)にチェック |
タブ |
表組み項目は分解状態にチェック
MA項目は分解状態(0/1SA群)にチェック |
22 |
カンマ |
表組み項目は分解状態にチェック
MA項目は分解状態(選択肢No値)にチェック |
タブ |
表組み項目は分解状態にチェック
MA項目は分解状態(選択肢No値)にチェック |
Bの方法
- データ定義を作る前に、データをCSVテキストファイルから読み込んで下さい。
- データ定義を作成する場合は、表組み項目は「項分解」、MA項目は必要に応じて分解しておいて下さい。
- 下記の方法で「MA変換」−「MA形式変換」をして下さい。
- データ定義を仕上げて下さい。(選択肢の設定や、「項統合」による表組み項目化をする)
データタイプ |
データ例 |
読み込みデータの状態 |
13(カンマ区切り) |
3,01010,10010,00101 |
0/1形式を指定 |
13(タブ区切り) |
3t01010t10010t00101 |
14(カンマ区切り) |
3,0204,0104,0305 |
固定長入力(バイト長を指定) |
14(タブ区切り) |
3t0204t0104t0305 |
尚、カンマ区切りはA1、記号区切りはA2、A3と同様です。
C1の方法
- MA区切り記号をすべて削除すると、上記のタイプ13のデータ形態になります。
MA区切り記号の削除方法には2つの方法があります。
- テキストエディタ等であらかじめすべて消去してからRepoにテキストファイル読み込み(簡単ですが、FA内なども同時に消去されます)
- Repoに読み込み、データ編集の「列編集」-「値置換」で「特定文字列のみ消去」を選択、削除する文字列を指定して実行する方法。(次図参照)
- このデータをRepoのMA項目を上記のB1またはB2の方法でMA形式変換を行います。(上記B参照)
- データ定義を設定して下さい。
C2の方法
- データ定義を作成する前に、Repoにデキストファイル読み込みを行います。
- データ定義を設定します。このとき、MAとなる項目はSA型にし、選択肢をそれぞれひとつ設定して下さい。
(MAの一つ目の選択肢該当値=1、二つ目は=2と設定しておいて下さい。例の場合)
- データ加工の「項目連結」をクリックして、MA項目として集約する項目を指定して変換した新項目を作成します。
一度に連結できる項目数は5項目までのため、それより多い場合は、複数回行って下さい。
(「選択肢の並列連結」を指定して下さい。但し、例の場合は「データ一体化」でも同様の結果となります)
- データ定義も自動変換されますが、念のため確認し、必要な仕上げを行って下さい。
|