読み込むデータとデータ定義が違う場合(表組み項目やMA項目が分解されたデータを読み込む場合)


Repoのデータは、表組み項目は1項目として扱われていますし、複数回答(MA)項目も1項目として扱われています。
厳密に言えば、複数回答(MA)データは、Repo内部では、半角&記号で連結された状態となっています。
(選択肢の1,4,7を選択した複数回答の場合は、「1&4&7」という値として保存されている)
このため、一般的なCSVテキスト形式のデータファイルをそのまま読み込んでも、項目ズレが起きるなどして、分析できません。
このような場合、対応策として、3つの方法があります。

  1. データ定義を作成して、一気に変換読み込みを行う
  2. とりあえず、データをそのまま読み込んだ上で、MA変換機能で変換する
  3. その他の方法で変換する
ここでは、様々なデータ形態に応じて、どの方法で読み込めばよいかを説明します。
Repoで簡単または比較的簡単に対応できるデータ形式は、次のケースです。
複数の方法がありますが、ここでも最も簡単な方法を説明します。

例として、次のデータの場合で説明します。例では全て、表組み項目は分解された状態とします。
「Q1はSA型で回答値は2、Q2はMA表型でサブ項目3、選択肢5で、それぞれの回答値が、(2,4)、(1,4)、(3,5)」
尚、ここでは便宜上、タブ記号はtと、半角空白文字や_等の他の記号はxと表記して説明します。
MAデータの形式 項目間の
区切り
データ形態例 方法
A B C
MAは1項目 11
1項目内で該当選択肢Noがカンマ区切りで区切られている場合 タブ 3t2,4t1,4t3,5 A - -
12
1項目内で該当選択肢Noが特定の記号や空白文字で区切られている場合(右例では空白区切り) カンマ 3,2x4,1x4,3x5 A - -
タブ 3t2x4t1x4t3x5 A - -
13
1項目内で各選択肢がすべて0または1で列記されている場合 カンマ 3,01010,10010,00101 - B -
タブ 3t01010t10010t00101 - B -
14
1項目内で固定バイト数ごとに格納されている場合(例、2バイトごと) カンマ 3,0204,0104,0305 - B -
タブ 3t0204t0104t0305 - B -
15 各選択肢がすべて0または1の項目に任意の記号で分解されている場合 カンマ 3,0x1x0x1x0,1x0x0x1x0,0x0x1x0x1 - - C1
タブ 3t0x1x0x1x0t1x0x0x1x0t0x0x1x0x1 - - C1
MAは分解 21
各選択肢がすべて0または1の項目に分解されている場合 カンマ 3,0,1,0,1,0,1,0,0,1,0,0,0,1,0,1 A - -
タブ 3t0t1t0t1t0t1t0t0t1t0t0t0t1t0t1 A -
22
各選択肢が選択肢Noで分割格納されている場合(非該当時はゼロまたは空白) カンマ 3,,2,,4,,1,,,4,,,,3,,5
または
3,0,2,0,4,0,1,0,0,4,0,0,0,3,0,5
A - C2
タブ 3tt2tt4tt1ttt4tttt3tt5
または
3t0t2t0t4t0t1t0t0t4t0t0t0t3t0t5
A - C2

Aの方法

  1. まず、データ定義を完成させて下さい。(Excel質問設計書などから取り込み、MA項目は1項目化、表組み項目もできるだけ1項目化して下さい。)
  2. 下記方法で指定して、読み込んで下さい。
データタイプ 項目間の区切り 読み込みデータの状態
11 タブ 表組み項目は分解状態にチェック
MA項目はカンマ区切りにチェック
12 カンマ 表組み項目は分解状態にチェック
MA項目は記号区切りにチェックし記号入力
タブ 表組み項目は分解状態にチェック
MA項目は記号区切りにチェックし記号入力
21 カンマ 表組み項目は分解状態にチェック
MA項目は分解状態(0/1SA群)にチェック
タブ 表組み項目は分解状態にチェック
MA項目は分解状態(0/1SA群)にチェック
22 カンマ 表組み項目は分解状態にチェック
MA項目は分解状態(選択肢No値)にチェック
タブ 表組み項目は分解状態にチェック
MA項目は分解状態(選択肢No値)にチェック


Bの方法

  1. データ定義を作る前に、データをCSVテキストファイルから読み込んで下さい。
    データ定義を作成する場合は、表組み項目は「項分解」、MA項目は必要に応じて分解しておいて下さい。
  2. 下記の方法で「MA変換」−「MA形式変換」をして下さい。
  3. データ定義を仕上げて下さい。(選択肢の設定や、「項統合」による表組み項目化をする)
データタイプ データ例 読み込みデータの状態
13(カンマ区切り) 3,01010,10010,00101 0/1形式を指定
13(タブ区切り) 3t01010t10010t00101
14(カンマ区切り) 3,0204,0104,0305 固定長入力(バイト長を指定)
14(タブ区切り) 3t0204t0104t0305
尚、カンマ区切りはA1、記号区切りはA2、A3と同様です。

C1の方法

  1. MA区切り記号をすべて削除すると、上記のタイプ13のデータ形態になります。
    MA区切り記号の削除方法には2つの方法があります。
    1. テキストエディタ等であらかじめすべて消去してからRepoにテキストファイル読み込み(簡単ですが、FA内なども同時に消去されます)
    2. Repoに読み込み、データ編集の「列編集」-「値置換」で「特定文字列のみ消去」を選択、削除する文字列を指定して実行する方法。(次図参照)
  2. このデータをRepoのMA項目を上記のB1またはB2の方法でMA形式変換を行います。(上記B参照)
  3. データ定義を設定して下さい。


C2の方法

  1. データ定義を作成する前に、Repoにデキストファイル読み込みを行います。
  2. データ定義を設定します。このとき、MAとなる項目はSA型にし、選択肢をそれぞれひとつ設定して下さい。
    (MAの一つ目の選択肢該当値=1、二つ目は=2と設定しておいて下さい。例の場合)
  3. データ加工の「項目連結」をクリックして、MA項目として集約する項目を指定して変換した新項目を作成します。
    一度に連結できる項目数は5項目までのため、それより多い場合は、複数回行って下さい。
    (「選択肢の並列連結」を指定して下さい。但し、例の場合は「データ一体化」でも同様の結果となります)
  4. データ定義も自動変換されますが、念のため確認し、必要な仕上げを行って下さい。