こんにちはHitouchです。
@hitouch_life
統計解析で相手にするのは「データ」です。
患者を相手にしているメディカルスタッフの中には、「データ」にアレルギーを示す人もいるでしょう。
しかし、思い出してください。
メディカルスタッフも普段からデータを取り扱っているはずです。
- 性別
- 年齢
- 身長
- 体重
- 血圧
- 尿蛋白
- 腫瘍マーカー
- ・・・
日常的に扱っているデータは多岐に渡ります。
そんなに毛嫌いしなくても、データは身近にあるのです。
身近にあるデータを、分かりやすくグループ分けしてみませんか?
上手くグループ分けすることができれば、取り扱うデータがもう少し分かりやすくなるはずです。
データの種類ってどれだけあるの?
- 男性?女性?
- 24歳?60歳?
- ステージⅡ?ステージⅣ?
- 生存期間10ヶ月?12ヶ月?
一括りにデータといえども、その種類は多様です。
統計解析を学ぶためには、ある程度グループ分けして整理する必要があります。
連続変数
あらゆる値をとり得る、データに「切れ目」がない数の集団を、連続変数といいます。
体重・身長・血圧・血糖値等は全て連続変数です。
順序変数
データに「切れ目」があり、更に順序がある場合を順序変数といいます。
例えば、がんの進行ステージは「Ⅰ」「Ⅱ」「Ⅲ」「Ⅳ」とデータに切れ目があります。
ステージⅠとスタージⅡの間にはなにもありません。
しかし、スタージⅠからステージⅣにかけて腫瘍が進行していくというデータの「順序」は存在します。
このような場合が順序変数です。
検査で用いられる「+」「2+」「3+」等のデータも順序変数です。
名義変数
男性・女性
効果が「ある」・「ない」
血液型が「A型」・「B型」・「O型」・「AB型」
データに繋がりがなく、順序もない場合を名義変数といいます。
イベント発生までの期間
がん治療を行うのであれば必ず知っていなければいけない言葉がOS(Overall Survival)です。
OSは全生存期間を表現しています。
OSを比較するためには、「死亡までの期間」というデータが必要です。
あるイベントが発生するまでの期間を扱う際には「期間」という概念を持つデータが必要です。
実際にデータを分類してみよう!
ある果樹園には、「りんご」と「みかん」の木が沢山植えられています。
さて、この果樹園にはどんなデータが実っているでしょう?
果物という集団の中には、「りんご」と「みかん」という2つの名義変数が存在します。
りんごの木には、50gから100gの様々なサイズのりんごが実っています。
これは50g~100gという切れ目のないデータです。
つまり連続変数です。
実ったみかんを出荷したところ、「イマイチ」「普通」「良品」「最良品」と4第階に分けられて値段がつきました。
「イマイチ」「普通」「良品」「最良品」は切れ目があって順序がある、順序変数です。
りんごは、実ってから美味しく食べられるようになるまで、5週間かかるのに対して、みかんは3週間で食べごろをむかえます。*)数字は適当です
このデータには「期間」の概念が存在しています。
このように、ありとあらゆるデータは、グループ分けして整理することができます。
グループ分けすることで、統計解析のイメージがしやすくなりますので、この考え方を覚えておくことは大切です。
患者さんの性別は?
患者さんの年齢は?
薬の用量は?
尿検査の値は?
身の回りに様々なデータがあるはずです。
自分で分類してみて下さい。
この記事を読んだあなたはもう・・・
簡単にデータを分類できるはずです。
Sincerely,
Hitouch
統計学のおすすめ書籍
学会発表に悩んでませんか?
薬剤師さん!その給料で本当に満足ですか?
全国の給料水準や薬剤師求人見通しなど貴重な情報が手に入ります。
情報量がものすごい!こちらも必ず登録すべきです。
薬剤師の需要と供給のバランスを把握しましょう。
薬剤師さんに人気の記事
【この記事の編集者】
Hitouch「T」
HitouchLIFEという雑記ブログの管理人
医療・投資・自己啓発系のライティングを得意とする医療ライター
オススメ HitouchLIFE