StatFlexの特徴 探索的データ解析

探索的データ解析  

title_tansaku.png

探索的データ解析ツールとしてのStatFlex

new.gifビジュアルクロス集計
エクセルのピボット機能を自動グラフに連動させました。行要因による分類(複数要因を指定可)、列要因による分類、頁要因による分類の指定により3次元のクロス集計図を作成できます。さらには、集計変数を指定すると、その変数の分布を分類毎にグラフ化して提示します。もちろん、通常のクロス集計表の作成や集計後の検定にも対応しています。数値型変数の場合も、仕切値の登録で簡単にクロス集計を行えます。

visualcross1.jpg行分類として4分割した年齢を、列分類に喫煙度を指定すると2次元クロス集計図で表示されます。この例では、対応するクロス集計表を表示し、直接検定処理を行っています。



visualcross2.jpg行分類には性別を、列分類には3分割指定したBMI(肥満度)を、そして集計変数に脂質(HDL-C)をとって得た2次元クロス集計図です。左下には対応するクロス集計表(平均値)が表示されています。



img_plot.png
特異点が一目でわかる番号プロット 






img_gunwake.jpg群分け機能
特定の変数に注目して、その値によってデータを分類する機能で、StatFlexではそれを群分けと呼んでいます。層別化やサブグループ化などと同じ意味です。値(カテゴリー値)による群分けと、仕切り値による群分けがあります。 前者は、性別などの2値変数で群分けする場合、後者は、変数が実数または整数の時に、仕切値(境界値)を指定して群分けします。たとえば、年齢で50歳未満とそれ以上に分ける場合、仕切値に50を登録して群分けします。

img_kotaiwake.jpg
個体分け機能
データベース型から同じ個体のデータを括りだし、それを個体別に頁方向に再配置する操作を個体分けと呼びます。データシート上にデータID(個体識別)列と、時間列(時系列情報、時間情報列)がある場合に実行できます。個体別に頁分けされたデータから、その時系列図を作成できます。逆に、個体分けされたデータをもとの1枚のデータシートに変換することを統合と呼びます。 

主要ソフトのデータをそのまま取り込み 
Excel, Accessのファイルの読み込み、直接貼り付けに対応。データ型や変数型は自動判断され、データにふさわしいグラフが表示されます。

img_tansaku.jpg分布の正規化を支援する、べき乗変換登録機能
変量別にべき乗値と変換原点を登録すれば、データシート上はもとの数値で表示しながら、グラフ表示と統計処理計算は全てべき乗変換に対応。もとの数値のイメージを失うことなく、分布を正規化したより妥当な分析が可能となります。

img_ransuu.jpg乱数振り分け打点機能
入力された数値の再下位の一つ下の桁に乱数で誤差を加え、点を振り分けます。例えば、有効桁が小数第1位として入力されたデータの場合、-0.05〜0.04の乱数を加えることで、データに偏りを与えることなく、数値を振り分けて打点できます。右の例では、格子点にデータが集中していますが、この機能を使えばデータ数をイメージできる形で散布図を表示できます。