アソシエーション分析とは?
アソシエーション分析とは、大量のデータの中から「〜の場合に〜になります」という一連のルールを見つけ出す分析です。 例えば「シャンパンとグラスを買った人は氷も買う」というようなルールを探しだして、シャンパンとグラスを陳列している場所のすぐ横に 氷も陳列して売上げアップをはかるといった有効な活用が可能です。
上記のアソシエーションルールは例えば以下のように表されます。
{シャンパン,グラス} → 氷
更にこのルールに関する指標として支持度(support)と確信度(confidence)が与えられます。
例えば
{シャンパン,グラス} → 氷 (支持度=0.05 確信度=0.4)
と表現します。支持度はどのくらい頻繁にシャンパンとグラスを購入した人がいたかを表しています。
例えば10000人のうちその5%の500人がシャンパンとグラスを購入したことを表します。
更に確信度とはその500人のうちの4割=200人が氷もあわせて買ったことを表します。
NAGが提供するアソシエーション分析の機能
NAG データマイニング コンポーネントでは アソシエーション分析を行う関数(サブルーチン)が提供されています。 テキストファイルからトランザクションデータを読み込む関数、分析を行う関数、そして結果を出力する関数が提供されます。
NAG データマイニング コンポーネントはこの他にも様々なデータマイニング機能を提供するライブラリ製品です。 C言語, C++, Java, VB, VBA(Excel)など様々な環境からご利用いただけます。またWindows, Linux, Solaris など様々なOSをサポートしています。
【NAGのデータマイニングコンポーネントのドキュメント】
イントロダクションガイド
ユーザーガイド
リファレンス
Agrawal R, Imielienski T and Swami A (1993) Mining association rules between sets of items in large databases Proc. Conf. on Management of Data 207-216 New York: ACM Press.
Borgelt C and Kruse R (2001) Induction of association rules: a priori implementation Technical Report School of Computer Science, University of Madgeburg, Germany.
提供されているロジスティック回帰分析関数(サブルーチン)
nagdmc_assoc_data - アソシエーションの対象となるデータを読み込む
nagdmc_assoc - アソシエーションの計算を行う
nagdmc_assoc_print - アソシエーションの結果を出力する
その他データマイニング機能一覧
