Guwaaago!

グワーゴ!岡山で働くIT系の人。このサイトにはWEB系の知識を記すこととす。

データマイニングにおけるデータの基本処理

データ分析の構造がわかりやすくまとまっていたのでメモ。

www.albert2005.co.jp

なるほど。「抽出」工程がクレンジングをベースにデータを選り分ける作業。並べ替えやグループ化を施したうえで、最終的にはデータとデータの関連性やデータの性質を見つける。

関係性を知る、の部分で社内の情報以外の情報や他部署の情報を組み入れることで新しい知見が得られやすい印象。

ただ他部署のデータはなかなか整理されていなかったり、提供にハードルが多かったりするので社内の地位固めなどがあらかじめ必要。やはりまずは実績作りから。