1.はじめに
Dataikuの拡張機能であるプラグインには様々な機能を備えたものが多数あります。
以前、弊社のブログでは自然言語処理で使えそうな代表的なプラグインをご紹介しました。
Dataikuの使えるプラグイン5選
https://www.keywalker.co.jp/blog/dataiku-plugins1.html
今回は機械学習で利用できそうなプラグインを簡単にご紹介します。
2.Holidays
今回ご紹介するプラグインはHolidaysというプラグインです。
Holidays
https://www.dataiku.com/product/plugins/holidays/
このプラグインでは50か国以上の祝日をデータセットにフラグ付けすることができます。
またその祝日の名前をフラグ付けすることもできます。
プラグインを使用する際に、対象となるカラムは日付型である必要があります
Holidaysはプラグインをインストールするだけでprepareレシピ内のプロセッサーに自動的に追加されます。
Holidays processoerにフラグ付けしたいカラムを入力し、対象となる祝日のある国をCountry で選択します。
選択した国における祝日がこれによりフラグづけされます
例えば日本の場合は
正月と成人の日がフラグづけされます
中国の場合では
旧正月と春節をフラグつけしてくれます
このような形で各国の祝日をフラグ付けしてくれます。
回帰問題などで数値予測を行う場合、イベントがあったかどうかというのが重要な特徴量となる可能性もあります。
Holidaysを使えば、イベントも反映した予測ができるのではないでしょうか?
売上データなど祝日が影響する場合、祝日も加味した特徴量を用いれば精度が上がる可能性もあります。