お題
特徴量エンジニアリングの書籍がでるっぽい
Pythonパッケージ作成中
- とりあえず公開できた
- regonn/polar_bear
- Kaggleとかで、csvから読み取ったpandasのデータをそのまま渡すだけで、ワンホットとかnan値をいい感じで処理してくれるライブラリが欲しかった
- 使用感 polar_bear.ipynb
- とりあえずタイタニックで、そのまま csv_read した dataframe を渡せば、light_gbm とかで処理できる形にできる
- 現状タイタニックで正答率6割ぐらいで低めだけど敷居は下がった感じ
- 他のテーブルデータのコンテストでも試してみたい
- 名前はpandasをクレンジングしてくれるので白熊(polar_bear)と名付けた
- テストとかあんまりなくて、コードも汚いので特徴量エンジニアリング勉強しながらメンテしていきたい
- Googleポッドキャストは3倍速で聴ける
- iphoneのポッドキャストは最大2倍速なので、より早く聴けると思った
- 自分もGoogleポッドキャスト使ってる。
- そのまま記事部分も表示してくれるのでリンクも飛びやすい
- “Trim silence” を使うと無音を飛ばしてくれるからより早く聞けるけど、小さい”っ”とかも無音とみなされるので、ツイッターがツイターって聞こえてしまう。
今週のkaggle
- 新コンペ
- カレー
- れごん
- Kaggle の勉強会開催とライブラリ作って終わってた。