podcast
details
.com
Share
regonn&curry.fm - 最新の生成AI動向を週刊でお届け -
3. Twitterの質問に答えていきます
Listen
Description
質問
ポッドキャスト聞いてから Signate の存在を知りました。Kaggle 関連の話が面白かったのでもっと聞きたいです。例えば、最近コンピティションで話題の技術や、自分が参加したコンピティションではどういうことを考えてモデル作成の戦略を立てているか、などなど @ハシビロコウさんより
最近話題の技術(どちらも最新ではないが、必須?)
LightGBM
マイクロソフト作成
早い!!精度が高い、大量の特徴量も入れられる、
kaggle-ja で共有されていた xgboost LightGBM CatBoost の比較記事
CatBoost vs. Light GBM vs. XGBoost
アンサンブル
相関が低い予想をアンサンブルし、スコアを上げる
Santander コンペで金メダルをとった戦略
失点を減らす
フォーラムをつねにチェック
リークを見つける
加点を狙う
他の人が見つけていないことをみつける
ポイントを絞る
時間は有限なので、キーとなりそうなところに集中
画像のコンペは好きじゃない、と思われるのはなぜですか?優秀なモデルを持ってきて力技勝負になっちゃうとかでしょうか(マシュマロ)
画像のコンペを真剣にやろうとすると、GPU が必須になる
GPU が必要なためか参加人数は増えない傾向にある
個人的には画像のコンペは楽しい
技術の進歩すごいって感じられる
人間の認識能力もすごいと感じる
前処理とかも難しいブログ記事なども少ない
少ないという意味は、殆どがサンプルコードを動かして Mnist 解析するだけみたいな気もしてる
論文を読んでいく必要がある
jupyter の tips
Jupyter Tips 募集中への回答です。PyCharm + Jupyter NoteBook を使うことによって PyCharm の強力なコードの自動補完が利用出来て便利です。
jupyter notebook と PyCharm
Jetbrains 系は Professional 版(お値段高め)と Community 版(無料)がある
違いは web 開発機能とかなので機械学習で利用するのであればいけそう
気になるニュース
AI/機械学習の利用がストレージ支出に大きな影響を与えると 70%の企業が判断、IDC Japan 調査 - クラウド Watch
機械学習のストレージ問題
なんか対処してる?
Box Japan
BigQuery - アナリティクス データ ウェアハウス | BigQuery | Google Cloud
田中 TOM
自然言語処理を学ぼう #5 doc2vec 理論編 - 田中 TOM と愉快な仲間たち
量子コンピュータ関連
メルカリのインターンシップに出ている学生達のブログ記事が出ている
D-wave を触っている
現状の量子コンピューターでの限界(妥協点)や問題がなんとなくわかる
メルカリがこういう分野にもすでにお金を出している
D-Wave マシンで Graph Golf に挑戦した話 - Mercari Engineering Blog
D-wave マシンで最大カット問題を解く - Mercari Engineering Blog
オレオレ機械学習ライブラリ構想(機械学習名古屋第1 7 回勉強会)
機械学習のアルゴリズムに関係ない部分多すぎ問題
試したものがちゃんと記録される・再現できる
煩わしいデータ管理をどうにかしたい
モデル管理をちゃんとしたい
オレオレライブラリって結構大事でみんな Kaggle に夢中すぎてやってない分野も多い気がする
自分も Julia から
Neural Network Console
フォーマット向けのオレオレライブラリとか書いてる
今日の一句
抜け道を先ゆく風や彼岸花 恋言
podcast
details
Print
Share
Want to check another podcast?
Enter the RSS feed of a podcast, and see all of their public statistics.
Check it
Made by
Alex Barredo
. Send your feedback to
alex@barredo.es
.