雑記 in hibernation

頭の整理と備忘録

ランダムフォレスト「マージン」の謎

僕が仕事でメインに扱っているのはSASだったりするのですが、SASは機械学習というよりは統計解析寄りのソフトです。そのため、分析屋もどきの身からすると、その出力もやや見慣れないものだったりします。 先日SASのプロシージャでランダムフォレストを弄っ…

Kerasで最短(?)LSTM実装

RNNのチュートリアルとして、LSTMによる時系列予測モデルをKerasにて実装しました。 多分これが必要最低限の実装だと思います。 備忘録として記録しておきます。 1. LSTMとは LSTMは再帰型ニューラルネットワークであるRNNのバリエーションの一つで、主に時…

SASが無料で使えるんですって (SAS OnDemand for Academics)

統計ソフトとしてSASを使う機会がしばしばあるのですが、なかなかとっつきづらさを感じています。その要因として、プログラミング言語としての仕様の独特さや、非公式の情報の少なさ(と言っても公式の情報は充実しているのですが)などと並んで、「そもそも…

ペペロンチーノ合成獣

COVID-19は世界中で猛威をふるい、世界経済は混沌へと向かっています。人々が不安に駆られる日々を過ごす中、こんな時だからこそ自分にも何かできることがあるのではないか。どうにか社会に貢献したい一心で思慮を巡らせた結果、ペペロンチーノを作る時のコ…

正則化をなるべく丁寧に理解する - 実践編 -

機械学習における正則化の原理と挙動を理解するため、手法の概要をまとめると共に、正則化を用いた最適化をシミュレートして挙動を確認します。 この記事では -実践編- と題して、簡単な損失関数を例に正則化を実装し、効果をシミュレートしてみます。具体的…

正則化をなるべく丁寧に理解する - 理屈編 -

機械学習における正則化の原理と挙動を理解するため、手法の概要をまとめると共に、実際に正則化を用いた最適化をシミュレートして挙動を確認します。 今回の記事では -理屈編- と題して、正則化の着想から具体的な手法(L1,L2正規化)の解説までをまとめます…

統計学と人類皆平等

某有名人の某感染症への感染が発覚して話題になりましたが、twitterでざっくり以下のような言説を見かけました。 あの超有名人でさえ感染している状況を鑑みれば、東京都の感染率は公表されているよりも高いのではないか(意訳) 直感的に「その理屈は正しく…

2値分類モデルの評価指標を一覧にまとめる

この記事では2値分類問題における評価指標を列挙し、一覧表にまとめます。また、適切な評価指標を用いることの必要性をケーススタディで確認します。なお本記事は個人的な備忘録として作成しています。 1. はじめに 1.1. 正答率だけでは不十分な2値分類モデ…