雑記 in hibernation

頭の整理と備忘録

2022-01-01から1年間の記事一覧

生の煮こごり

3ヶ月ほど前のことです。お子が産まれました。第一子です。全てが順調とはいかなかったものの、結果を見れば母子共に健康ですから、万事こともなしといったところです。

本の話 - その3. 輪読会 in home編

こちらの続きです。最終章です。 toeming.hatenablog.com その晩の食卓にて。読書会自体はまぁ面白かったよ、といったことを妻にも話してみました。妻は僕に勝るとも劣らず読書が苦手な人間です。しかし、一方で本や本に満たされた空間自体は好きらしく、物…

本の話 - その2. 読書会にいこう編

こちらの続きです。 toeming.hatenablog.com 本を嫌い、ひょっとしたら本にも嫌われているかもしれない僕ですが、なんの因果か読書会に誘われてしまいました。 自宅の、僕がほぼ自室として使っている一室には、壁一面を埋める大きさの本棚があります。ちょう…

Google ColabでPyStanがインポートできなくなってた件

1. PyStanがインポートできない ちょうど今年の5月ごろ、こんな記事を書きました。 toeming.hatenablog.com 「何かと環境構築がダルいらしいPyStanだけど、Google Colaboratoryならわざわざinstallしなくてもpystanが使えちゃうよ」ってな記事だったのですが…

本の話 - その1. 読書が嫌い編

僕は読書が嫌いです。小説とかエッセイなんかは良いとしても、ビジネス書や技術書に対しては強い苦手意識があります。激しく頭を使うし、なけなしの集中力がすぐに底をつくからです。活字耐性は、子供の時分に読書に慣れ親しんだかどうかで決まる、と聞いた…

PySparkでfillna()

毎回忘れるPySparkでの欠損処理の書き方と注意点について、個人的な備忘録です。 1. 前提 こちら相当の準備ができていることを前提にします Google ColaboratoryでPySpark環境構築(v3.2.1) - 雑記 in hibernation 2. PySparkの欠損補完 こんな感じの適当な欠…

【あるある】数値をちゃんとソートできないと思ったら文字型になってた

タイトル以上でも以下でもありません。個人的あるあるなんですが、たまにしか引っかからない分、毎回原因に気づくまでに時間がかかるんですよね、、、、 どういうことかと言いますと、 こんな感じのデータがありまして、、、、 id payment 0 aaa 10000 1 bbb…

【読んだ本のメモ】シンギュラリティ:人工知能から超知能へ

輪読用の備忘録として読んだ本の内容をメモっておきます。 概要 どんな本? 人間レベルの人工知能(汎用人工知能)、そして人間を超えたレベルの知能(超知能)を実現するために考えうる道筋と、その過程にどのような技術的課題が存在するかを検討します。ま…

ArviZの体裁で引っかかったところメモ

ベイズモデリングでMCMCの結果をArviZのトレースプロットで表示する際、体裁が狙い通りならないことがありました。解決方法を備忘録として残しておきます。 前提 以下の記事相当の処理をしている前提で、最後のトレースプロットのセル部分に関する話です。 G…

Google ColaboratoryでPyStanをいじくる

ベイズモデリングのお勉強で「StanとRでなんちゃらhogehoge」的な書籍のサンプルコードを実装しようとしているのですが、ここはRではなく使い慣れているPythonとGoogle Colabで動かしたい。と思ってググってみたところ、ローカルで動かそうと思うと意外と面…

ムスタング再生記

かつての愛機であったムスタングをリペアするついでに、ピックアップをダンカンのP-Railsに換装してみました。その結果「自分のことをムスタングと思い込んでいる謎ギター」っぷりに拍車がかかったので、その模様をまとめておきます。 動機 学生時代にメイン…

追い詰められたのでShap入門します

本職でクソモデルをこしらえた結果、モデルの中身に対する説明責任が発生してしまいました。逃げ場を失ったので素直にShapに入門します。 1. Shapとは ビジネスの場で機械学習モデルを適用したり改善したりする場合、各変数が予測値に対してどのような影響を…

PySparkデータフレームをscikit-learnのモデルで推論してみる(pandas_udf)

scikit-learnで学習したモデルを使ってPySparkのデータフレームに対する推論を行う方法はいくつかあって、例えば単純な方法としてはデータフレームを.toPandas()でPandasのデータフレームに変換してからモデルに入力する手があります。しかし、この方法だとS…

Google ColaboratoryでPySpark環境構築(v3.2.1)

以前GoogleColabでのPySpark環境構築の方法をまとめたのですが、最近(v3.x.x以降?)はもっと楽にインストールできるっぽいです。ってことで、手順を更新します。 前回の↓ toeming.hatenablog.com 早速ですが、以下notebook上での処理手順 1. Sparkモジュー…

Pythonで2次元の辞書に要素を追加する

表題まんまです。入れ子になっている辞書に要素を追加する方法の備忘録です。 1次元の辞書 こんな辞書があったとしまして、、、 dict_1dim = {"a":1, "b":2, "c":3} dict_1dim {'a': 1, 'b': 2, 'c': 3} こんな感じで要素を追加できます。 dict_1dim["d"]=4 …

【個人的まとめ】実存と構造

個人的な事情により、一年位前に読んだ書籍を読み返してまとめました。備忘録としてメモです。 概要 どんな本? 新書。2011年に初版刊行なので、ちょうど10年くらい前の本ですね。 実存と構造 (集英社新書)作者:三田誠広集英社Amazon どんな筆者? 三田誠広…

AutoGluonでAuto ML実装(最短実装編)

ぶっちゃけ機械学習エンジニアリングにはあまり興味がない、最低限の作業でそこそこ精度が出てくれればいいと思っている身としてはAuto MLには惹かれるものがありました。で、ちょうど最近AutoGluonの解説を聞く機会があったのですが、想像よりもはるかに手…