2021-08-31

『パラレルワールドのアイツ』のはなし

書籍雑記

NHKスペシャルで特集されるひきこもりの中高年や、「幸せそうな女性」をターゲットにした通り魔や、SNSで芸能人にクソリプ飛ばして溜飲下げてる人らや、「不況で風俗のクオリティが上がって嬉しい」的な発言をしたお笑い芸人や。そういう人たちを見ていると、なんだか他人事に思えず虚しい思いがします。その理由は大きく2つあって、一つは、僕の心のどこかに、確実に、彼らと同じように社会から逃げ出したい気持ちや他人へのコンプレックスが燻っていること。もう一つは、その負の側面がいつどんなきっかけで表出するかはわからないし、結果としてそれを抑えきれなかった彼らが、一歩道を踏み違えてしまった並行世界の自分自身のように思えてならないからです。

2021-08-09

ML-AskをGoogle Colaboratoryで試してみる

Google Colaboratory Python ツール自然言語処理実践寄りの話

前回の記事で、asariを使ったテキスト感情分析を実装してみました。その際、結局使わなかったのですが、裏でML-Askもお試ししていました。

toeming.hatenablog.com

せっかくなのでGoogle ColaboratoryでML-Askを導入するまでの流れを備忘録として残しておこうと思います。

主に以下の記事を参考にしました。

qiita.com

2021-07-21

ビジネスメールから受けるダメージをテキスト感情分析で和らげる試み

Google Colaboratory Python ツール自然言語処理機械学習実践寄りの話

労働が人間の精神に及ぼす悪影響については今更言及の余地はないでしょう。業務・責任に見合わない給与や長時間の拘束などなど、労働のネガティブな要素を挙げ始めるとキリがありませんが、僕個人としては、ビジネスコミュニケーション上で発生する精神的負担は負の要素の最たるものに思われます。

特にメールでのやりとりは僕のようなメンタルクソ雑魚くんにはなかなか辛いものがあります。リモートワークの普及により、以前に増してテキストベースでのやりとりが増加している昨今、無機質なメールの文面から相手の感情を邪推しては勝手に精神をすり減らす毎日を送る方も多くいらっしゃるのではないでしょうか。

この「無機質なメールの文面から相手の感情を邪推しては勝手に精神をすり減らす」 a.k.a.「ビジネスコミュニケーション独り相撲横綱」問題、ひょっとするとメールの文面を「書き手の感情を推定して」「ポップに装飾」することで解決できるのではないか。そんな発想のもと、テキスト感情分析のパッケージを利用してメールの文面から感情を推定し、感情に適した顔文字を付加することで受け手の精神的ダメージを緩和するコードを書いていきたいと思います。

やりたいこと

入力テキストデータの各行に対して感情分析を行い、その結果を元にテキストの各行に顔文字を追加したテキストを出力します。

2021-07-08

Ubuntuの日本語入力設定メモ

AWS 実践寄りの話

AWSで立ち上げたインスタンスのUbuntu環境で日本語入力の設定ができなくて困った。今後のために解決方法をメモっておく。色々試す中で辿り着いたので、この手順がクリティカルでない可能性もある。

OSのverは18.04.5。

1. mozkの設定

SettingのRegion&Languageから、Input Sourcesに"Japanese(Mozc)"を追加。"Japanese(Mozc)"1は+→Japaneseから見つかるはず。他の入力は使わないなら-でinput Sourcesのリストから除外していい。

2. キーボードレイアウトの設定

この状態だとキーボードレイアウトがUSのままなので多分日本語配列で入力できない。キーボードの配列を日本語入力するには、ターミナルから以下を設定変更。viとかで編集するなら管理者権限が必要なので、sudoで実行。

mozcのconfigを編集

/usr/share/ibus/component/mozc.xml
<layout>○○<layout>を<layout>jp</layout>

キーボード設定を編集

/etc/default/keyboard
XKBMODEL=◯◯をXKBMODEL="pc105"
XKBLAYOUT=◯◯をXKBLAYOUT="jp,jp"

設定変更したら、sudo reboot で再起動すると変更が反映されているはず。キーボードマップを参照して確認する。

参考は以下 forums.ubuntulinux.jp

で、日本語入力できるようになる。たぶん。

2021-06-27

Pysparkで累積構成比を計算する

Python Spark 実践寄りの話

PySparkのDataframeでの累積構成比の計算に戸惑ったのですが、ググっても意外とすんなりいい感じの情報にありつけなかったので、備忘録として残しておきます。

Window関数がわかってりゃあなんてことないとのない内容だろうとは思いますが、お勉強も兼ねて。

前提

基本的にgoogle colaboratory上で動作確認をしてるのですが、ライブラリのインポートなどは基本的に以下の記事相当の環境設定をしてます。

toeming.hatenablog.com

2021-06-13

カンディンスキーのコンポジションと言語表現との類似性

思想・哲学理屈寄りの話雑記書籍芸術

ロシア出身の画家のワシリー・カンディンスキーは、抽象絵画の先駆者として有名です。その作品は直線や円が重なって散りばめられた幾何学的な雰囲気が印象的で、素人目に見てもThe・抽象絵画といった様相です。没後何年か経って日本ではパブリックドメインになってるみたいなので掲載します。百聞は一見にしかず。

f:id:toeming:20210613043112j:plain — ワシリー・カンディンスキー「コンポジション VIII」（1923）

抽象絵画というのは素人からするとなかなかとっつきにくく理解が難しく思えますが、「そもそもなぜこんな絵を描こうと思ったのか」という動機は殊更に我々一般市民には想像の及ばない点ではないでしょうか。この記事では、抽象絵画の父たるカンディンスキーが抽象絵画を描くモチベーションと、抽象絵画理論の構想と言語表現との類似性を簡単にまとめます。

元ネタはこちら。