少しの論理的思考で人生を豊かにする。

ドイツの研究者のブログ。ライフハック的なことだったり、仮想通貨に関してだったり、機械学習だったり。雑多なことを書き連ねます。

人生の意味。ゴール。

まさです。

 

この記事が少しでも多くの人の幸福度を上げられる手伝いになればと思い、僕なりに真剣に書きました。ちょっと長いです。人生の意味って。ゴールって。

 

 

人生は時々ゲームに例えられたりしますよね。

お金持ちの家に生まれたらイージーモードだとか、運が大きな決定要因の運ゲーだとか。小さいころから学力テストや体力テスト、大人になっても学歴や資金力といったものさしで他人と比べられることが多く、高スコアを叩き出すと評価されるといった点では、人生はゲームといってもよいでしょう。ある程度、運でランダムに決まったりするあたりもゲームとして面白い要素ですよね。

常日頃資本主義の競争社会で生きている私たちは、なにかしらの目標をもって成果を上げたり、成長を感じたりするわけです。また、恋愛や結婚などのイベントもあります。そして経験値が上がるとレベルアップ、昇進・昇給。

 

 

まぁ、人生は山あり谷ありのゲームに例えられるとして、大事なことが抜けているように思います。

 

そのゲームの目標ってなに?ゴールはなんだ?

 

この考えが非常にぼやっとしているんじゃないかなぁ、と思うわけです。

そうじゃないですか?

 

・・自分にとってゴールが明確だよ、という人はこれ以降読まないでOKです。

いまいちわかってない、日々頑張って生きているけど人生の目標?ってわからない、そんな人は読んでみてください。社会人で死ぬほど残業して、自分何やってるんだろ・・という人は、ちょっとこの記事読んで考えてみてほしいです。

あくまで僕の一意見だけど、でも研究者として社会学の知見をベースに分かりやすく提案します。きっと役に立ちます。

 

 

人生の目標って、お金持ちになって好きなことに好きな時間をさけるようになること?

ちょっと違いますよね?お金や余暇はあくまであるゴールへ近づきやすくなるため・選択肢を制限しないための「ツール」であって、「ゴール」じゃない。

 

有名になること?周りから尊敬されること?自分のやりたいことを追求すること?

これらも少しずれている気がします。上にあげた項目が本当にゴールなの?と尋ねられて、そうだよ、と自信をもって答えられる人は幸せです。

 

 

今、「幸せ」という言葉を出しましたが、結局ここにいきつくんじゃないかな、と思っています。

山あり谷ありのゲームの中で、幸福量のハイスコアを叩き出すこと

なるべく長期間、幸福度(Quality of Life)を高い状態で維持すること

と言い換えてもいいかもしれません。

 

なんだよ、ありきたりかよ、と思った人、ちょっと待ってください。ここからが本題。

 

「じゃあ、人生はなるべく幸福になるゲームだとして、その幸福ってどう定義するのか、という話」に対して、社会学的知見から答えてみようじゃないか、というのが今日の試みです。

 

もちろん、一個人の解釈と提案ですから、誰しもがそう思わなくてよい。人によってものさしが違うことは明白です。とはいえ、その人によって違うものさしを一般化して提唱している概念があるわけです。そこを知っておくと、いろいろ物事の見方が変わってくるんじゃないかと。なお、一応ですが、僕は社会学・心理学などは専門分野ではないです。ただ、文献を読んでなるほどと思ったところから書いている感じです。

 

 

 

まずは、人間の欲求から理解しましょう。これは食欲、性欲、睡眠欲の三大欲求だけではなくて、もっと高次の欲求も知っておく必要があります。それには、Maslowが1943年に提唱した、欲求の階層(Maslow’s hierarchy of needs)、というのが古典的だけど広く受け入れられている考え方を頭に入れておきましょう。

 

その理論によると、人間の欲求は5段階のピラミッド状になっていて、

下から順番に満たしていきたいという風に思うのだそうな。

f:id:masa_crypto:20180922052202p:plain

日本のような先進国でいえば、生理的欲求(食べる・寝るなど)と安全欲求(防災)は、完全ではないにしろ、途上国に比べれば大幅に担保されている状況でしょう。そのうえで、多くの人は次の欲求、所属と愛、そして尊厳欲求を追求しているのが現代社会といえます。TwitterやFacebook、InstagramのようなSNSは、誰とでもつながっているような気になれるし、フォロワー数や高評価の数が多いと、他人に尊敬されているような気にさせられる(尊厳欲求が他人によって満たされる)。

 

ここで意識しておきたいのは、このような5段階のうちで、自分は特にどの段階でどんな欲求を満たしたがっているのか、ということです。自分の幸福度を最大化するのが人生の目的だとして、極端な話、生理的欲求を満たすことで十分に幸せだと感じ続けられる状態であれば、別にそれより上の欲求を満たす必要はないわけです。

 

逆に、自分はなるべく高次の欲求を満たしたいようだ、と思う人であれば、なるべく上を狙っていく必要があるわけです。ただし、大事なのは、ピラミッドを意識すること。例えば、尊厳欲求を満たそうとしている人は、それより低次の欲求がバランス良く満たされていないと条件が整っていない可能性があります。尊厳欲求を満たそうとする前に、自分は所属・愛による安心感を十分に得ているか?安全な生活に満たされているか?といったことを再確認してみるといいでしょう。

 

また、高次の欲求にチャレンジすればするほど、当然ながら上手く行ってくれないことが多くなってくると思います。リワードが大きい分、リスクが高いのです。多大な時間や労力を割いたとしても、決して上手く行く保障はないのです。高次の欲求を満たすことに失敗したとき、どうするか?今意識している欲求の段階をいったん諦め、それより簡単に満たされる欲求をしっかり満たしてください。じゃないとピラミッドのバランスが崩れる。

 

SNSを長時間やるほど不幸になる、という研究結果が数年前に報告されましたが、あれも今のご時世の社会問題といえます。幸福度を高めるルールを崩してきてる。SNSは簡単に所属感が得られる上に、いいねの数やフォロワー数などで他人に認められている度合いを数値化して尊厳欲求を刺激してくる仕組みになっています。はりぼての、インスタントスナックのようなお手軽さ。高次の欲求をダイレクトに満たせるような仕組みに誰しもが簡単にアクセスできる時代になったのです。いいね!

 

・・とはいえ、そんな簡単に本来高次の欲求は満たせるようになったとしても、その多くは吹けば飛ぶような薄っぺらいものであったりして。インターネットに接続できなければ、アカウントが消えてしまえば、一瞬でその土台が崩れる、はりぼてです。仮想空間での疑似的な欲求不満解消のツールに過ぎない。その薄っぺらさは、のめり込めばのめり込むほど気づいてきてしまいます。実社会での人間環境などと比べてしまい、よけい現実を見るのが辛くなる。そういった場合は、いったん低次の欲求を満たすことを考えてみるのはアリだと思います。急がば回れ、じゃないけれど。

 

今の情報化社会は、簡単に人と繋がれて、大勢の赤の他人から評価を受けやすい環境になった。その結果、「バーチャルな世界でお手軽に」所属感や尊厳が満たされるようになった一方で、身を置いている実社会とのギャップによって苦しんでいる人も増えた、ということです。長くなったのでいったんまとめると。

 

 

 

 

・・・欲求の構造は伝わったでしょうか。これを意識して、幸福度を最大化していきましょう。必ずしも高次の欲求を満たす必要なない。下から、順番に、しっかりと土台を作る。次に、何をやればいいのかですよね。ここで出てくるのがQuality of Lifeと Wellnessという概念です。

 

Quality of Life(QoL)とは?

一般に、ひとりひとりの人生の内容の質社会的にみた生活の質のことを指し、つまりある人がどれだけ人間らしい生活や自分らしい生活を送り、人生に幸福を見出しているか、ということを尺度としてとらえる概念である。

クオリティ・オブ・ライフは、個人の収入や財産を基に算出される生活水準standard of living)とは分けて考えられるべきものである。

ーWikipediaより抜粋

この記事でいうところの幸福度ですね。QoLを高めましょうということ。

 

で、QoLを高めようとした際に、Wellnessという概念を知る必要が出てきます。

 

Wellnessとは?

近年のウェルネスの定義には2015年にGlobal wellness Instituteが提唱する「身体的、精神的、そして社会的に健康で安心な状態」がある。

ウェルネスとは、病気ではない状態であるヘルス(健康)を「基盤」として、その基盤をもとに豊かな人生、輝く人生を実現することが「ゴール」である。

 1961年に、アメリカ医学者ハルバート・ダンによって提唱された。

ーWikipediaより抜粋 

 

まぁMaslowの提唱した構造もこれに近いものがありますが、Wellnessはどちらかというと、それぞれの欲求を並列的に見ているような気がします。で、少し分類が異なる。

 

Roscoeによる2009年の総説によると、Wellnessは5-7つの分類に区分されることが多いと(区分は専門家によって少し異なる)。

f:id:masa_crypto:20180922070646p:plain

この図は全然Maslowの方と比べて日本語で出てきません。ウェルネスという言葉が商業的に使われている一方で、コンセプト自体はいまいち浸透していないのかもしれません。が、とりあえずここでは7つにまとめてみました。それぞれ詳しくは説明しませんが、なんとなく大枠でこういう風に分類されるのね、とわかってもらえればOKです。大事なのは、これらの組み合わせをバランスよく満たすこと。これらの要素はお互い関係しあっていることが分かっています。筋トレすると精神的に良い効果があるとかね。という点で、証明はできませんが、あまりにバランスが不均一になってしまうと、高いQoLは維持できないんじゃないでしょうか。

 

なので、自分の生活を見てみて、どの部分がクリティカルに欠けているか、どこの部分が伸ばしやすそうかを考えてみるとよいと思います。これ大事。なぜなら、各要素が関係しあっているから、どれか一つ致命的に欠けている状態だとしても、他の要素を高い状態に持っていくことで、自然と欠けている部分も改善される可能性があるからです。

 

 ここら辺の要素をバランスよく満たしていくと、結果としてMaslowの階層的欲求でいう、より高次の段階まで届くような気がします。

 

ーーー結論ーーー

人生は

「山あり谷ありのゲームの中で、幸福量のハイスコアを叩き出すこと」

「なるべく長期間、幸福度(Quality of Life)を高い状態で維持すること」

 がゴールであり、

具体的なHowを含めると、

自分の欲求のレベルを知り、Wellnessでの欠けている部分を補うために伸ばせそうなところを満たしてあげることで、結果としてWellness全体の総量を上げること

がゴールだと考えてよいと思います。

 

 

反響次第でWellnessについて今後もっと掘り下げていきたいと思います。

 

投資・テクニカル:出来高で値動きを予測する

・・・うん、まだ予測できるようには全然なっていません!!笑

 

 

要点

「出来高は株価に先行する」は投資の格言!(ググるとでてくる)・・・ただ、常にそうとは限らない。

 

 

 

どうも、まさです。

ドイツはビールが500mlで100円程度と、とかく安いので、定期的に箱買いしています。今日買ったのは「いかにもホップが効いてるぜ!」的な主張をしていたHopf Helle Weisseというやつです。バナナみたいなフルーティーさが弱めで、やや酸味が主張しているものでした。☆3つ。今度おすすめのビール情報も書きたい。

f:id:masa_crypto:20180918041514j:plain

 

 

 

 

とりあえず現時点、9/17で出来高に関して調べた際に思ったことをまとめたいと思います。出来高、ずーっと前から気になってたんですよね。価格情報とは別の扱いだから。以下、いくつかポイントを書き連ねますが、出来高の多面性の難しさに注意して下さい。その性質を上手く理解しないと使えないと思っています(そこが僕の当面の課題です、僕も分かってないです)。

 

 

 

出来高は相場の活況度を表す

そもそも考えていたのはこれでした。出来高はある時間内に取引された量ですから、もちろんそれが多いほど多くの取引がなされた、ということ。例えば、値動きが1時間で100円だったとして、それが2人だけでやりとりした結果なのか、1000人の売りたい・買いたい思惑が入り乱れた結果なのか、大きく違いますよね。

それで?って言う話ですが、僕がおおまかに考えていたのは2つ。

 

出来高が大きいとき、それは

A) 反発しやすい。なぜなら下がっても押し目で買う人が多いから。

B) 急に一方向に動きやすい。なぜなら皆勢いに乗るから。

 

どちらもあると思います。大事なのは、背景を考えること。Aの場合は、基本的に強いトレンドが続きそうだ、というときに多そうですよね。Bの場合は、レンジ膠着からブレイクする時に勢いに乗りたい、という時に多そうですよね。

 

 

 

②出来高は価格に先行する

ふうむ、調べるといくつかこういったことを書いているサイトが出てきました。

相場の格言なんだとか。「逆ウォッチ」という言葉もみっけました。逆ウォッチというのは、横軸を出来高、縦軸を価格、とした場合に、相場のサイクルは次の図のように動くのよ、ということなんだそうです。まぁ、いろんなサイトに出てるけどね、自分でも図にしておくね。反時計まわりだからその名前がついたそうな。

f:id:masa_crypto:20180918044358p:plain

 

で、これは時間の軸がない。時間軸で見た方が慣れ親しんでいるので、それで見せるとこんな感じ。おなじみBTCで、昨年末のピークをつけた時の出来高が価格に先行している例。

f:id:masa_crypto:20180918045819p:plain

いや、もっと細かくみたら色々山あり谷ありって感じなんだけどね、とりあえずのイメージです。たぶん経験ある人だったら、当時、この出来高の変化でピークくるな、ってのが分かってたはず。たぶん。

 

 

③大口の動いた形跡は隠せない

これ、そうだなぁ、と思いました。まぁ考えれば当たり前なんですけど。

 

大口は値動きをうまい具合に誘導したいわけですよね。特に個人大勢が買い込む前にたくさん仕込んでおきたい。なので、価格があまり動かないようにある程度の期間に分けて仕入れていく。その次に、価格を一気に、センセーショナルに、上げる。ファンダの好材料と一緒に出来れば注目が浴びせられてベター。この際、急激に出来高が大口によって上げられる。これは一気に価格を上げるために資金投入するから。

 

するとどうか?何かありそうだ、上がり続けるんじゃないか、という個人投資家がどんどん寄ってきて、買いが一気に優勢になる。場が活況になる。出来高を伴って価格が上がり続け、その評判を聞いて更に人が増えることで出来高が増える。

 

この頃には出来高がピークを迎える。それは、「このBTCは永久に上がり続けるぜ~~~!!もっと買うんだ!!」なんて個人投資家の沢山が浮かれまくっている間に、

大口が「どうぞどうぞ。そんなに買いたきゃ売ってあげます」と大量に売りさばき、一気に利益を得る。・・・これが出来高が価格に先行する、と言われるゆえん(違ったらめんご。バンドワゴン効果とかいうやつ)。

 

逆も然りです。大口がなるたけ安く大量に仕込むには?これまた価格を下落相場にして総悲観にさせる。個人投資家が下落に耐えられずどんどん投げ売りしていくときには大口が購入完了。という。

 

 

 

注:じゃあ、出来高が常に価格に先行するのか?というと、どうやらそうでもなさそうなんですね。

というのも、

A) 出来高と価格がそもそもそんなに意味を持つ関係を持っていない時期と、

B) 出来高が価格に遅れてくる時期

があるっぽいんだな。これが。逆ウォッチを書いているサイトのページに、価格が出来高を先行する場合もあるってことを書いていないケースが多いです。親切なページは書いてありました。

 

で、ここら辺がどういうタイミングでスイッチ切り替わるか?

大口が操作しなくても良い時期、というのがあるような気がしています。大口が上に下にと引っ張らなくても、ある程度方向を定めてそっちに進むとき、とか??

 

 

今のところはMACDを出来高に当てはめると凸凹が減るのでまずはその傾向から何か見出せないか調べ中です。とはいえ、凸凹も大事な情報なので、そっちも後々考えます。

 

・・とはいえ、まだ良く分かっていません。

知ってたらこっそり教えて下さい。笑

統計と機械学習の共通点ってなに?

今日は統計と機械学習の共通点についてです。

f:id:masa_crypto:20180909072321p:plain

 

要点

統計と機械学習で解析できるデータや、やる作業はほとんど同じ。

だからこそ、モデル化する目的をしっかり確認。自分の考えの妥当性を検証したいなら統計、とりあえずデータ漁りしたいなら機械学習。

 

 

 

masa-crypto.hatenablog.com

 

 

前回は統計と機械学習の違いについて。元々の考え方の出発点が根本的に違うんだよ、ということでした。 とはいえ、同じデータを同じように解析できちゃうわけです。実際のところ。

 

 

 

例えば、体脂肪率をモデル化したい、体脂肪率の高い低いを説明するのに大事な要因を探りたいといった場合。各個人の体脂肪率を計って、その他に考えうる関係しそうな要因をいくつも用意するわけです(例:年収・スポーツ頻度・朝ごはんはパン派かお米派か・飲み会頻度・親の体脂肪率、とか。適当ですが)。

 

で、結局は統計も機械学習も、

1)集めたデータをエクセルシートなんかにまとめる

2)何らかの変数が目的変数(体脂肪率)と関係してるか確認のためにモデル化

3)モデル化した上でどの変数が強い説明力を持つか確認する

4)モデルがそれなりに妥当かどうか検証する(関連:説明力)

 

というワークフローは全く同じです。どっちも同じデータを使ってパターンを見るわけだから同じっちゃ―同じわけです。

 

だからこそ、統計と機械学習のやる作業が似ているからこそ、そのモデル化したい目的はなんなの?をしっかり自分に問う必要があるのです。

 

そこで前回書いた「違いとは何ぞや」を思い出してほしいのです。

説明したいの?予測したいの?

自分の考えた関係性を検証したいの?とりあえずデータ全部使って眺めたいの?

ここらへんを区別しとくと、どっちを使うかは明確になります。

 

実際、データ解析の依頼とか受けた際に、「これを機械学習でどうこうしてほしいんだけど・・」と言われても、相手の目的次第で統計手法をオススメしたりします。とはいえ、相談してくる以上、自分で何したらよいのかようわからん、という場合が多いので、色々話して、相手が仮説をもっていてそれを検証するのが目的かどうか(それなら統計で良い)というのを明らかにしていきます。「機械学習ってファンシーでマジカルなんだろ?やっちゃってよ!」みたいな輩が相談しにきたりした場合は、そもそも統計と機械学習の違いの話とか聞く耳持たない場合もあるので、そんな時はとりあえずもはや統計と機械学習どっちも適用して結果を比較したりもします。

 

 

・・とはいえ、最近は機械学習と統計、ちょっと境界線があいまいになってきてる部分もあったりしてですね。なんかお互いの分野の一部の人たちが少し歩み寄り始めたって感じの展開が10年前くらいから出てき始めてます(そこらへんも近日中に書きたいです)。

 

あと、機械学習って「データが大きい時に使うんじゃないの?」というご質問も受けたりして、でも実務だと小さいデータでも使うべきところもあるのよ、というのも近日中に書きます。

 

統計と機械学習の違いってなに?

統計と機械学習の違いってなに?これに答えます。

f:id:masa_crypto:20180909072321p:plain

 

データを使って、何かしらの有益な情報を得たい、というのは分野に関係なく求められることだと思います。まぁ良く使われるのは平均値だったり相関係数だったり、もう少し進むと回帰分析で簡単なモデルを作ったり。これは統計よね。

 

で、近年ビッグデータとか人工知能とかで脚光を浴びている機械学習(ディープラーニングなんてのも聞いたことあるかもしれません。これも機械学習の発展系です)。データを解析する、という点では統計と同じです。じゃあ、結局機械学習と統計、何が違うん?というのが今日の小咄。

 

僕はこれまで研究者として機械学習の論文を読み漁り、それらをまとめた総説なんてものも書いたりしているので、専門家です。データ解析コンサル的なこともしています。ただ、多様な解釈のうちの一意見に過ぎないという点はご注意を。

 

 

要点

1.統計は物事の解釈をするために、機械学習は予測をするために

2.統計は複雑なものを単純化する、機械学習は複雑なものを複雑なものとして扱う

3.統計はデータに強い仮定を置く、機械学習は仮定を置かない

 

統計?

統計は、たくさんのデータをいかに単純にまとめあげて傾向を掴めるか。統計は、ある問題が起こった場合の傾向、物事の全体像を掴みたい!というところを発端にしています(関連:統計の歴史を振り返る〜統計の3つの源流〜|統計学習の指導のために(先生向け))。要は、本質をとらえた少しの情報で説明したい

 

平均や分散を出すのも、仮説検定をするのも、あくまで人が物事を考える上でデータそのままだと情報が多すぎるから、なんとか情報量を減らして、物事をもっとシンプルに捉えたい、というところです。

 

で、どうやって単純化するか、ですよね。これの肝が「確率分布」になるわけです。データのばらつき、というのは、「ある確率分布に従う」という強い仮定を置くと、サンプル数が100個だろうが1000個だろうが、わずか数個のパラメーターというもので代表出来てしまう訳です。日本人男性全員の身長のほとんどが、171±5㎝で説明出来てしまう(値は適当です)、といったように。また、回帰分析なんかでも、どの変数が関係するか、場合によっては交互作用をもっているか、なんてのも仮定しないといけない。なので、基本的にはあくまで人の思考が前提にあってそれをサポートするのが統計なわけです。

 

 

機械学習?

機械学習は、たくさんの数値データからいかに精度の高い予測ができるか 。機械学習は、基本的に人工知能の一分野であり、「人間のニューロンを模したらイケてるんじゃね?」「どうやったらデータを人間の介入なしに機械が勝手に解析してくれるかな」というところからきてます。それには、少しの情報にまとめる必要な必ずしもなくて、とにかく精度の高い判断(要は予測)ができるものをデータから作りたい

 

統計とは全く異なります。平均や分散を出すのも、仮説検定をするのも、あくまで人が物事を考える上で必要なこと。そんなのは関係ない。そういった人間の思考で見落とすことがないよう、データのありとあらゆる情報を勝手に抜出して、データ内での関係の強いパターンを勝手に見つけ出したい。データそのままだと情報が多すぎるから、なんとか情報量を減らして、または確率分布のような仮定を置いて物事をもっとシンプルに捉えたい、なんてもってのほかだ!情報はとりあえず全部使ってみて、使える情報だけ残す。人の意思をデータ解析に極力介入させず、データのみで勝負する。これが機械学習。

 

 

 

 

余談ですが、決定木(CART)・バギング・ランダムフォレストなどの生みの親Leo Breimanさんのお話しを。サンプル数が数十個しかないのに、予測に使いたい説明変数が数千個とかある、という状況にでくわしたBreiman(どの遺伝子が癌の発現率に関係しているか知りたい、といった状況を想定して下さい。株価の予測でもいいです)。統計では、基本的にサンプル数は説明変数よりも5-10倍多くないと経験則的に苦しいです。なので、当然既存の統計手法なんてものは全く使えない。それでもコンサル的になんとか予測できるモデルを作らなきゃならない。そんななか、思いついたのが彼の機械学習アプローチらしいです(参考:Breiman 2001)。

 

なお、他の方々もこういった文章を書いたりしているようです。

きっと参考になると思います。

例:

tjo.hatenablog.com

qiita.com

読書感想とまとめ:人生は、運よりも実力よりも「勘違いさせる力」で決まっている

伝説のブログ分裂勘違い君劇場のふろむだ氏の著書

【人生は、運よりも実力よりも「勘違いさせる力」で決まっている】

非常に面白かったので感想とまとめ。やはりこの人の文は面白いです。以下、まとめたりはしますが、是非読んでみることをお勧めします。

 

 

要点まとめ

1.錯覚資産:人々が自分に対して持っている、自分に都合のいい思考の錯覚。例えば、容姿が優れていると、その人の他の能力も過大評価されやすい。フォロワー数が多いと、その人の考えもなんとなく説得力があるように思えてしまう。など。

2.実力は、よい環境(人間関係など)に恵まれることで効率よく伸びていくが、よい環境を手に入れられるかどうかは、実力よりも錯覚資産によるところが大きい。例えば、「あいつは前回のプロジェクトで成果を挙げたから、今回のこのプロジェクトも奴に任せよう」というのも、その成果が個人の実力でなく、運や周りに凄く助けられた結果であったとしても、評価時には錯覚させられる。

 3.錯覚資産を運用して複利で増やしていくことが大事。人生はある程度運で決まることを大前提に、たまたま錯覚資産を手に入れたなら、それをテコにして、さらに錯覚資産を膨らましてゆく。錯覚資産があると良い環境に進め、実力が伸び、結果として錯覚資産も増える。のループ。

4.人生は運で大きく決まるのを大前提とすると、一番良いのはとにかく色々な事に手を出しつつ自分が色々な人の目に触れられるようにしておき、チャンスが引っかかるのを待つ。多くの人は実力が伴っていないから・・と敬遠してしまうので、そこをあえて意識して積極的にやる。

 

 

感想

うーむ。素晴らしいの一言です。何より個人的に感銘を受けたのは、ほとんどの人の頭のなかに多かれ少なかれある経験則やもやっとしたルールを体系化し、概念として提唱していること。その概念を色々な例を使って説明して読み手を納得させる。それに加えて、「分かったけど、どう使えばいいのさ?」を具体的に説明してしまう。理論研究者の鏡です。内容がどうこう、という話ではないけど。

 

僕もそういう経験があります。海外に出て研究していると、日本の同年代の研究仲間や友人から勝手に過大評価されたり(別に僕が何をやっているかなんて知らなくても)、データサイエンス・統計をやっていると、勝手に頭がずば抜けていいだろう、と一目置かれたりします(これまたどんなことをやっているかも知らずに)。

 

面白いのは、この錯覚資産によって、「なんであいつは実力があるのに上の立場になれなくて、こいつは実力は大したことないのにするする昇進するんだろう」というありふれた謎に一つの答えを出すことができる、という点ですね。結局決め手は「なんとなくの直感」が最終決定権を持っていると思っています。勿論実力である程度足切りされてしまうけれど、やっぱり最後は人と人の、直感。で、いろんなことに抜擢されるには、やはりコネクション(人のネットワーク)の広さも大事だと痛感です。「錯覚資産」は個人が持つ情報で、その情報がどれだけ広くの人に伝わりやすいかが、ぐんとチャンスにひっかかる確率が上がる。

 

 

 

錯覚資産、たぶん誰しもがなんとなく頭の片隅にあることだとは思うのですが、それをいかに上手く運用できるか?というのは考えてみる価値がありそうですね。

最新:Iterative Random Forestが高次の交互作用を抽出できる期待のアルゴリズムか

機械学習は基本的に、入力と出力の間の関数が一切未知であるとした前提で、その謎の関数と同等の精度で結果を出せる関数をデータから見出すのが仕事です。なので基本的には統計と違って確率分布や線形性、どの変数間が交互作用を持つかなどは一切仮定しないです。

 

大前提、機械学習の哲学としては、「全ての情報は有益かもしれないという立場の元、最大限に予測精度を高める」ことを信条にしています。なので、予測精度がどれだけ高いか、というのが肝だったり。とはいえ、ブラックボックスを作るだけでは解釈までは難しい、せめてどの変数がどう出力に影響するのか?というのはある程度把握したいわけです。

 

で、よく言われるのが、機械学習は変数間の交互作用(Interaction)も勝手に見つけて考慮してくれるから強い、というやつです。特に、非線形で高次の交互作用(Nonlinear higher-order variable interaction)を上手くキャプチャーしてくれる、というやつ。たしかに、おそらく理論的にはそのような複雑な変数間の関係性を掴んでくれていたりするはず、ブラックボックスの中で。

 

しかしながら、「機械学習で高次の交互作用を捉えているというけど、じゃあどの変数がどういう風に関係しあっているの?」という質問に答えるすべがほとんどなかったりします。一応それっぽいアルゴリズムはいくつか提唱されているけど、大抵のものはいまいちな感じ。。そこでついに出てきた期待の(現時点おそらく最強)アルゴリズムが、BasuらによるiRFというやつです。

 

 Basu et al. (2018) Iterative random forests to discover predictive and stable high-order interactions. PNAS 

Iterative random forests to discover predictive and stable high-order interactions | PNAS

 

2017年にはすでにArxivに投稿されていて、強い興味を持っていたのですが、PNASに出てくるとは・・。

f:id:masa_crypto:20180907170618p:plain

これは、Random forestをベースにしていて、論文の事例では2次・3次・4次・5次・6次の交互作用を総当たりで評価して、どれが一番大事かを評価してみたりしています(上の図では3次までだけど、論文中には6次とか平気で出てきます)。面白いのは、例えば2次の交互作用(A*B)が重要でなくとも、3次(A*B*C)が大事だったりすること。こんなん、事前に式を立てるパラメトリックな統計では決して思いつけないですよね。このアルゴリズムを使うと、どの変数らを一緒に考えないといけないのか、というのが容易に抽出できるようになるかもしれません。

 

なお、Rで既にパッケージ化されているので、試してみたくもある。

 

労働時間の5%って多い?少ない? その5%が人生を変える。#3PDCAを自己成長につかう

限られた時間を有効に活用しましょう、となると、やはり計画を立てる能力、問題があれば適宜軌道修正する能力、が大事になってきますよね。

 

僕としては、PDCAを回させることで自己成長を促すことが有効だと思っています。

 

※PDCAというのは、ご存知かもしれませんが、会社などの持続的で効率的な成長を促すための思考ツールです。Plan⇒Do⇒Check⇒Act(⇒Plan...)。計画し、実行し、計画通りにいったかを評価し、軌道修正した計画をまた練る。

 

PDCAという概念は、もともと品質管理のために生まれたもので、今ではビジネスで生産性を高めるために使われています。それを、個人のパフォーマンス管理・向上に適用しちゃいましょう、というわけです。

 

僕がやっているのは、毎週月曜の朝30分ー1時間くらいかけて、その週の計画を立てます。特に、40時間しかないということを念頭に、どのタスクに時間をどれだけ割り当てたいか・優先順位をどうするかを踏まえて、リストアップします(Plan)。それをその週に達成目標として実行する(Do)。その次の週の月曜朝には、1週間の間に実行した計画がしっかり出来たか(Check)確認し、もし出来ていなければ、なぜ達成できなかったのか、どうしたら達成できたかの原因・対策を練ります(Act)。

 

これをすることで、そもそも計画時に自分の能力を過大評価しすぎていたのか(最初はこれが多い)、はたまた計画は実行可能だったけど、業務をしている間が問題だったのか、業務以外の時間の使い方の問題だったのか?などがわかるようになります。

 

例えば、休憩が多すぎる、とか、逆にある一日でがんばりすぎて、次の日にやる気が出なかったとか、平日夜遅くまで飲みすぎると次の日は全然だめだとか。僕の場合、平日遅くまで飲むとどうしようもなく次の日のパフォーマンスがどうしても落ちます。なので、飲みの予定が事前に分かっているときは、そのパフォーマンス低下を見越してタスク量を減らします。

 

また、僕は20以上のプロジェクトに関わっていたりしますが、優先順位付けをする際にどうしてもこういった手法がないと回しきれない、というのもあります。

 

PDCAの肝として、僕はActが一番大事だと考えています(定量的な計画、なども大事ですが)。計画して実行するのはほとんど誰でもやっていることでしょう。ただし、実行してプロジェクトがひと段落したところで、当初の計画通り進んだか、進まなかったら何故そうなったのかをしっかりチェックする人が非常に少ない。ここをしっかりやることで他の人との差別化が図れます

 

また、このPDCAを繰り返すことで、自分の力量を把握できるし、精確に計画する能力もついてきます。このようなPDCAを週単位でやってWordなどに保存しておき、3ヶ月ごとにまとめるなどするとさらに中期の流れなども把握しやすくなり、1年先までの進捗も読めるようになってきます