hsuetsugu’s diary

ITの技術的なことに関して主に書きます。Rとpythonとd3.jsとAWSとRaspberryPiあたりを不自由なく使いこなせるようになりたいです。

データ分析する上で役立つ本のまとめ50冊

この連休だけで読んだわけではないですが、いろいろ振り返ったりしたので、分析に役立つ本などをこの機会にまとめてみました。おすすめ度合い、というと読む人の立場とか状況によって違いそうなので、主観的に、自分にとって役立った度合いを5段階で評価しました(星の数で)。

Amazonの商品紹介貼付けてまくってますが、アフィリエイトはやっていません。著作権的にAmazonのを貼るのは問題ないらしいのでそうしているだけです。
※以下、長いです。長くなりました・・。

分析関連

まとめとしては、O'Reillyの本が情報量も多く、参考になるものが多い。Rやpythonのコードも豊富で、かつ実践的なので、「プロはこう書くのか」と参考になるものが多かった。また、R、pythonどちらでも、パッケージにあまり頼らないで関数を最初の章から少しずつ積み上げてきちんと書かれているので、「この手法はこのパッケージをつかってこう書くとこう結果が出てくる」で終わらずに、どのような考えで、どのような計算を実行していくのか、理解しながら読み進めることができるところがよかった。
一方で、日本の分析系の職についている人が書いた本はあまりに初心者向けなものであり、かつ計算のコアの部分はパッケージ任せ。学者が書いた理論的なものは数式が多く難解になっており、両極で、ちょうどいいのがなかなかない、という印象。

結論は、
手を動かす部分は「集合知プログラミング」、「入門 機械学習」の2冊を丁寧にやりきれば相当力がつく(やりきれていないけど)。手を動かしながら、計算の考え方が理解できる。パッケージの使い方は、WEBで検索すればいい。辞書系のものを一冊持つとしたらRなら「Rクックブック」、Pythonなら「Pythonによるデータ分析入門」がよい。
理論的な部分は「統計学(サイエンス・パレット)」や「XXXのはなし」シリーズなど、良質で数式が少なくコンパクトな書籍がよい。

O'Reilly本

  • 集合知プログラミング ☆☆☆☆☆

集合知プログラミング

集合知プログラミング

これは日本語版が発売されてすぐくらいに読みましたが、当時はPythonに触ったこともなかったし、こういうゴリゴリの分析をする案件も特になかったので、それから数年経ってから読み始めた。推薦、クラスタリング、最適化、決定木などだいたい網羅されており、コードはPythonで書かれていて、ロジックがライブラリを使わずに書かれている。例えばユークリッド距離を計算する関数を用意して・・・というような流れで計算してくれるので、どのような考え方なのかがつかみやすい。読み物としても非常に面白い。また、BeautifulSoupみたいなスクレイピングのやり方も学べる。一つ残念なのはWEB APIからデータを取得しているのが多いが、現時点で使えないものが結構あり、そこについては試してみることができないこと。そしてPythonよりもRを普段使う私にとっては高度。引き続き勉強します。

入門 機械学習

入門 機械学習

こちらはRで書かれている。内容的には集合知プログラミングと大きくは変わらない。R版という感じ。こちらの本でも、ナイーブベイズでのスパムメールの分類器など、ちょっとした分析ロジックがライブラリ使わずに書かれている。分析ロジックの考え方が理解できるうえに、元データをクレンジングするところからきちんと書かれているので、実践的であり、その部分のコードがきれいで惚れ惚れしてしまった。集合知プログラミングとの差異としては、本書では2章の「データの調査」というところで元データの一次分析をしており、ggplotを使った可視化にページがさかれている。7章の最適化:暗号解読の章はきちんとトレースしたい。引き続き勉強します。

  • Pythonによるデータ分析入門 ☆☆☆☆

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonのpandasを使った分析が主。一次分析として手元にあるデータの可視化をするところから丁寧に書かれているので、RがメインでPythonはweb apiをたたいたり、WEB上のデータなどのスクレイピングをしたりなど、json系データの扱うときしか使ってこなかった自分にとっては、Rのggplotでの描画に相当するものがPythonでどう書くか、ということなど勉強になった。本書は上記の2冊と異なり、書き方についての本なので、Pythonで普段分析することが多い人にとっては整理するとか、たまに思い出すのに辞書代わりに使うような感じと思われる。私にとってはPythonで分析するための前提知識が乏しかったので、体系的に整理されていてよい。

  • Rクックブック ☆☆☆☆

Rクックブック

Rクックブック

上記"Pythonによるデータ分析入門"のR版という感じ。Pythonは用途広いから上記の本は「データ分析」って題名に入っているけど、Rの場合はデータ分析するのが前提になるので、分析する上での書き方集という感じ。なんだかんだ結構お世話になった。時系列分析系はページさかれていて比較的わかりやすく、xtsパッケージものっている。可視化はggplotがのってないからそこは残念。

  • 入門 ソーシャルデータ ☆☆☆

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

読んだ当時、この本については分析というよりは可視化のところで興味をもった。最近有名になったd3.jsの前進であるStanford Visualization Groupが作った"Protovis"や、MITの人が作っていた"Simile Timeline"というライブラリが紹介されており、これらのライブラリを知って、d3.jsを知ったのがこの本を読んで一番よかったこと。この本が出た当初はd3.jsの日本語の情報はほとんどなかったけど、最近は日本の書籍もたくさん出ている。あの時期にd3.jsの存在を知れて、実務でd3.jsを活用していけたのは技術的なアドバンテージになった。
本の内容としては「ソーシャルデータ」という題名の通り、対象としているのがtwitterとかfacebookのようなグラフデータなので、あまり私にとってはなじみがなく、実務にすぐ使える、というものではなかった。

セマンティックWeb プログラミング

セマンティックWeb プログラミング

これは読み物としてめちゃくちゃ面白かった。当時、データ分析に対して、「技術的に」自分が直面していたこととか、それを乗り越えるためにはこういうものが必要なんじゃないか、と考えていたことがこの本ですごくきれいに説明されていた。確か、所属部の先輩何人かにひたすら読ませていた気がする。特にこの技術を使ったものが立ち上げられた訳ではないけど、製造業の部品表の考え方はこれで変わる!と感じ、とにかくSemantic Webのことをこの本を読んでから調べていた。セマンティクスってなに、オントロジーってなに、とかもんもんと考えていた日々。

  • Think Bayes 

Think Bayes ―プログラマのためのベイズ統計入門

Think Bayes ―プログラマのためのベイズ統計入門

これはPythonで書かれており、Think Statsの続編というかベイズに特化して書かれたもの。最初に書かれている、M&M問題とかほんとにのかな。あのお菓子のM&Mのことなんだけど、1995年以降から黄色とか緑とかの色の割合が変更されたらしく、袋から1つとって、それが黄色だったときに、それがどちらのバージョンなのか事後確率を求める、みたいな典型的な例ででていたんだけど。まだ読み進めている最中なので評価できず。でも面白い。これでようやくベイズ統計が理解できるようになるかも。

  • バッドデータハンドブック ☆☆☆☆

バッドデータハンドブック ―データにまつわる問題への19の処方箋

バッドデータハンドブック ―データにまつわる問題への19の処方箋

データハンドリングあるある本。なんだかんだ、分析にかかる時間のほとんどは前処理というかデータハンドリングなので、それをするうえでやっちゃいけないこととか、使えるTIPSが満載。RDBMSにデータいれてSQLで前処理した上でRとかPythonとかすることが多い私には役立つTIPSがあり、そして共感することが多くあった。読み物としても面白い。

アジャイルデータサイエンス ―スケーラブルに構築するビッグデータアプリケーション

アジャイルデータサイエンス ―スケーラブルに構築するビッグデータアプリケーション

エンジニア向け。最近はどんなツールが出てきていて(AWSとかElasticSearchとかKibanaとかfluentdとか・・・)、それらのツールを使って分析環境をどう整えていくのかが書かれている。日本語版はクラスメソッドの方がElasticSearch,Kibana,fluentdについて付録つけてくれていて、それがなかなかよい感じ。

  • ビューティフル・データ ☆☆☆

ビューティフルデータ (THEORY/IN/PRACTICE)

ビューティフルデータ (THEORY/IN/PRACTICE)

読み物系。おお、かっこいいという感じ。

  • ビューティフル・ビジュアライゼーション ☆☆☆

ビューティフルビジュアライゼーション (THEORY/IN/PRACTICE)

ビューティフルビジュアライゼーション (THEORY/IN/PRACTICE)

読み物系。おお、かっこいいという感じ。

ソーシャルゲーム/WEB/ECもしくはコンサルでデータ分析をしている国内の人が書いたもの

  • データサイエンス超入門 / 工藤卓哉 ☆☆☆

データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方

データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方

アクセンチュア工藤さんの本。データサイエンスというかアナリティクスの領域、という感じ。在庫設定のμ+3σみたいな話は、統計よくわかっている人にとってはあまりに単純だし、もっと効果のでるやり方ももちろんあるけど、オペレーションまで含めるとこの単純さが結構効果が出る、というのは同感。B2CじゃなくてB2Bでのデータ分析は、μ+3σだとか、分散分析だとか、分析だけをとリ出してみると通常こんなレベルだし、それですらオペレーションに浸透させるのは大変。B2Bということで感覚的にはやっぱ近い。工藤さんといつか仕事したいな〜。

  • ビジネス活用事例で学ぶデータサイエンス入門 酒巻隆治,里洋平 ☆☆

ビジネス活用事例で学ぶ データサイエンス入門

ビジネス活用事例で学ぶ データサイエンス入門

ドリコムのデータ分析グループの人が書いた本。「ビジネス活用事例で学ぶ」というのを意識してわかりやすく書こうとするとこんな章立てになるんだろうなーと感じた。オンラインゲームの領域はよく知らないけど、リテンション(って言うのかわからないけど)を高めるために、倒せなそうでぎりぎり倒せるボスのレベルだとか、こんな風に設定されているのかなあとか想像して読んだ。「ビジネス活用事例で学ぶ」というのが、オンラインゲーム業界だからなのか、わかりやすくするためなのかわからないけど、イシューの設定が単純で、そこと分析のつなぎがしっかり書かれているところに特に価値は感じず、ページ数の割に情報量が少ない。参考にならないことはもちろんないけれど、tokyoRの発表スライド2つ分くらいの情報量なので、敢えて本で体系的に読まなくてもいいかなという感想。コードはRで書かれている。

手を動かしながら学ぶ ビジネスに活かすデータマイニング

手を動かしながら学ぶ ビジネスに活かすデータマイニング

リクルートコミュニケーションズのデータサイエンティストが書いた本。「ビジネスに活かす」って言われちゃうと結構気になるなあ。題名にこれがなかったらそこまで気にならないかもしれないけど、例えば「ビールの生産計画をたてる」というので、店舗の周りのイベントとかいれて重回帰分析しているけど、そもそもビールは生産リードタイム長いから生産計画と売り上げ数量って結構遠くて、在庫バッファリング含めて、かつ複数パッケージまで考慮してラインの生産計画たてないといけないから、ビールの生産計画はオペレーションズリサーチという領域。ビールゲームってのがある通り。生産計画ではなく、仮に各店舗での販売計画だとしても、やっぱり一番大きな因子は競合商品の値付けなのでそこは考慮してほしい。あと売上数量を客数で割って1000をかけたPI値(PurchaseIndex:来店客1,000人あたりの当該商品の購買人数)とかも使ってもらえると、そもそも曜日変動とか祝日効果とか天気とか外的要因除去できるから、そんな話してくれたほうがずっと「ビジネスに活かす」感はでてくるのになあ。あとは分散分析は個人的には使うシーン多くあるから最後にはしょられているのが違和感あるのと、初心者向けなのであれば、そもそも相手にしているデータをまず一次分析にかける、ということでggplot系の可視化はあったほうが題名とマッチしてくるかと思った。Rのインストール方法とかはWEBでみた方がわかりやすいし、そこ除くと情報量少ないな〜。言語はR。

戦略的データマイニング (シリーズ Useful R 4)

戦略的データマイニング (シリーズ Useful R 4)

ドリコムのデータサイエンティストが書いた本。可視化から入ってくれているので、分析する上での処理は網羅されているかな。「戦略的」とあえて題名につけているところが疑問。仮説もって分析してね、ってことくらいのメッセージしか中では書かれていなかったように思う。なので「戦略的」というよりは、「論点思考 BCG流・・・」とか「外資コンサルのスライド作成術」みたいなコンサルノウハウ本と言いたいことは同じなのかな、と感じた。そうだとすると、それは共感ではある。結構本がでかい割にコードの部分が大半を占めていて、文字数はかなり少ない。情報量だいぶすくない。言語はこれもR。

  • エンジニアのためのデータ化可視化実践入門 / 森藤大地,あんちべ ☆☆☆

「エンジニアのための」と書かれてはいるけど、コンサルにとっても事業会社の社内で分析する人にとっても役に立つ本。どのようなデータに対して、どんなメッセージを伝えるときに、どのようなチャート(棒グラフとか散布図とか)を選ぶのか、というのが体系的に書かれているので、コンサル1年目の人にも役に立つと思われる。前半(1-2章)まではエンジニアではない人にも価値がある。3章以降はd3.jsでどう実装していくか、という話。半年早く本書が出版されていたらすごくお世話になったんだろうと思うけど、ちょっと欲しいタイミングよりも出るのが遅かった。

実装支援

  • R言語上級ハンドブック ☆☆☆

R言語上級ハンドブック

R言語上級ハンドブック

そんなにメジャーじゃないパッケージだとか使い方に関する辞書で、かゆいところに手が届く系。部分的に結構役に立った。コマンドラインオプションのパースとか、data.tableとか。

  • Rパッケージガイドブック ☆☆☆

Rパッケージガイドブック

Rパッケージガイドブック

  • 作者: 岡田昌史,荒木孝治,伊藤康広,里洋平,高柳慎一,棚瀬貴紀,谷村晋,中谷朋昭,蓮見亮,林真広,樋口千洋,福島真太朗,牧山文彦,横山貴央,akira,mickey24
  • 出版社/メーカー: 東京図書
  • 発売日: 2011/04/09
  • メディア: 単行本
  • 購入: 2人 クリック: 1,298回
  • この商品を含むブログ (16件) を見る
これも上のと同じ系列。こんなパッケージあるんだ〜って知れる。

理論系(時系列分析もの)

  • 世界一やさしい金融工学の本です  ☆☆☆☆☆

世界一やさしい金融工学の本です

世界一やさしい金融工学の本です

超初学者向けですが、ボラティリティーだとかランダムウォークだとかを理解する上で、この本はほんとにわかりやすかった。古典的な理論在庫計算において、発注から納品までのリードタイムがX日の場合に、安全在庫設定をμ+nσ√Xになんでするのか、√Xのところは分散の加法性で成り立つわけですが、その辺すらわかっていないコンサルタントはいくらでもいます。その辺のほんとに最初の部分を勉強するにはすごくわかりやすい。いきなりランダムウォークとかAR過程とかでてきて数式だらけの本をみてもなかなか進まないですが、この本はほんとによかったです。社会人1年目に読んで、周りに勧めていた気がする。


以下3つの本は高名ですが、理解しようとしていますが、まだまだできていないのでコメントできず。

  • 経済・ファイナンスデータの計量時系列分析

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

  • 時系列解析入門

時系列解析入門

時系列解析入門

理論系(リアルオプション)

なぜいきなりリアルオプション、という感じですが、なんかリアルオプションの考え方って自分にフィットして好きなので結構勉強しました。まあ、コンサルする上で経営の長期の意思決定には当然関与しますし、経営は当然市場環境変化に応じた戦略変更というリアルオプションを保持しているので、実務的にも重要度は結構高い。クライアントへの説明は難しいけど。
リアルオプションについては書籍じゃなくて論文のほうが参考になったものが多かったかな。製薬企業の開発パイプライン事業価値評価(アライアンス含めて)、石油掘削事業の評価、バイオベンチャーの評価の大きく3つのケースがあるあるだけど、実際には結構長く使う設備投資はほかの業界でもいくらでもある。だけど単純なNPV計算するのがグローバルルールだったりするからどうしようもなかったりするし、リアルオプションはどうしても設定に恣意性が存在するのは否めない。でも絶対に必要な考え方。

  • よくわかるブラック・ショールズモデル / 蓑谷 千凰彦 ☆☆

よくわかるブラック・ショールズモデル

よくわかるブラック・ショールズモデル

オプションといえばまあまずはブラックショールズかなと思って購入したけど、全然よくわからなかった。物理から勉強したほうがいいのかも。

  • リアルオプション-投資プロジェクト評価の工学的アプローチ/今井潤一 ☆☆☆☆☆

リアルオプション本で一番わかりやすかったのはこれ。全体的なバランスは理論は少なめで、具体的に事業価値をどう計算するか、というのに頁がさかれている。ケーススタディはあまりない。
冒頭のイントロダクションの記載が非常にわかりやすかった。例えば、資本コストの下記の説明などはすっと入ってきた。

キャッシュフローの現在価値を求めるときに利用する割引率としては、この投資案件と同等のリスクをもつ代替的な投資案件が提供する収益率を用いるのが原則である。
(中略)
つまり、適切な割引率とは、検討している投資プロジェクトに投資することによってあきらめた収益率を用いなければならない。このような割引率は、ファイナンスの世界では資本コストと呼ばれる。

そして拡張DCF法とリアルオプション法について。

計算方法からすると、柔軟性を考慮したDCF法は、オプション評価理論によるプロジェクト評価と全く同じ計算方法である。2つの評価法の第1の違いは、オプション評価理論ではリスク中立世界での確率測度を用いて期待値の計算を行うのに対し、DCF法ではもともとの確率測度を用いて計算することである。第2の違いは、オプション評価理論では、安全利子率を用いて割引計算を行うのに対し、DCF法ではリスク調整済み割引率を用いて割引く。

この辺はぱっと読んだだけだとわからないんだけど、2項格子モデルでエクセルで計算してみるとわかってくる。
そして一番興味をもったのは第7章のリアルオプションと財務戦略のところ。ちょうど読んでいた頃、円高が進んでいて、HONDAとか国内製造業の大手が為替にどう対応しようとしているのか、生産拠点を最終消費地に移管するとか、新聞でも記事が多く出ていた頃。この章では「実物投資戦略と財務戦略の融合」をテーマに書かれている。

リアルオプションの原資産と安全資産を利用して動的なヘッジ戦略を実際に行えば、リアルオプションアプローチによって算出された評価価値を確実に得ることができる。
(中略)
企業が実物投資戦略に関して最適な行使戦略をとり、同時に資産市場において完全ヘッジ戦略をとる場合には、その後の原資産価格の変動に関わらず、評価価値の収益を固定することができる。企業にとって、制御できない現資産価格の変動に影響されず、収益を固定できることの意義は非常に大きいと考えられる

この辺のことが計算例を通して説明されている。大手製造業のCFOはどこまで考えていて、どこまでやり方が定型化されているんだろう。
ただ、やっぱり考え方としては最初のボラティリテリィーの設定がどうしても恣意的になってしまう。そしてそのパラメータを少し変えただけでオプション価値は大きく異なり、将来オプションを行使するかしないか、そして行使のタイミングががらっと変わってきてしまう。でもリアルオプションのいいところは、価値を計算するだけでなく、将来の適切な経営判断とそのタイミングも算出してくれて、かつそれが更新できるところ。市場環境が変化すれば見直せばよいし、ボラティリティーについても見直せばよい。この点で、ベイズの考え方と近いところがあるのかもしれない。

  • リアルオプション 経営戦略の新しいアプローチ / マーサ アムラム ☆☆☆

リアル・オプション―経営戦略の新しいアプローチ

リアル・オプション―経営戦略の新しいアプローチ

リアルオプションといえばこの人、という感じの有名な方。第3部のケーススタディが豊富でよかった。ベンチャー企業の評価、油田開発、医薬品開発、事業インフラへの投資、地価の評価、ライセンス供与の評価など。
ただ、結局ベンチャー企業の価値評価も、リアルオプション使ったとしてもできなくて、キックスターターとかクラウドファンディングとかでむしろファイナンスのスキームを変えてしまった、という今の流れは健全なんだろうなあ。

  • リアルオプションの思考と技術 / 川口有一郎

リアルオプションの思考と技術

リアルオプションの思考と技術

これは上記2冊とは少し毛色が違って、経営の柔軟性まで評価するリアルオプション法をどう適用するか、というのではなく、リアルオプションという"思考法"がどのようなものなのかを過去分析を通して伝えようとしている。そのため、数式はほとんどでてこない読み物になっている。リアルオプションの"活用"という点では、厳密な計算とかではなく、これに書かれているリアルオプションの"思考法"に価値があるのはその通りだと思う。ひさびさにきちんと読み直したいと思った。

理論系(基礎)

  • 多変量解析のはなし / 大村平 ☆☆☆☆

多変量解析のはなし―複雑さから本質を探る (Best selected Business Books)

多変量解析のはなし―複雑さから本質を探る (Best selected Business Books)

偏相関係数とかは実務でもよく使う、というか、実務で多変量解析って、偏相関とってAICでモデル選択、くらいしかほとんどやったことないですが、それをする上で必要なことはこれで学べます。

  • 実験計画と分散分析のはなし ☆☆☆

きちんと考えないといけないな、と思いつつも実験計画を実務できちんと適用して考えたことはない。考え方はこれで学んだ。分散分析はよく使う。「分析は比較」です。

  • 原因を探る統計学 共分散構造分析入門 / 豊田秀樹 ☆☆☆

原因をさぐる統計学―共分散構造分析入門 (ブルーバックス)

原因をさぐる統計学―共分散構造分析入門 (ブルーバックス)

共分散構造分析は実務で使ったことはない。ベイジアンネットワークに手をつけるよりこれが先でしょう、ということで読んだ。これもよかったです。

統計学 (サイエンス・パレット)

統計学 (サイエンス・パレット)

サイエンス・パレットシリーズの統計学。基礎的なことがコンパクトにまとまっていてよい。

理論系(ベイジアンネットワークなど)

稼働機情報(マシンデータ)分析する上で、この辺の因果推論が必要になりそうだったので購入したものの、この辺全然読めていない。積読状態。
富士ゼロックス産総研本村さんの「ベイジアンネットワークによる複合機故障診断技術」という論文が結構個人的にはヒットで、勉強したいんだけど・・・。

グラフィカルモデリング (統計ライブラリー)

グラフィカルモデリング (統計ライブラリー)

データマイニングによる異常検知

データマイニングによる異常検知

その他

  • イシューからはじめよ / 安宅和人 ☆☆☆☆

イシューからはじめよ―知的生産の「シンプルな本質」

イシューからはじめよ―知的生産の「シンプルな本質」

マッキンゼーでYahooのCSOの方が書いた本。データ分析の本ではないけど、「分析とは比較である」と言い切っているところに感銘を受けた。僕もそうだと思う。そしてそれは昨対(サクタイ:昨年対比)とか計画対比とか、前年同週とか、実際にほとんどの企業で取り入れられている考え方で、それが諸悪の根源だったりもするけど、やっぱり分析は比較。じゃあ妥当な計画ってどうたてるの、とか、昨年と当年で市場環境変わってるでしょ、とかは別の問題で、そこに対する一つの答えがオープンデータなんだろうと僕は思っている。

  • シグナル&ノイズ ☆☆☆☆

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」

有名人ネイトシルバーの本。これを読んだら分析ができるようになるわけではないけど、読み応えがあって、面白い。字が小さくてぎっしりな上に頁数多いので、文量めちゃ多いです。

  • 統計学が最強の学問である / 西内啓 ☆☆☆

統計学が最強の学問である

統計学が最強の学問である

あの有名なやつ。いろいろ賛否はあるみたいですが、学者さんなので、わたしの知らない生物統計、医療統計の領域でどんな議論がされてきたのかというのは勉強になった。読み物としては面白い。

  • サービス工学の技術 ビッグデータの活用と実践 / 本村陽一 ☆☆☆

サービス工学の技術 ―ビッグデータの活用と実践

サービス工学の技術 ―ビッグデータの活用と実践

産総研本村さんの本。数理システムのBayonetのもととなる仕組みを作った方で、企業とも連携して様々なプロジェクトを実施している。本書では、そのプロジェクトの話もでてくるので実践的であり、「サービス工学」という切り口がどちらかというと私の実務には近いのかもしれない。いつか一緒に仕事したい。

  • Scilab/Scicosで学ぶシミュレーションの基礎 ☆☆☆☆☆

Scilab/Scicosで学ぶシミュレーションの基礎―自然・社会現象から、経済・金融、システム制御まで

Scilab/Scicosで学ぶシミュレーションの基礎―自然・社会現象から、経済・金融、システム制御まで

これは超面白かった。Scilab/Scicosともにこの本を読んだとき以外に触ったことはないのですが、考え方がとにかく新鮮で、ARモデルとかMAモデルとかが理解できたような気がしていた。社会人2年目に読んだのですが、なくしてしまったようです・・・。忘れてしまったのでもう一度買おうかな。何が面白かったのかというと、対象としているのが表紙に書いてある通り、「自然・社会現象から、経済・金融、システム制御まで」ということで幅広い。かつそれが関連されている。私はサプライチェーンを専門としていたのですが、金融工学と制御工学を掛け合わせたものをサプライチェーンのオペレーションに組み込む必要性は、この本から得られた。

  • Database Marketing: Analyzing and Managing Customers

ひとつだけ洋書。データベースマーケティングの考え方が体系的に整理されている。日本の書籍にはない情報量。この分野の各単語とか言い回しを英語でどう表現するのかがわかるのもよい。自分が買ったときは紙版だったけど、今はkindle版しかないのかな。例えばChurn Managementの考え方とか、ちょうどINSEADの短期コースに行くタイミングで読んでいたので役に立った。といっても、くそ文量多い上に英語なので全然読み切れていない。継続して読み進めたい一冊。

  • 中学校数学科 発想力と分析力を磨く おもしろ難問45 / 大句哲也 ☆☆☆☆

中学校数学科 発想力と分析力を磨くおもしろ難問45

中学校数学科 発想力と分析力を磨くおもしろ難問45

この中では異色な本だけど、最近友人が出した本なので宣伝かねて。学校の先生が読む感じの本っぽいけど、数学の面白さをわかりやすく伝えている本。数学好きなんだな〜ってのがすごく伝わってきた。もともと教えるのうまいし、文章書くのもうまいのでとてもわかりやすい。自分がきちんと読み解いて、子供が算数とか数学に興味もてるような伝え方ができるようになりたいな。ていうか教え方の家庭教師してほしい。

Fabrication関連

この領域は、データ分析からは少し離れるけど、IoT(Internet of Things)という言葉がでてきたように、データ分析はソフトウェアだけでなく、ハードウェアの領域にも広がってる。もちろん、ハードウェアはソフトウェアの領域よりもデータ分析が構成要素のほんの一部ではあるけど、今ハードウェアの領域で起きていることが私にとって大きな関心事。

MAKERS―21世紀の産業革命が始まる

MAKERS―21世紀の産業革命が始まる

データ分析というのは、WEBの世界では、アジャイルとかA/BテストといったWEBサービスの開発スキームのなかで、「まずやってみる」&「よかったのかどうかはデータに判断させる」という考え方を支えるもの。だからWEBサービスの領域でデータ分析に注目が集まっている。だけど、これまでソフトウェアの領域で起きてきたことが、近年ハードウェアの領域にも起きている、というのが本書に書かれている。ハードウェアにおいてもキックスターターのような、インターネットを活用したファイナンス(資金調達)のやり方も大きく変わってきている。この数年読んだ本のなかで、最も大きな衝撃を受けた。

  • Fablife デジタルファブリケーションから生まれる作りかたの未来 / 田中浩也 ☆☆☆

FabLife ―デジタルファブリケーションから生まれる「つくりかたの未来」 (Make: Japan Books)

FabLife ―デジタルファブリケーションから生まれる「つくりかたの未来」 (Make: Japan Books)

日本でこんな動きがあるのね、というのが知れた。Fablabという、Fabricationに必要なツール3Dプリンタとかレーザー加工機など)がおいてあって、コミュニティが形成されている場所が日本各地にある。自分の近くだと、渋谷、関内、鎌倉にある。行きたい行きたいと思いつつ、まだ行けていない。

  • Digital Disruption ☆☆☆

DIGITAL DISRUPTION

DIGITAL DISRUPTION

MAKERS的な、ものづくりの話なのかな、と思っていたけどそうではなかった。

本書でマキヴェイが説くことは、個人や小さな企業がもつMAKERS時代への移行の途上で、既存企業がいかに自己革新をはかっていくべきか、の方策と考えることもできます。もちろん、自己防衛策ではなく、攻めの戦略として。

と最後に翻訳者が書いていることが本書の位置づけを端的に表している。いろいろな既存大企業での革新事例が記載されているなかで、

結局のところ、チーム・リーダーもチーム・メンバーも改革など望んでいなかったのだ。彼らが私の所にきたのは、何か無難な製品を提案する方法を知るためだった。

というのがコンサルという立場として非常に共感することであり、これが難しいところ。国内の大手企業は部長クラスで40代後半とかなので、若手ほど危機感を感じていない。自分がコンサルとして入れるところは、「やってみなはれ」感覚を持っている経営層がいるところ。短期間で実際に動くもの作れば認めてもらえる。スタートさえできないかちこちの企業は手に負えない。
そしてディズニーがオンラインゲームでヒット作を出すまでの過程の話で、

本当の価値は、(中略)、ディズニーキャラクターを使わないゲームを開発して実験するという方法を学んだ点にあるからだ。映画「リトルマーメイド」や「カーズ」、「トイストーリー」などの人気キャラクターが登場しなゲームなら、失敗を恐れず、より自由な発想で作ることができる

という部分が、第三者的なコンサルといえど、自分である領域の事業をやっていこうとしたなかで共感した。今の大企業は偉大なんです。ビジネスモデルが偉大。やればやるほど痛感させられる。でも自由にやらせて欲しい、少人数でいいからチーム作らせて欲しい。そしてたまに興味を持ってほしい。
そして蚊帳の外に置かれないためにという部分。

「女性が生理周期を記録したり、スキンケア対策をしたり、妊娠経過を記録したりできる健康管理のアプリが何百種類もあったのです。顧客が持っているスマーホフォンかPCを使ったトータルなデジタル商品体験は、もう始まっていることがわかりました。トータルな商品体験を使って宣伝している商品やサービスがある中で、我が社は蚊帳の外に置かれていたのです。」

個人として、全く同じことを感じている。すごい人がいっぱいいる。Raspberry Piとか最近触るようになって、その「隣接領域」をみていくと、分析だけじゃなくて、マシンデータを取得するfluentdとか、AWSみたいなクラウドサービス、それくらいは想定していたし、ある程度わかっていたけど、3D CADとか3Dプリンターについては完全に初心者。キックスターター資金すごく集めた東大のヘリコプターとか、もうすごいんです。自分は10年くらい遅れている。なんでも少人数で作れるような環境が整ってきた分、かなり幅広い領域に精通している必要がある。やってみたいこと、理解したいことがありすぎて、途方に暮れる。
音楽が好きでやっていたころ、音楽はコンサートにいけば、才能あふれまくっているプロの演奏を簡単に聞けてしまって、やればやるほど自分の才能のなさが嫌になっていた。インターネットのせいで、音楽以外の分野でもすごい人がどんだけいるのか、簡単に目に入ってくるようになった。
それから最後。

デジタル時代の創造的破壊者とは一歩進んでデジタル消費者であり、デジタルツールを消費の手段としてだけでなく、むしろ生産手段として使う。

これは親として、自分の子供に伝えていきたいこと。自分の子供は、もう生まれたときからスマホがあることが当たり前になっているけど、例えばゲームでも、する側ではなく、どうせなら作る側に興味を持ってほしい。そういう意味で、最近のRaspberry Piでの工作は子供にとってもきっといい。


この連休中にRaspberry Pi関係の技術的な書籍は何冊か購入しましたがそれは割愛。

教養

ここからは全然分野かわります。高校のとき、自分は理系だとか思っていて世界史とか全く興味がなく、結果として高校なのに世界史の単位がとれなかったりしていたくらい自分は無知だった。でも社会にでてから、社会に興味をようやくもつようになって、歴史も知りたくなって、そんな初学者である僕の感想。主に近現代史。

世界と日本の関係をつなげるのに役立った本

  • 経済は世界史から学べ! / 茂木誠 ☆☆☆☆

経済は世界史から学べ!

経済は世界史から学べ!

私みたいな無学な状態では、こういう本はとてもいい。地理的に分断された、ある出来事とある出来事の関係が頭のなかでつながってくる。地理軸と時間軸と2つあるからどう書こうとしても完璧な教科書なんてできないんでしょうけど、なんとなく地理軸×時間軸のなかでの大きな出来事は押さえつつ、それらの関係性については複数の書籍からいろんな切り口で書かれているものを読んで、自分の考えをもつしかないのでしょう。

  • 仕事に効く教養としての「世界史」/ 出口治明 ☆

題名的に自分が望んでいるものに合致してそうだったので読んでみたけど、Amazonレビューにもある通り、「・・・と思う」という表現があまりに多く、かつそのエビデンスが明確に示されていない。もう少し基本的なことが頭にはいって、自分の考えももった状態であれば示唆があるのかもしれないけど、初学者である状態で読むと、書いてあることを鵜呑みにしていいのか不安になってしまい、よくなかった。

  • それでも、日本人は「戦争」を選んだ ☆☆☆

それでも、日本人は「戦争」を選んだ

それでも、日本人は「戦争」を選んだ

これは、東大の加藤教授が、私の母校である高校で実施した授業が本書のもとになっている、という点で個人的な思いが多々ありますが、よかった。アカデミックな場所にいる方なので、エビデンスが豊富。ある時代に誰がなんと言っていたのか、その先こんな経験をして、なんと言うようになったのか、丁寧にわかりやすく書かれている。日清戦争から第二次世界大戦までに、日本と海外のトップの人たちがどんなことを考えていたのかがわかる。

  • 白洲次郎 占領を背負った男 / 北康利 ☆☆☆☆

白洲次郎 占領を背負った男

白洲次郎 占領を背負った男

小説いれないでって感じかもしれないけど、格好よかったんです、白洲次郎。この本を読んだあとで、日比谷公園近くの第一生命館とかみて感慨にふけったりしちゃいました。政治家の家系だとかもこの本で知ったこと数多い。小説なので鵜呑みにしちゃいけないこともあるのかもしれないけど、小説として面白いですし、戦後の流れを知るのにもよかった。

  • 超マクロ展望 世界経済の真実 / 水野和夫 ☆☆☆☆☆

超マクロ展望 世界経済の真実 (集英社新書)

超マクロ展望 世界経済の真実 (集英社新書)

面白かった!元エコノミスト埼玉大学客員教授の水野さんと、津田塾大学准教授(哲学博士)の萱野さんの2人の学者の対談という形でまとめられている。ヘゲモニー(=覇権)と交易条件の変遷から、これまでに起きてきた出来事が一環して説明されており、僕は納得した。
自分の子供が大人になるころにはどうなってるんだろう。子供が自分で生きていくには、どんなことを伝えていけばいいんだろう、と考えさせられた。


もう限界だ〜。
だいぶ本によってコメント量のばらつきが出てしまったけど、何より、整理してみると自分が読み切っていない本が多く、かつ買った時点より今のほうが役立ちそうな本がありそうなのがわかってよかった。