世界のビールと音楽の組み合わせをデータ分析で最適化!
ビール好きでデータ分析を始めてみたい私には最高のイベントがあったので前日に主催者のuzuramの宮本さんとFacebookでやり取りして参加してきました。
このイベント、音楽を聞きながらビールを飲んで、どの音楽と、どのビールが合うかを参加者が主観で決めていき最後に解析をかけて
「この音楽には、このビールが合うという人が多いです」
と言ったようなレコメンドができるようになろうというイベントでした。
最高か。ビールたくさん飲めて、データ分析の入門まで教えてもらえるとか最高か。
すこし残念だったのが他のイベントと被っていたのか直前キャンセルが多数あり参加者が講師含めて6名となってしまったこと。ただ、おかげでビール堪能できました。おつまみ買っていけばよかった。
講師の方は DATUM STUDIO株式会社 の中原さん。花粉症が辛いらしくティッシュが手放せない様子でした笑
ビール
今回のメイン。。。じゃなくて、解析対象となるビール。たくさんありました。
世界のビールと銘打ったイベントだけあって世界一周をしてました。(南極大陸はなかったので5大陸制覇ならず)
以下今回のビール説明と私の感想です。ビールの説明はイベントページからの転載です。
ネグラモデロ
産地:メキシコ 特徴:ダークモルト、ホップのバランスのとれた風味と繊細な香りを持つミュンヘンスタイルビール(ダークラガー)。メキシコで第1位、アメリカの輸入ビール市場で第2位のダークビールブランドで、クリーミーな泡と明るい黒褐色の液体が特徴。特別な食事や特別な瞬間を演出するのに最適なビール。
自分としてはこんな印象でした。
- すこし甘めな印象(バーバーバーよりは甘くない)
- 少し香ばしい香りがする
バーバーバー
産地:ベトナム 特徴:キレが良く、スッキリ爽やかな味わいは日本人の味覚にあったビールです。昨今のベトナムブームによるベトナムレストランの急増で、国内でも躍進しています。サイゴン社はベトナム最大手のビールメーカーで、製法技術はフランスからの影響を受けています。
自分としてはこんな印象でした。
- ビール?って思うくらい甘い(比較的温度が高めだったからか?)
- ホップ感は全く無い
フラーズ ゴールデンプライド
産地:イギリス 特徴:フラーズが誇るプレミアムストロングエール。深い琥珀色で優しい苦味と穏やかなホップの風味に芳醇な麦芽の味わいを持ち、甘いオレンジオイル、トーストしたパンを思い起こさせ、甘味と苦味がこの濃厚なビールにバランス与えます。
自分としてはこんな印象でした。
- かなり濃い
- 黒ビールっぽい
- 一気に飲むと日本酒に近いアルコール感
- 後味に残るアルコールの感じが日本酒に近いものがある
ベジエールレタス 瓶
産地:日本 静岡県: 特徴:産直団体(株)野菜くらぶのトレーサビリティーのしっかりしたレタスをふんだんに使い世界でも珍しい飲み物を仕上げました。食事に合い、フルーティーで爽やかな仕上がりが楽しめます♪
本物に徹底してこだわりました!だから、原材料も麦芽・ホップ・レタスのみ。 しっかりと酵母が効いた深い味わいでありながら、フィニッシュにレタスの爽やかさが駆け抜けます。 食前酒でも食中酒としても、楽しく豊かな時間を提供します。 野菜くらぶのレタスは、適地適作、産地リレー、契約栽培契約販売を基本に、群馬・静岡・青森・岡山の産地と技術を共有し、全国をリレーすることで一年通して安定的に出荷しています。 “VEGEALE LETTUCE”でも、“野菜くらぶブランド”のフレッシュなレタスを使用しています。
自分としてはこんな印象でした。
- 泡、香りがすごいレタス感がある
- 青臭いような嫌な感じではなく、さわやかな感じ
- 他のビールと比べると軽い感じ
- クラフトビールだけども大手のビールと同じような飲みやすさ(製法の問題?)
- すごい日本人が好きな味
パウラーナー ヘーフェ ヴァイスビア
産地:ドイツ 特徴:50%以上の小麦を使用し、瓶詰め後も瓶の中で二次発酵します。白く濁ったやや濃い黄白色にクリーミーな泡立ち。バナナ、クローブ、パンの香りがあります。レモンのような柑橘系のさわやかな酸味とやさしい酵母の甘味とのバランスが素晴らしいビールです。
自分としてはこんな印象でした。
- 軽めの味
- 甘くもない
- 香りも強くなく程よい
- 泡がすごいフルーティーな味わいでバナナっぽい感じ
バドバー ビール 瓶
産地:チェコ 特徴:チェコの最高級ホップ、モルト、地下300mの良質の水により造られたバドバービールは、700年の伝統を誇ります。麦やホップが主張しつつも調和の取れた味わいで、後にバドワイザーのモデルともなった純粋ビールです。
自分としてはこんな印象でした。
- 軽い。さすがバドワイザーのモデルとなったビール
- すごい飲みやすいからはじめの一本に最適
音楽
音楽もまた古今東西いろいろでした。個人的にはEDMの曲がヒット。以前別のイベントで聞いたことあったけども曲名がわからなかったのが、このイベントで曲名がわかった!しかもAmazon Prime Musicにもあり大助かり。
会場では何故四季の夏なんだ?と疑問が出てました。なんでも参加予定だった方からのリクエストだったそうなのですが、何故夏なんだろう。。。もうすぐ春なのに笑
- JPOP: 世界に一つだけの花
- 洋楽: Oasis What ever
- EDM: Timmy Trumpet - Freaks
- クラシック: ビバルディ 四季夏
- JAZZ: Take Five
- 演歌: 津軽海峡冬景色
飲みながら音楽を聞いて、参加者からは積極的なデータ分析についての質問が飛んだりとワイワイできました。少人数の勉強会は参加するまでの敷居が高いですが参加さえしてしまえば講師の方とも距離感近いので良いですね。
そんなこんなで一応イベントの趣旨であるデータ分析を行うために音楽とあうビールをスプレッドシートへ入力していきました。一通りできたらCSVでダウンロードして入門編が始まりました。
Rとは?
Wikipediaによると
オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境である。
統計解析向けに作られているプログラミング言語だそうです。イベントの講師の方に質問してみたところ、よく解析に使われるPythonとか、Matlabと比較して見ても統計解析向けに作られているライブラリが多くあり簡単に使うことができるそうです。ただ、汎用的なプログラミング言語としては少し使いにくいところもあるそうです。
アソシエーション分析
集合論、包含関係
アマゾンのおすすめみたいな機能を実現するための分析
Supportでソートして、Confidenceで考察
頭に入れておいたほうがいい概念
支持度(suport)
- 商品Xと商品Yが一緒に買われている頻度がどのくらいの規模で発生しているかを確認する指標
- 調べたいケース/全ケース
- まず一番最初に見るべき指標
- 発生頻度でソートして頻度が少ないケースは無視したほうがよい
確信度(Confidence)
- 一緒に買われやすいかを表現
- XとYに方向性
- Xを買った人がYをよく買っていればおすすめできる
- 包含関係でおすすめは変わってくる
- ベン図
リフト(Lift)
- Lift = (Xを買う人がYを買う確率) / 全体の中でYが買われる確率
- 何もしなくても商品Yをどれくらいの人が買っているかという確率に対して、商品Xを買った人でYも買う人がどれくらいいるかを確率(Confidence)を比較する指標
実装
実装はRStudio上で行いました。最終的なコードはGistにあげておきました。
中原さんがすごい丁寧に説明していただけるのですごいスムーズに実装でき、ビールも飲みながらでも実装が終わらせれました。
ただ、唯一の問題が前半戦でしこたまビールを飲んでいるので途中でかなりトイレに行きたくなってしまいました。お酒の入る勉強会はトイレ休憩を頻繁に入れたほうが良さそうです。
RStudioがすごい便利でMatlabと似たような統合環境だなといった印象。
コンソールでデータを表示
すごくエクセルです。
棒グラフで出現頻度を表した。
データの相関関係を図で表した
などなどがめっちゃ簡単に実装できました。アソシエーション分析のパッケージもPythonにあったので、そちらも試してみないと一概に言えないですがここまで簡単に表現が色々できるのであればもっと凝った分析や分析結果からモデルのストーリー建てなどのもっと重要な事に時間がかけれるようになりそうです。データ分析すげぇ!!楽しい!!
今回の考察としてはレタスビールとオアシスの曲がすごく相性が良さそうだというのが参加者としての共通認識だったようです。(人数少なかったしはじめに飲んだビール、はじめにかかっていた曲という事もありそうですが)
まとめ
個人的に感じたこととしてはデータ分析を見える化するまではツールで簡単にできましたが、そこからストーリーを組み立てていくということ、見える化された情報から何が起きているのかを意味付けするということが大変なのだと感じました。実際相関図をみてレタスとオアシスは相性良さそうというのは素人目でもぱっとわかりましたがそれ以上のことは正直わかりにくかったです。でも講師の中原さんはポンポンとストーリーを出していたのでやはり見えている世界がまた違ったようです。
こういう所がノウハウであったり強みになっていくのだと感じました。
ただ、分析しなくても分かった事があって、世界中のビールは美味しいということでした。
いや、もう少しデータの母数を増やしたいので、ぜひ次回の開催をお願いしたいです。
#以下アフィリエイト用の広告です