課題への回答。詳細編 - 新米インフラエンジニアを研修日記

この仕組をミドルウェアレベルで何を選定するのか、その選定の理由は？という課題に対しての回答がこちら。

apacheじゃなくてnginxを選んだのは、リクエストの処理の速さ。

ElasticSearchを選んだのはSolrよりも扱い易い。 kibana使いたいから

Sparkを使う意味は？ =>リアルタイム処理はHadoopじゃ弱いから。リアルタイム処理が必要なものはなに？ =>大量のアクセスがあった時に稼働し続けるから。 fluentd から直接リアルタイムの分析をできたらいいな。 =>リアルタイムの分析はどんなサービスのために必要？

ElasticSearchを通さずにfluentdから直接sparkはダメなのか？ =>直接でもよいです。用途によって両方に投げてもいい。

一番悩んだところは? WebからDBのところ。 flume + HBaseにするかなやんだ

所管　ElasticseasrchはNoSQLで、スケールし易いから選定したと言ったけれど　データベースの選定方法が弱いなと思った。　CAP定理について話したので、その辺りを今日のブログでまとめてもらえるんだろうなと期待。