めもめも
ビッグデータを「Googleスピード」で扱うためのテクノロジー
DWHやMapReduceだけでは足りない
- Data Warehouseソリューション
- 超高い
- アドホックな分析に対応しにくい
- MapReduceソリューション
- Hadoop
- 高くない
- スケールする
- 課題
- レスポンスが遅い
- 数分から数時間
- Hadoop
Google BigQuery = Dremelの公開版
- 2012年5月公開
- 低コスト
- Dremelのサブセット
- ProtocolBuf未対応
- しかし性能は同じ
- デモを一般公開中
- cloud.google.com
BigQueryの使い方
- インポート
- REST API
- Web UI
- コマンドライン
Google BigQueryデモ
BigQueryを使ったサービス
Google BigQueryはなぜ早い?
- カラム指向データベース
- 並列処理
- 1テラのデータを一秒で解析するには一万台のマシンが必要
MapReduceとGoogle BigQueryの適材適所
- 得手不得手がある
- MapReduceはバッチ処理向き
- BigQueryは、大量データを出力するのには向かない
- BigQueryは更新できない