Enviar pesquisa
Carregar
NoSQLとビッグデータ入門編
•
3 gostaram
•
1,925 visualizações
Koichiro Nishijima
Seguir
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 20
Baixar agora
Baixar para ler offline
Recomendados
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
Kentaro Yoshida
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
NoSQLデータベースと位置情報
NoSQLデータベースと位置情報
Koji Ichiwaki
Osc2012.dbに行ってきました
Osc2012.dbに行ってきました
Masaru Kobashigawa
MongoDBの監視
MongoDBの監視
Tetsutaro Watanabe
遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティング
Tazro Ohta
mongoDB: OSC Tokyo2010 spring
mongoDB: OSC Tokyo2010 spring
ichikaway
ゼロから始めるBlob
ゼロから始めるBlob
Kazunori Hamamoto
Recomendados
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
Kentaro Yoshida
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
NoSQLデータベースと位置情報
NoSQLデータベースと位置情報
Koji Ichiwaki
Osc2012.dbに行ってきました
Osc2012.dbに行ってきました
Masaru Kobashigawa
MongoDBの監視
MongoDBの監視
Tetsutaro Watanabe
遺伝研 Rina Aizawa ユーザミーティング
遺伝研 Rina Aizawa ユーザミーティング
Tazro Ohta
mongoDB: OSC Tokyo2010 spring
mongoDB: OSC Tokyo2010 spring
ichikaway
ゼロから始めるBlob
ゼロから始めるBlob
Kazunori Hamamoto
いまいまMySQL@OSC2016島根
いまいまMySQL@OSC2016島根
sakaik
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバ
Shinsuke Sugaya
いまいまMySQL@OSC2016長岡
いまいまMySQL@OSC2016長岡
sakaik
今から始めるDocument db
今から始めるDocument db
Kazunori Hamamoto
コロナ禍の所蔵品検索システム
コロナ禍の所蔵品検索システム
Naosuke Okamoto
Sql world を支える技術
Sql world を支える技術
Oda Shinsuke
20121026 AWSで行こうupdate版
20121026 AWSで行こうupdate版
Koichiro Nishijima
20121117JAWS-UG沖縄パネル用資料
20121117JAWS-UG沖縄パネル用資料
Koichiro Nishijima
AWSで行こう
AWSで行こう
Koichiro Nishijima
なんちゃってCDP考えてみた
なんちゃってCDP考えてみた
Koichiro Nishijima
20120824 PHP+MySQL勉強会LT
20120824 PHP+MySQL勉強会LT
Koichiro Nishijima
スマートWordPress on JAWS-UG Tokyo#17
スマートWordPress on JAWS-UG Tokyo#17
Hiro Fukami
CloudWatch(+sns+sqs)で障害対応を自動化してみた
CloudWatch(+sns+sqs)で障害対応を自動化してみた
Terui Masashi
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
Kenichi Inoue
AWSバッドノウハウカンファレンス(仮)の必要性について
AWSバッドノウハウカンファレンス(仮)の必要性について
Yasuhiro Araki, Ph.D
10分でわかる無料になったXamarin
10分でわかる無料になったXamarin
Yoshito Tabuchi
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
Koichiro Nishijima
Osc spring 20220311
Osc spring 20220311
Yasuaki Sera
Non blocking and asynchronous
Non blocking and asynchronous
Norio Kobota
B 2-1 はじめての Windows Azure
B 2-1 はじめての Windows Azure
GoAzure
OSC関西@京都2014 CloudStackの歩き方
OSC関西@京都2014 CloudStackの歩き方
Midori Oge
SQL Server のロック概要
SQL Server のロック概要
Oda Shinsuke
Mais conteúdo relacionado
Mais procurados
いまいまMySQL@OSC2016島根
いまいまMySQL@OSC2016島根
sakaik
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバ
Shinsuke Sugaya
いまいまMySQL@OSC2016長岡
いまいまMySQL@OSC2016長岡
sakaik
今から始めるDocument db
今から始めるDocument db
Kazunori Hamamoto
コロナ禍の所蔵品検索システム
コロナ禍の所蔵品検索システム
Naosuke Okamoto
Sql world を支える技術
Sql world を支える技術
Oda Shinsuke
Mais procurados
(6)
いまいまMySQL@OSC2016島根
いまいまMySQL@OSC2016島根
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバ
いまいまMySQL@OSC2016長岡
いまいまMySQL@OSC2016長岡
今から始めるDocument db
今から始めるDocument db
コロナ禍の所蔵品検索システム
コロナ禍の所蔵品検索システム
Sql world を支える技術
Sql world を支える技術
Destaque
20121026 AWSで行こうupdate版
20121026 AWSで行こうupdate版
Koichiro Nishijima
20121117JAWS-UG沖縄パネル用資料
20121117JAWS-UG沖縄パネル用資料
Koichiro Nishijima
AWSで行こう
AWSで行こう
Koichiro Nishijima
なんちゃってCDP考えてみた
なんちゃってCDP考えてみた
Koichiro Nishijima
20120824 PHP+MySQL勉強会LT
20120824 PHP+MySQL勉強会LT
Koichiro Nishijima
スマートWordPress on JAWS-UG Tokyo#17
スマートWordPress on JAWS-UG Tokyo#17
Hiro Fukami
CloudWatch(+sns+sqs)で障害対応を自動化してみた
CloudWatch(+sns+sqs)で障害対応を自動化してみた
Terui Masashi
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
Kenichi Inoue
AWSバッドノウハウカンファレンス(仮)の必要性について
AWSバッドノウハウカンファレンス(仮)の必要性について
Yasuhiro Araki, Ph.D
10分でわかる無料になったXamarin
10分でわかる無料になったXamarin
Yoshito Tabuchi
Destaque
(10)
20121026 AWSで行こうupdate版
20121026 AWSで行こうupdate版
20121117JAWS-UG沖縄パネル用資料
20121117JAWS-UG沖縄パネル用資料
AWSで行こう
AWSで行こう
なんちゃってCDP考えてみた
なんちゃってCDP考えてみた
20120824 PHP+MySQL勉強会LT
20120824 PHP+MySQL勉強会LT
スマートWordPress on JAWS-UG Tokyo#17
スマートWordPress on JAWS-UG Tokyo#17
CloudWatch(+sns+sqs)で障害対応を自動化してみた
CloudWatch(+sns+sqs)で障害対応を自動化してみた
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
Cordovaで業務アプリを作る 〜その事例とノウハウ〜
AWSバッドノウハウカンファレンス(仮)の必要性について
AWSバッドノウハウカンファレンス(仮)の必要性について
10分でわかる無料になったXamarin
10分でわかる無料になったXamarin
Semelhante a NoSQLとビッグデータ入門編
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
Koichiro Nishijima
Osc spring 20220311
Osc spring 20220311
Yasuaki Sera
Non blocking and asynchronous
Non blocking and asynchronous
Norio Kobota
B 2-1 はじめての Windows Azure
B 2-1 はじめての Windows Azure
GoAzure
OSC関西@京都2014 CloudStackの歩き方
OSC関西@京都2014 CloudStackの歩き方
Midori Oge
SQL Server のロック概要
SQL Server のロック概要
Oda Shinsuke
Sql azure知ってますか?改訂版
Sql azure知ってますか?改訂版
Oda Shinsuke
見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方
見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方
Masayasu Kurashina
今こそCSS 今こそfor you
今こそCSS 今こそfor you
Tatsuya Kosuge
Sql serverデータアクセスの基本動作。荒ぶった方法で確認してみよう
Sql serverデータアクセスの基本動作。荒ぶった方法で確認してみよう
Masayuki Ozawa
20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料
Takahiro Iwase
Global Azure Bootcamp 2019@Tokyo資料【ExpressRoute構築でハメられた】
Global Azure Bootcamp 2019@Tokyo資料【ExpressRoute構築でハメられた】
Dai Iwai
クラウド移住で地方に住むということ
クラウド移住で地方に住むということ
Takehito Tanabe
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
Keiko Inagaki
LocalStack
LocalStack
chibochibo
Sql world とは
Sql world とは
Oda Shinsuke
簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪
Yohei Azekatsu
[Postgre sql9.4新機能]レプリケーション・スロットの活用
[Postgre sql9.4新機能]レプリケーション・スロットの活用
Kosuke Kida
Sql world とは
Sql world とは
Oda Shinsuke
Semelhante a NoSQLとビッグデータ入門編
(19)
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
JAWS-UG沖縄第1回勉強会 EBS/RDSがなくてもwrite massiveに耐えるDBの作り方
Osc spring 20220311
Osc spring 20220311
Non blocking and asynchronous
Non blocking and asynchronous
B 2-1 はじめての Windows Azure
B 2-1 はじめての Windows Azure
OSC関西@京都2014 CloudStackの歩き方
OSC関西@京都2014 CloudStackの歩き方
SQL Server のロック概要
SQL Server のロック概要
Sql azure知ってますか?改訂版
Sql azure知ってますか?改訂版
見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方
見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方
今こそCSS 今こそfor you
今こそCSS 今こそfor you
Sql serverデータアクセスの基本動作。荒ぶった方法で確認してみよう
Sql serverデータアクセスの基本動作。荒ぶった方法で確認してみよう
20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料
Global Azure Bootcamp 2019@Tokyo資料【ExpressRoute構築でハメられた】
Global Azure Bootcamp 2019@Tokyo資料【ExpressRoute構築でハメられた】
クラウド移住で地方に住むということ
クラウド移住で地方に住むということ
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
LocalStack
LocalStack
Sql world とは
Sql world とは
簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪
[Postgre sql9.4新機能]レプリケーション・スロットの活用
[Postgre sql9.4新機能]レプリケーション・スロットの活用
Sql world とは
Sql world とは
Último
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
Último
(8)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
NoSQLとビッグデータ入門編
1.
NoSQLと ビッグデータ入門編 at eXtream HAGO
3(みーち) 2012/03/03 @k_nishijima / 西島 幸一郎
2.
自己紹介 西島 幸一郎 / にしじま こういちろう twitter
: @k_nishijima とある会社のCTOをやってます。基本はJavaな人。 主戦場はBigData系 / MapReduceとか、Cassandraとか。。。 ダイビング好きが高じて2011年9月頭に沖縄に移住してきました JAWS−UG沖縄の副代表、やらせて頂いてます
3.
よく耳にするNoSQLって何? 諸説ありますが、現状のコンセンサスは 「Not only SQL」 = 「SQLだけじゃない!」 の略であるということで意見が一致。 ※この辺の紆余曲折は
http://www.publickey1.jp/blog/09/nosqlnot_only_sql.html が詳しいです。 SQLを使わないデータベースシステムの実装だったり、 そのような実装を利用したシステムを構築するときに、 「NoSQLデータベースを使おう」などと言ったりします。 なので、特定の実装を指す単語ではなく、 製品群、もしくは考え方を示す単語になります。
4.
実装は多数あります 以下、本資料では @yutuki_r さんが第10回Cassandra勉強会に て発表したスライドから図をパクr^h^h^h流用させてもらっていま す。かなりいい資料なので一読をおすすめします! http://www.slideshare.net/yutuki/cassandrah-baseno-sql
5.
実装は多数あります 実装にキーとそれに紐づく値を格納する方式を取るものが多い ため、そのようなNoSQL実装のことをKVS(キーバリューストア) などとも言います。
6.
NoSQLの存在意義
『SQLチョーベンリなのに 使わない意味が全然わかんない』 はい、アナタは大変正しいです。 RelationalDataBaseとSQLが カバーできる問題領域は大変広く ほとんどの場合は事足ります。
7.
NoSQLの存在意義 では、RDBがカバーできない問題領域とはなに か? 例えば ● データを正規化せずとも柔軟なスキーマで保存すること
(JSONとか、連想配列まるごと保存、みたいな) ● とてつもなく高速/大量の書き込み/読み込みへの対応 ● 大規模なデータセンター分割への対応 など、ちょっと違った視点からデータベースを見て みると、なるほど苦手な問題領域もあったりしま す。
8.
ブリュワーのCAP定理 どんなシステムデザインにも言えることですが、 全ては「何を捨てて、何を取るか」の問題。 ※これ、最近の教科書には出てるのかな?
9.
ブリュワーのCAP定理 Consistency = 一貫性 Availability
= 可用性 Partition-tolerance = ネットワーク分断耐性
10.
ブリュワーのCAP定理 Consistency = 一貫性 どのような状況でも、例えばサーバが1000台あっ ても、どのサーバにあるデータに付いて問い合わ せたら、必ず一貫性のあるデータが返ってくるこ と。
11.
ブリュワーのCAP定理 Availability = 可用性 バルスに耐えるtwitterの様に、 何があっても常に利用できること。 (普通のRDBで25088write/secに耐えられるか?)
12.
ブリュワーのCAP定理 Partition-tolerance = ネットワーク分断耐性 よく「分散できること」と思っている人がいますがこれは誤り。 ネットワークに障害が起こっても、出来る範囲で正しく応答しよう とする能力、の事です。
13.
RDBはACID特性を満たす トランザクションを提供する 故に高い一貫性を持ちますが、 一般にネットワーク分断耐性は低い = CA型。 (勿論、お金をたっぷりかければ可能です)
14.
じゃあ、どっち取る? それによって、各プロダクトの特色が出てきます。 ● Google BigTable ●
Amazon Dynamo ● Apache Cassandra ● Apache HBase ※ビッグデータのバズワード 生みの親Hadoopプロジェクト
15.
Google BigTable Webのクロールとインデックシング(ページランク作成の MapReduceなど)に利用されてい[る|た]。 (未公開ゆえ2006年公開の論文などから推測ですが) 今ではGoogleAppEngineから利用可能。 GAEから利用できるBigTableは、一貫性を担保する範囲を「限 定的」とし、高い可用性と分断耐性を持つAP型 Consistency =
一貫性 Availability = 可用性 Partition-tolerance = ネットワーク分断耐性
16.
Amazon Dynamo 自社のコマースサイト向けに作られたと言われている実装で、 2007年に論文が公開。 そのノウハウをつぎ込み、2012年1月にAmazon DynamoDBと してサービス提供開始。Kindle
Fireのバックエンドにも使われて いるとのこと。 一貫性を利用するユーザが選択可能(強一貫性も指定できる が料金が2倍!)とし、高い可用性とネットワーク分断耐性を保 つ(ハズ)のAP型 Consistency = 一貫性 Availability = 可用性 Partition-tolerance = ネットワーク分断耐性
17.
Apache 元々Facebookのメッセージボックス検索のために開発された ものを、2008年にオープンソース化。 マスタノードが必要なく、例えネットワークが分断されても 動作し続け読み書きが可能 (勿論場合によっては読み込み不可の場合もある)。 合言葉は「eventually consistency」=結果整合性! 一貫性を利用するユーザが選択可能とし、高い可用性とネット ワーク分断耐性を保つAP型 Consistency =
一貫性 Availability = 可用性 Partition-tolerance = ネットワーク分断耐性
18.
Apache GoogleのBigTableをモデルに実装された列指向分散データ ベース。 現在はHadoopプロジェクトの一部だが、色々あるらしい。。。 高い一貫性とネットワーク分断耐性を持つが、SPoFが存在する ため可用性には劣るCP型 Consistency = 一貫性 Availability
= 可用性 Partition-tolerance = ネットワーク分断耐性
19.
最近のトレンドは Consistency = 一貫性をどう扱うか、にフォーカスが 当たってるような気がしますね。 他にも ●
どうやってデータを分散させるの? = Consistent Hashingとか ● そもそもキーとバリューでどうやってデータ取り出すの? = じゃあsecondery index使おうか、とか ● データモデリングはどうするの? などなど、話のネタは付きませんが以下次号。。。
20.
まとめ 取りあえず @yutuki_r さんの http://www.slideshare.net/yutuki/cassandrah-baseno-sql を読めば一発です。 BigDataに興味のある人、そもそもMapReduceってなに?とか、 プロダクトとしてのApache
Cassandraに興味がある人は @k_nishijima までコンタクトください。 ご要望があれば勉強会でも何でも開いちゃいます。
Baixar agora