Onet barcamp 4 - Cloud Storage

•Transferir como PPTX, PDF•

1 gostou•1,437 visualizações

OnetIT

Tecnologia

• >1 000 serwerów
• >100 000 połączeń
• >1 000 000 użytkowników
• >100 000 000 małych plików („obrazki”)
2

HISTORIA / ZARYS
Od mainframe’ów do chmury
3

Mainframe
Wszystkie usługi na
jednej mocnej maszynie
www
mail
ftp
dns
4

Klastry
www
www
www
www
5
– wspólny storage

ONET Cloud
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM`
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
6

Wydajność NAS
Controler Controler
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
nfs
smb
iscsi
8

ROZWIĄZANIE
Systemy rozproszone
http://commons.wikimedia.org/wiki/File:Liofilizat_04_pl.jpg
9

Od najdroższych…
Controler Controler
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
RAID
1 2 3 4
µControler µControler µControler µControler
10

… do wszystkiego
Controler Controler
1 2 3 4 1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4
1 2 3 4 1 2 3 4
11

… i software
• Rozpraszanie danych
• Skalowalność
• Odporność na awarie
• Brak punktów centralnych
13

JAK TO DZIAŁA?
http://wallpaperbackgrounds.com/wallpaper/30711
14

Mapa Data Center #1
RządC
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
RządB
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
RządA
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
Serwer
Serwer
Serwer
Szafa
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
Serwer
Serwer
Serwer
Serwer
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
Serwer
Serwer
Serwer
Serwer
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
Serwer
1 2 3 4
1 2 3 4
1 2 3 4
15

Data Center #1
Rząd A
Serwer
Szafa 1
Mapa
Serwer Serwer Serwer Serwer Serwer Serwer Serwer Serwer
Szafa 2 Szafa 3
16

Algorytm CRUSH
CRUSH (fragment_pliku, mapa)
-> dyskA, dyskB, dyskC
Plik
dysk10 dysk11 dysk12
dysk7 dysk8 dysk9
dysk4 dysk5 dysk6
dysk1 dysk2 dysk3
17

Awaria
CRUSH (fragment_pliku, nowa_mapa)
-> dyskA, dyskB, dyskD
Plik
dysk10 dysk11 dysk12
dysk7 dysk8 dysk9
dysk4 dysk5 dysk6
dysk1 dysk2 dysk3
18

Data Center #1
Rząd A
Serwer
Szafa 1
3 x kopie danych
Serwer Serwer Serwer Serwer Serwer Serwer Serwer Serwer
Szafa 2 Szafa 3
KOPIA #1 KOPIA #2
3x
KOPIA #3
19

21
CEPH W ONET
czyli nasze doświadczenia

Doświadczenia
• > 1 000 000 plików => sharding
• Synchronizacja DC
• Automatyzacja
• Problemy z rozkładem
• Wolne "zbieranie się
konsystencji„
23

http://commons.wikimedia.org/wiki/File:Berlin_Alexanderplatz_construction_cranes.jpg
BUDUJEMY NADAL…
… bo nam ciągle mało :-)
24

Rozwój
• Spójne, duże klastry
• Nowy sprzęt
• Testy wydajności
• Nowe usługi
• SLA i QoS
• Migracja Video - wyzwanie
25

PODSUMUJMY…
http://www.hdwallpapersfull.com/view-fresh-cherry-fruits-1920x1200.html
26

Podsumowanie
• Wyzwaniem jest wydajność (IOPS), a nie pojemność
• Macierze NAS są drogie i słabo się skalują
• Alternatywą jest storage rozproszony
• CEPH to przykład takiego systemu
• W Onet używamy go produkcyjnie
• I nadal rozwijamy nasze klastry

Mais conteúdo relacionado

Mais procurados

Ochrona przed atakami DDoS na platformie x86. Czy można mieć jednocześnie wyd...Redge Technologies

Infrastructure As CodeKamil Grabowski

Bezpieczna infrastruktura serwisu www w chmurze - WordPressMichał Smereczyński

Monitoring sieciKamil Grabowski

PLNOG 8: Tomasz Paszkowski - Wirtualne systemy dyskowe na platformie OpenStac...PROIDEA

100 M pakietów na sekundę dla każdego. Redge Technologies

JDBC. Leksykon kieszonkowyWydawnictwo Helion

Red Hat Linux 8. BibliaWydawnictwo Helion

PLNOG 3: Krzysztof Góźdź - Petabajtowe systemy przechowywania danych dla dost...PROIDEA

Od Zera do FarmeraFilip Dębowski

PLNOG22 - Piotr Stolarek - Bezpieczeństwo użytkowania platform usługowych Tel...PROIDEA

Barcamp 08/06/2010Michał Gruchała

Tuning zabbixArkadiusz Siczek ✔

Złam zasady i stwórz wydajny stos IP przy użyciu DPDKSemihalf

Swoole w PHP. Czy to ma sens?The Software House

HPE 3PAR All Flashhpepolska

Noc informatykaOnetIT

PLNOG 9: Daniel Fenert - nazwa.pl - nieustanny rozwój PROIDEA

PHP-PM. Hit czy kit?The Software House

PLNOG16: DNS Catalog Zones łatwe tworzenie i synchronizacja serwowanych ...PROIDEA

Mais procurados (20)

Ochrona przed atakami DDoS na platformie x86. Czy można mieć jednocześnie wyd...

Infrastructure As Code

Bezpieczna infrastruktura serwisu www w chmurze - WordPress

Monitoring sieci

PLNOG 8: Tomasz Paszkowski - Wirtualne systemy dyskowe na platformie OpenStac...

100 M pakietów na sekundę dla każdego.

JDBC. Leksykon kieszonkowy

Red Hat Linux 8. Biblia

PLNOG 3: Krzysztof Góźdź - Petabajtowe systemy przechowywania danych dla dost...

Od Zera do Farmera

PLNOG22 - Piotr Stolarek - Bezpieczeństwo użytkowania platform usługowych Tel...

Barcamp 08/06/2010

Tuning zabbix

Złam zasady i stwórz wydajny stos IP przy użyciu DPDK

Swoole w PHP. Czy to ma sens?

HPE 3PAR All Flash

Noc informatyka

PLNOG 9: Daniel Fenert - nazwa.pl - nieustanny rozwój

PHP-PM. Hit czy kit?

PLNOG16: DNS Catalog Zones łatwe tworzenie i synchronizacja serwowanych ...

Destaque

Onet barcamp 4 - Usługa w chmurze, Onet AcceleratorOnetIT

Onet barcamp 4 - Po co nam chmuraOnetIT

Onet barcamp 4 - Public Cloud - VMware SolutionOnetIT

Onet barcamp 4 - Środowisko PaaS/SaaS w Onet, czyli jak zarządzamy 1k aplikacji.OnetIT

Onet barcamp 4 - DRP chmuryOnetIT

Barcamp Onet. Monitorowanie prędkości ładowania się stron internetowychOnetIT

OpenNebulaConf 2016 - Networking, NFVs and SDNs Hands-on Workshop by Rubén S....OpenNebula Project

TechDay - Toronto 2016 - Hyperconvergence and OpenNebulaOpenNebula Project

OpenNebulaConf 2014 - Understanding the OpenNebula Model for Cloud Provisioni...OpenNebula Project

Barcamp Onet. Monitorowanie Chmury Wyzwania i wymaganiaOnetIT

Barcamp Onet. Dlaczego DevOps gwarantuje dobry monitoring?OnetIT

Intel IT Open Cloud - What's under the Hood and How do we Drive it?Odinot Stanislas

OpenNebulaConf 2016 - Fast Prototyping of a C.O. into a Micro Data Center - A...OpenNebula Project

OpenNebulaConf 2016 - VTastic: Akamai Innovations for Distributed System Test...OpenNebula Project

OpenNebulaConf 2016 - Evolution of OpenNebula at Netways by Sebastian Saemann...OpenNebula Project

OpenNebulaConf 2016 - Sunstone integration with FreeIPA using Single Sign by ...OpenNebula Project

OpenNebulaConf 2016 - Network automation with VR by Karsten Nielsen, Unity Te...OpenNebula Project

(ISM205) A Framework for IT and Business TransformationAmazon Web Services

OpenNebula 4.14 Hands-on TutorialOpenNebula Project

Cloud Adoption - A Practical ApproachLicensingLive! - SafeNet

Destaque (20)

Onet barcamp 4 - Usługa w chmurze, Onet Accelerator

Onet barcamp 4 - Po co nam chmura

Onet barcamp 4 - Public Cloud - VMware Solution

Onet barcamp 4 - Środowisko PaaS/SaaS w Onet, czyli jak zarządzamy 1k aplikacji.

Onet barcamp 4 - DRP chmury

Barcamp Onet. Monitorowanie prędkości ładowania się stron internetowych

OpenNebulaConf 2016 - Networking, NFVs and SDNs Hands-on Workshop by Rubén S....

TechDay - Toronto 2016 - Hyperconvergence and OpenNebula

OpenNebulaConf 2014 - Understanding the OpenNebula Model for Cloud Provisioni...

Barcamp Onet. Monitorowanie Chmury Wyzwania i wymagania

Barcamp Onet. Dlaczego DevOps gwarantuje dobry monitoring?

Intel IT Open Cloud - What's under the Hood and How do we Drive it?

OpenNebulaConf 2016 - Fast Prototyping of a C.O. into a Micro Data Center - A...

OpenNebulaConf 2016 - VTastic: Akamai Innovations for Distributed System Test...

OpenNebulaConf 2016 - Evolution of OpenNebula at Netways by Sebastian Saemann...

OpenNebulaConf 2016 - Sunstone integration with FreeIPA using Single Sign by ...

OpenNebulaConf 2016 - Network automation with VR by Karsten Nielsen, Unity Te...

(ISM205) A Framework for IT and Business Transformation

OpenNebula 4.14 Hands-on Tutorial

Cloud Adoption - A Practical Approach

Semelhante a Onet barcamp 4 - Cloud Storage

Gluster FS3camp

Citrix provisioning servicesPawel Serwan

Windows Server 2003. Podręcznik administratoraWydawnictwo Helion

Linux. Serwery. BezpieczeństwoWydawnictwo Helion

Qnap - rozwiązania, portfolio, zastosowanieEIP Sp. z o.o.

Pocałunek śmierciDivante

Slackware Linux. ĆwiczeniaWydawnictwo Helion

PLNOG 13: Gaweł Mikołajczyk: Data Center Security in 2014PROIDEA

[PLCUG] Hyper converged - Atlantis USX (PL)Jaroslaw Sobel

Infrastruktura Hiperkonwergentna na przykładzie platformy Nutanix - Marcin Ka...jzielinski_pl

Xen desktop na platformie nutanixPawel Serwan

PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_HiperkonwergentnymPROIDEA

PLNOG 7: Michał Jura - Linux ContextualizationPROIDEA

PLNOG22: Tomasz Jarlaczyk & Tomasz Ludwiczak - DNSv6 i SSL - historie z życia...PROIDEA

[CareerCon] Wirtualizacja (PL)Jaroslaw Sobel

Sieci VPN. Zdalna praca i bezpieczeństwo danychWydawnictwo Helion

Wprowadzenie do Microsoft AzureMichal Furmankiewicz

Wprowadzenie do OpenEmbeddedMarcin Juszkiewicz

100 sposobów na serwery WindowsWydawnictwo Helion

OpenEmbeddedMarcin Juszkiewicz

Semelhante a Onet barcamp 4 - Cloud Storage (20)

Gluster FS

Citrix provisioning services

Windows Server 2003. Podręcznik administratora

Linux. Serwery. Bezpieczeństwo

Qnap - rozwiązania, portfolio, zastosowanie

Pocałunek śmierci

Slackware Linux. Ćwiczenia

PLNOG 13: Gaweł Mikołajczyk: Data Center Security in 2014

[PLCUG] Hyper converged - Atlantis USX (PL)

Infrastruktura Hiperkonwergentna na przykładzie platformy Nutanix - Marcin Ka...

Xen desktop na platformie nutanix

PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym

PLNOG 7: Michał Jura - Linux Contextualization

PLNOG22: Tomasz Jarlaczyk & Tomasz Ludwiczak - DNSv6 i SSL - historie z życia...

[CareerCon] Wirtualizacja (PL)

Sieci VPN. Zdalna praca i bezpieczeństwo danych

Wprowadzenie do Microsoft Azure

Wprowadzenie do OpenEmbedded

100 sposobów na serwery Windows

OpenEmbedded

Onet barcamp 4 - Cloud Storage

1. czyli gdzie są moje pliki? 1

2. • >1 000 serwerów • >100 000 połączeń • >1 000 000 użytkowników • >100 000 000 małych plików („obrazki”) 2

3. HISTORIA / ZARYS Od mainframe’ów do chmury 3

4. Mainframe Wszystkie usługi na jednej mocnej maszynie www mail ftp dns 4

5. Klastry www www www www 5 – wspólny storage

6. ONET Cloud VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM` VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM VM 6

7. Macierze NAS 7

8. Wydajność NAS Controler Controler RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 nfs smb iscsi 8

9. ROZWIĄZANIE Systemy rozproszone http://commons.wikimedia.org/wiki/File:Liofilizat_04_pl.jpg 9

10. Od najdroższych… Controler Controler RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 RAID 1 2 3 4 µControler µControler µControler µControler 10

11. … do wszystkiego Controler Controler 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 11

12. Sprzęt… 12

13. … i software • Rozpraszanie danych • Skalowalność • Odporność na awarie • Brak punktów centralnych 13

14. JAK TO DZIAŁA? http://wallpaperbackgrounds.com/wallpaper/30711 14

15. Mapa Data Center #1 RządC Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa RządB Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa RządA Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa Serwer Serwer Serwer Szafa 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer Serwer Serwer Serwer Serwer Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer Serwer Serwer Serwer Serwer Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 Serwer 1 2 3 4 1 2 3 4 1 2 3 4 15

16. Data Center #1 Rząd A Serwer Szafa 1 Mapa Serwer Serwer Serwer Serwer Serwer Serwer Serwer Serwer Szafa 2 Szafa 3 16

17. Algorytm CRUSH CRUSH (fragment_pliku, mapa) -> dyskA, dyskB, dyskC Plik dysk10 dysk11 dysk12 dysk7 dysk8 dysk9 dysk4 dysk5 dysk6 dysk1 dysk2 dysk3 17

18. Awaria CRUSH (fragment_pliku, nowa_mapa) -> dyskA, dyskB, dyskD Plik dysk10 dysk11 dysk12 dysk7 dysk8 dysk9 dysk4 dysk5 dysk6 dysk1 dysk2 dysk3 18

19. Data Center #1 Rząd A Serwer Szafa 1 3 x kopie danych Serwer Serwer Serwer Serwer Serwer Serwer Serwer Serwer Szafa 2 Szafa 3 KOPIA #1 KOPIA #2 3x KOPIA #3 19

20. Usługi Swift 20

21. 21 CEPH W ONET czyli nasze doświadczenia

22. Nasze klastry 22

23. Doświadczenia • > 1 000 000 plików => sharding • Synchronizacja DC • Automatyzacja • Problemy z rozkładem • Wolne "zbieranie się konsystencji„ 23

24. http://commons.wikimedia.org/wiki/File:Berlin_Alexanderplatz_construction_cranes.jpg BUDUJEMY NADAL… … bo nam ciągle mało :-) 24

25. Rozwój • Spójne, duże klastry • Nowy sprzęt • Testy wydajności • Nowe usługi • SLA i QoS • Migracja Video - wyzwanie 25

26. PODSUMUJMY… http://www.hdwallpapersfull.com/view-fresh-cherry-fruits-1920x1200.html 26

27. Podsumowanie • Wyzwaniem jest wydajność (IOPS), a nie pojemność • Macierze NAS są drogie i słabo się skalują • Alternatywą jest storage rozproszony • CEPH to przykład takiego systemu • W Onet używamy go produkcyjnie • I nadal rozwijamy nasze klastry

28. 28

Notas do Editor

Porozmawiamy o najnowocześniejszych systemach storageowych w kontekście naszych rozwiązań chmurowychTytułowe pytanie będzie trudne
Zacznijmy od skali Onetu i naszych wyznwań – w tle widzimy tłum naszych użytkowników Jak widać z powyższych statystyk wyzwaniem będzie nie zapewnienie pojemnościAle odpowiedniej ilości jednoczesnych operacji wejścia wyjścia, czyli IOPSówBędziemy rozmawiać nie o petabajtach danych, ale np. o tysiącach obrazków do podania na sekundę
Pojedyncze superserwery Bardzo mocne maszynyBardzo drogieBardzo trudne do skalowania – wąskie gardła
Dane na wspólnym systemie storage’owymStorage realizowany przez macierze dyskowe Im większe macierze tym droższe
Prawdziwa chmura Onetu, setki fizycznych, tysięce wirtualnych, ciągle rotujących się Chmura z prawdziwego zdarzenia.Storage dla takiej ilości równolegle działających maszyn?
Klasyczne rozwiązanie z sektora enterprise – droga, wszystko mająca macierz NAS, czyli Network Attached Storage Jedna to za mało do redundancji, więc kupujemy kolejną. potem kolejne do zapasowej serwerowni
Mamy półki / macierz RAID, z dyskami, Mamy kontrolery udostępniające usługi sieciowe oraz switche, Wszystko razem połączone i udostępniające dane użytkownikomMożemy zabić się na wydajności sieci, kontrolerów, pojemności i wydajności półek i połączeń do nichRozwiązanie drogie i źle skalujące się - odpowiednik mainframe’ów
Rozwiązanie? Zróbmy to samo co z mainframe’ami – rozproszmy storage między mniejsze urządzania
Wyrzucamy mega drogie kontroleryI zamiast nich dorzucamy mniejsze kontrolery, powiedzmy takie mikro, tansze, ale w wiekszej ilosciI przepinamy do nich nasze macierze
W ogóle wyrzucamy kontroleryZamiast tego dokładamy urządzeń z dyskamiTylko to już nie mogą być zwykłe RAIDy, bo muszą mieć rozproszoną logikę kontrolera
Bierzemy zwykły serwer PC, stosunkowo tani, z pewną liczbą dysków Dorzucamy mu kolegów, dorzucamy switchejuż teraz widać, że będzie się to skalowało w pionie i poziomie
Teraz potrzebujemy oprogramowania, które musi spełniać nasze założenia Pierwsze było GoogleFS Jest wiele rozwiązań na rynku, my wybraliśmy open-sourceowego Cepha Podobnie jak np. CERN i Deutsche Telekom, a ostatnio firmę produkującą CEPHa kupił RedHat
No dobrze, ale jak to działa?
W tle zdjęcie prawdziwej serwerowni OnetuJedna komora składa się z rzędów, rzędy z szaf W szafach są zamontowane serwery, a w nich dziesiątki dyskówTaką mapę przekazujemy w konfiguracji CEPHowi
Powtórzmy – mapa przedstawia aktualną strukturę sprzętową serwerowni
Algorytm crush pozwala odnajdować dane (fragmenty plików) na dyskach na podstawie mapy Dla każdego fragmentu pliku, pozwala na podstawie aktualnej mapy określić dyski na których jest przechowywany (tutaj trzy)Dzięki podziałowi na mniejsze fragmenty duże pliki są równomiernie rozłożone na wielu dyskach –> jednoczesny zapis i odczyt z wielu maszyn
W razie awarii otrzymujemy nową mapę i algorytm wyznacza nowy trzeci dysk, na który przepinani są klienci i jednocześnie na który automatycznie migrowane są dane
Mapa określa również ilość kopiiDomyślnie na każdym poziomie jest jedna kopiaAle możemy na przykład nakazać trzymać trzy niezależne kopie danych na poziomie szaf
Filesystem do zamontowaniaUrządzenie blokowe - wirtualny dysk, który możemy sformowatować dowolnym formatem, np. NTFSem z Windows I na końcu najważniejsze – obiekty, do których możemy się dostać przez RESTful API S3 (Standard Amazon) i Swift (Standard Openstack)
Zaczęliśmy od PoCa, teraz mamy 2 x 2 klastry produkcyjne i dodatkową kopię danych w AMZ OCDN – większość obrazków onetu oraz OnetDysk Ten pierwszy na dyskach SAS, bo baliśmy się troszkę wydajności, drugi z dużo tanszymi dyskami SATATo były pierwsze przymiarki do technologii, aby zdobyć doświadczenia
I je zdobyliśmy…

Onet barcamp 4 - Cloud Storage

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (20)

Semelhante a Onet barcamp 4 - Cloud Storage

Semelhante a Onet barcamp 4 - Cloud Storage (20)

Onet barcamp 4 - Cloud Storage

Notas do Editor