SlideShare a Scribd company logo
1 of 24
Sklik
Zdeněk Philipp
Reklama
Display teď ne
PPC Sklik
      podíl na trhu 1/3 a roste
      přímá konkurence
            Google AdWords
            Facebook Advertising
Historie
•   7.9.2006 (Jyxo)
•   podzim 2008 – analýza
•   13.3.2009 první ticket a první commit

•   5 programátorů
•   1 webmaster
•   1 produkťák
•   4 měsíce analýza
•   10 měsíců vývoje
•   2 měsíce testy
Plán
Realita
Současnost
•   28.2.2009 nasazeno

•   velmi živý vývoj do dnes
Současnost
Kontext
Kontext
Kontext
Kontext
Hledání 
Hledání 
Jak funguje hledání?
Jak funguje hledání?
Provoz + HW
hledání 400 req/s
        4 master search (2 + 2 fyzicky)
        32 slave search (8 + 8 fyzicky)

kontext 400 req/s
        4 + 4 stroje fyzicky

databáze
       statistiky 8 + 8

generátory
       4 servery (fyzicky)

Web a další
       3 + 3 servery (fyzicky)

Hadoop clustery
      Skotch - statistiky 10x
      Skunk - kontext 10x
Technologie
Interní serverové technologie
C++, JAVA, Python
MySQL
Hadoop, HDFS, MapReduce, Cassandra, HIVE
Couchbase
Proprietální databáze
Google protobuffers
Lidé
3 vývojové týmy - 13 lidí (5 Brno, 8 Praha)
     - web (4)
     - hledání, statistiky (3)
     - kontext (4)

výzkum (2 Praha)
produkt (3 Praha)
provoz (4 Brno)
admins (5 Praha)
obchod (celá ČR)
Za poslední rok
Přepis hledání
Hadoop a NoSQL
Výzkum

Nová webovka
Kontext a partnerská síť
Plány
Nová webovka AJAX (FastRPC)
Zacílení na umístění
Zvyšování relevance
Zvyšování výkonosti
      výzkum, výzkum, výzkum
      studie jiných zdrojů
             Google
             Yahoo
             Microsoft
             Yandex
Statistiky a nové metriky měření
SLOC Count
Total Physical Source Lines of Code          = 446 406
Development Effort Estimate, Person-Months= 121,13
Estimated Average Number of Developers       = 36,54
Total Estimated Cost to Develop       = $ 16 362 820
SLOC Count
Total Physical Source Lines of Code                  = 446 406
Development Effort Estimate, Person-Months           = 121,13
Estimated Average Number of Developers               = 36,54
Total Estimated Cost to Develop              = $ 16 362 820
Dotazy?
Sklik - Reklama nejen ve vyhledávání

More Related Content

Similar to Sklik - Reklama nejen ve vyhledávání

SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytikaTaste Medio
 
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150Develcz
 
Využití dat googlu pro marketing
Využití dat googlu pro marketingVyužití dat googlu pro marketing
Využití dat googlu pro marketingMarek Prokop
 
Content First: Co jsme se za 14 měsíců naučili o měření obsahu
Content First: Co jsme se za 14 měsíců naučili o měření obsahuContent First: Co jsme se za 14 měsíců naučili o měření obsahu
Content First: Co jsme se za 14 měsíců naučili o měření obsahuObsahová agentura s.r.o.
 
Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015Jakub Kašparů
 
Prague data management meetup 2017-10-24
Prague data management meetup 2017-10-24Prague data management meetup 2017-10-24
Prague data management meetup 2017-10-24Martin Bém
 
Prague data management meetup 2016-10-17
Prague data management meetup 2016-10-17Prague data management meetup 2016-10-17
Prague data management meetup 2016-10-17Martin Bém
 
MicroStrategy GI a GIS Connector
MicroStrategy GI a GIS ConnectorMicroStrategy GI a GIS Connector
MicroStrategy GI a GIS ConnectorOKsystem
 
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciEXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciTECHNODAT, CAE - systémy, s.r.o.
 
Firma pracující v prostředí Google
Firma pracující v prostředí GoogleFirma pracující v prostředí Google
Firma pracující v prostředí GoogleIvan K
 
Big data v infrastruktuře
Big data v infrastruktuřeBig data v infrastruktuře
Big data v infrastruktuřeKamil Brzak
 
Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2MarketingArrowECS_CZ
 
Jak jsme dělali nový web města plzně
Jak jsme dělali nový web města plzněJak jsme dělali nový web města plzně
Jak jsme dělali nový web města plzněPetr Bechyně
 
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouGlami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouPetr Bechyně
 
8. Lukas Piska - CN Group
8. Lukas Piska - CN Group8. Lukas Piska - CN Group
8. Lukas Piska - CN GroupMobCon
 
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...Taste
 
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaci
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaciSEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaci
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaciMartiSEO
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Martin Bém
 

Similar to Sklik - Reklama nejen ve vyhledávání (20)

SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytika
 
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150
David Brožík - Škálování týmů, procesů a technologií od 4 developerů po 150
 
Využití dat googlu pro marketing
Využití dat googlu pro marketingVyužití dat googlu pro marketing
Využití dat googlu pro marketing
 
Content First: Co jsme se za 14 měsíců naučili o měření obsahu
Content First: Co jsme se za 14 měsíců naučili o měření obsahuContent First: Co jsme se za 14 měsíců naučili o měření obsahu
Content First: Co jsme se za 14 měsíců naučili o měření obsahu
 
Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015
 
Prague data management meetup 2017-10-24
Prague data management meetup 2017-10-24Prague data management meetup 2017-10-24
Prague data management meetup 2017-10-24
 
Prague data management meetup 2016-10-17
Prague data management meetup 2016-10-17Prague data management meetup 2016-10-17
Prague data management meetup 2016-10-17
 
MicroStrategy GI a GIS Connector
MicroStrategy GI a GIS ConnectorMicroStrategy GI a GIS Connector
MicroStrategy GI a GIS Connector
 
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciEXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
 
Firma pracující v prostředí Google
Firma pracující v prostředí GoogleFirma pracující v prostředí Google
Firma pracující v prostředí Google
 
PowerBI
PowerBIPowerBI
PowerBI
 
Big data v infrastruktuře
Big data v infrastruktuřeBig data v infrastruktuře
Big data v infrastruktuře
 
Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2
 
Jak jsme dělali nový web města plzně
Jak jsme dělali nový web města plzněJak jsme dělali nový web města plzně
Jak jsme dělali nový web města plzně
 
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouGlami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
 
8. Lukas Piska - CN Group
8. Lukas Piska - CN Group8. Lukas Piska - CN Group
8. Lukas Piska - CN Group
 
SEO 2013
SEO 2013SEO 2013
SEO 2013
 
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
 
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaci
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaciSEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaci
SEO & DEV - Jak na vývojáře od pochopení procesů po efektivní komunikaci
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
 

More from seznamVyvojari

Odpoledne s vyvojari - mobilni aplikace
Odpoledne s vyvojari - mobilni aplikaceOdpoledne s vyvojari - mobilni aplikace
Odpoledne s vyvojari - mobilni aplikaceseznamVyvojari
 
Javascript na steroidech
Javascript na steroidechJavascript na steroidech
Javascript na steroidechseznamVyvojari
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeseznamVyvojari
 
Content delivery network a video
Content delivery network a videoContent delivery network a video
Content delivery network a videoseznamVyvojari
 
Velké obsahové systémy
Velké obsahové systémyVelké obsahové systémy
Velké obsahové systémyseznamVyvojari
 
Hledání úspor v provozu internetové jedničky
Hledání úspor v provozu internetové jedničkyHledání úspor v provozu internetové jedničky
Hledání úspor v provozu internetové jedničkyseznamVyvojari
 

More from seznamVyvojari (14)

Analytika
AnalytikaAnalytika
Analytika
 
Odpoledne s vyvojari - mobilni aplikace
Odpoledne s vyvojari - mobilni aplikaceOdpoledne s vyvojari - mobilni aplikace
Odpoledne s vyvojari - mobilni aplikace
 
Javascript na steroidech
Javascript na steroidechJavascript na steroidech
Javascript na steroidech
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
 
Mapy.cz
Mapy.czMapy.cz
Mapy.cz
 
Content delivery network a video
Content delivery network a videoContent delivery network a video
Content delivery network a video
 
Seznam.cz email
 Seznam.cz email Seznam.cz email
Seznam.cz email
 
Velké obsahové systémy
Velké obsahové systémyVelké obsahové systémy
Velké obsahové systémy
 
Hledání úspor v provozu internetové jedničky
Hledání úspor v provozu internetové jedničkyHledání úspor v provozu internetové jedničky
Hledání úspor v provozu internetové jedničky
 
Nový Email.cz
Nový Email.czNový Email.cz
Nový Email.cz
 
Výzkum ve fulltextu
Výzkum ve fulltextuVýzkum ve fulltextu
Výzkum ve fulltextu
 
Seznam na mobilu
Seznam na mobiluSeznam na mobilu
Seznam na mobilu
 
SCRUM v Seznam.cz
SCRUM v Seznam.czSCRUM v Seznam.cz
SCRUM v Seznam.cz
 
Roman kummel
Roman kummelRoman kummel
Roman kummel
 

Sklik - Reklama nejen ve vyhledávání

Editor's Notes

  1. Mel bych se predstavit! Skoncil jsem u nejzajimavejsiho, takze reklama
  2. Prezentace bude o PPC, nikoliv o Display reklame Je tady nekdo, kdo nevi, co to je PPC? Kdo vi co to je PPC? Takze uplne obecne o Skliku Jsme jeden z nejvetsich reklamnich systemu, ktery je je mozne v cr pouzivat verejne Ona reklama neni jen to nutne zlo, ktere si vetsinou vypnete pres adblock, ale Nekdy I poskytuje obsah a mnohdy lepsi nez cekate
  3. Slajd z Yandexu, vubec jsme nevedeli, co nas ceka
  4. Po 10-ti mesicich vyvoje se nam povedlo, s durazem na termin o den drive system nasadit.
  5. Nazazeno z 27 na 28 unora 2009, jeden den k dobru. Koncila nam smlouva s Jyxem.
  6. Za 3 roky se system uplne zmenil 2x jsme predelali kontext Vymenili jsme nektere technologie. Spoustu veci jsme museli zrychlit Je videt, ze je sklik rozdelen do 4 ucelynych casti Vydej Statistiky Generatory Web Kontext
  7. Neco o kontextu. Cilime inzeraty podle url ….
  8. V rychlosti co se vlastne deje v kontextu Reklama kontextove spojena se strankou, na ktere se vydava. Cely proces je podstatne slozitejsi, hlavne do nej vstupuje daleko vice externich informaci Vysledek je sada inzeratu, ktere maji potencial se na strance zobrazit
  9. Takle nejak se to pak dostane ven Pokud stranku nezname, stahneme ji, zpracujeme a po indexaci se znova dostane do vydejove databaze To je ke kontextu vsechno a ted hledani
  10. Hledani Cilime inzeraty podle hledane fraze uzivatele. Nekdy se nam to moc nedari fulltext je lepsi 
  11. Nekdy fulltext vubec nepotrebujete. Ale v podstate spolu porad soutezime Klienti v sestavach mezi sebou soutezi v aukci, a jak je videt komercni fraze umime pekne. Ty vetsinou byvaji dobre obsazene. Jen pro zajimavost nejdrazsi slovo v systemu je
  12. Vydej vysledku v hledani je velice podobna fulltextu V podstate se jedna o fulltextove vyhledavani s nekterymi specialitami Skliku. Protoze jde o hledani, je narocnost vetsi nez u kontextu, kde jsou inzeraty uz pripravene a pouze se vydaji. V hledani se pocet frazi blizi skoro nekonecnu, takze se vysledky nedaji predpocitavat A musi se zpracovat fraze neco najit to neco se musi projit protridit pripadne vyhazet vypocitat pro to relevance seradit a vydat Kroku je podstatne vice nez v kontextu. Cele to resi asyngronne
  13. Vydej vysledku v hledani je velice podobna fulltextu V podstate se jedna o fulltextove vyhledavani s nekterymi specialitami Skliku. Protoze jde o hledani, je narocnost vetsi nez u kontextu, kde jsou inzeraty uz pripravene a pouze se vydaji. V hledani se pocet frazi blizi skoro nekonecnu, takze se vysledky nedaji predpocitavat A musi se zpracovat fraze neco najit to neco se musi projit protridit pripadne vyhazet vypocitat pro to relevance seradit a vydat Kroku je podstatne vice nez v kontextu. Cele to resi asyngronne, mame na to master a slave searche
  14. Sluzby si vetsinou resi svuj vlastni provoz, my musime resit provoz vsech zluzeb dohromady 80% z hledfanio je fulltext Kontext a partnerska sit je stejne velky jako hledani, v poctech requestu / s
  15. Hlavně říct neco o tom, jak se pereme s Javou a ze ji moc nedoporucujeme na vysoce vytizene sluzby s garantovanou dostupnosti. Jsme domluveni s administratory, ze tam kde jde hlavne o dostupnost, java nebude, budeme hledat jina reseni. Chova se to nevyspitatelne.
  16. Vsechno je to jen o lidech
  17. Prepis hledani, hlavne zrychleni a priprava na nove reseni relevance pomoci regresnich stromu. Hlavne technologicka vymena
  18. Hlavne vyzkum se zamerenim na lepsi cileni a zlepsovani relevance Malo lidi, hodne prace Statistiky a redesign Hodne ficur pro inzerenty pocinaje novou webovkou
  19. Mame GIT
  20. Vlastne dnes uz mame hotove to, co by melo byt hotove az zitra