SlideShare uma empresa Scribd logo
1 de 28
Использование открытых данных
 в современных научных исследованиях



                     Радченко Ирина Алексеевна,
                  кандидат технических наук, доцент,
     научный сотрудник Центра семантических технологий НИУ ВШЭ

                        http://about.me/Irina.Radchenko


НИУ ВШЭ, Москва, 2012
Что такое открытые данные?




                        • Открытые данные — это концепция, заключающаяся в том,
                          что данные должны быть свободно доступны для всех
                          пользователей и пригодны для повторного использования
                          без ограничений авторского права, патентов
                          и других механизмов контроля.




НИУ ВШЭ, Москва, 2012
                                                                                  2
Открытые данные
                                          во временной перспективе




Источник: http://visual.ly/open-data-movement
НИУ ВШЭ, Москва, 2012
                                                                     3
Открытые наборы научных данных


                             NASA




                                       CERN




                          World Bank


НИУ ВШЭ, Москва, 2012
                                                         4
Пример использования открытых геоданных




НИУ ВШЭ, Москва, 2012
                                                              5
Открытые государственные данные
                                    за рубежом

            Цель: повысить открытость, доступность данных для граждан,
            способствовать распространению государственных данных

  в США:
  http://www.data.gov/                             в Великобритании:
  http://www.utah.gov/data/                        http://data.gov.uk/
  http://data.octo.dc.gov/                         http://data.london.gov.uk/
  https://nycopendata.socrata.com/
  http://www.govtrack.us/                          в Канаде:
  http://openstates.org/                           http://www.toronto.ca/open/
                                                   https://data.edmonton.ca/
  в Австралии:                                     http://data.nanaimo.ca/
  http://data.gov.au/                              http://data.vancouver.ca/

  во Франции:                                      в Швеции:
  http://www.data.gouv.fr/                         http://www.opengov.se/data/


НИУ ВШЭ, Москва, 2012
                                                                                 6
Пятизвездочная модель открытых данных
                                 по Тиму Бернерсу-Ли




Источники: http://5stardata.info/, http://www.w3.org/DesignIssues/LinkedData.html
НИУ ВШЭ, Москва, 2012
                                                                                    7
Пятизвездочная модель открытых данных
                                 по Тиму Бернерсу-Ли
           ★     Данные доступны в Вебе (в любом формате), но подпадают под лицензию
                 Открытых             Данных             (Open            Data)    —
                 http://www.nationalarchives.gov.uk/doc/open-government-licence/.
        ★★       Данные доступны в качестве машинообрабатываемых структурированных
                 данных (например, в виде Excel-таблицы вместо отсканированного
                 изображения таблицы).
     ★★★          Данные    соответствуют     двум    звездам, плюс   представлены
                 в непроприетарном формате (например, в формате CSV вместо Excel-
                 формата).
  ★★★★           Данные соответствуют трем звездам, плюс представлены в открытых
                 стандартах консорциума W3C (RDF и SPARQL), предназначенных для
                 идентификации данных.
★★★★★            Данные соответствуют четырем звездам, плюс они связаны с другими
                 данными с учетом контекста их использования.
Источники: http://www.w3.org/DesignIssues/LinkedData.html, http://iradche.livejournal.com/8909.html
НИУ ВШЭ, Москва, 2012
                                                                                                      8
Динамика развития Linked Open Data

                         Темпы нарастания объемов фактов
 Количество
наборов LOD




                         2007           2008            2009              2010
                                                                                       Время

Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

НИУ ВШЭ, Москва, 2012
                                                                                               9
Пример использования LOD: проект DBpedia

      Проект DBpedia послужил главным толчком к развитию Linked Open Data.




         DBpedia — проект, направленный на извлечение структурированной
         информации из данных, собранных в рамках проекта Wikipedia.
Источник: http://dbpedia.org/About, http://wiki.dbpedia.org/Applications
 НИУ ВШЭ, Москва, 2012
                                                                           10
Области использования Linked Open Data

   Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей




                                                                                                       СМИ
                                                                                                 География
                                                                                               Публикации
                                                                                                   Созданный
                                                                                       пользователями контент
                                                                                   Государственные данные

                                                                          Междисциплинарные области
                                                                                            Науки о жизни
Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

НИУ ВШЭ, Москва, 2012
                                                                                                            11
Преимущества использования
                             Linked Open Data


              Связанность данных



              Доступность данных



              Машиночитаемость данных


НИУ ВШЭ, Москва, 2012
                                                     12
Стек Linked Open Data

                  Прикладной
                    уровень
                                                                                                 Интеграция
                                    Мэшапы                   Поисковые системы
                                                                                                  данных


                               Базы данных и публикация




                                                                                                             Лицензии открытых данных
                                                                          Запросы на SPARQL
                                        данных


                                                  Словари                       Онтологии

                               Обмен
                                RDF                      Идентификаторы URL


                                            Транспортный уровень: протокол HTTP
                        Элементы стека данных LOD – 2 мая 2011, лицензия CC BY-CA-NC
                        Автор Тим Дэвис                                              Источник: http://iradche.livejournal.com/9036.html
НИУ ВШЭ, Москва, 2012
                                                                                                                                        13
Следующий шаг: проект LOD2

                                           Развитие проекта LOD2
                                           при поддержке
                                           7 рамочной программы
                                           Европейского союза




Источник: http://lod2.eu/
 НИУ ВШЭ, Москва, 2012
                                                                   14
Стек разработок проекта LOD2

                                                      PoolParty – система
                                                                                  Sig.ma – инструментарий
                                                    управления тезаурусом
           OntoWiki – инструментарий                                            для разработки Веба Данных:
                                                  и редактирования контента
             для работы с моделью                                              RDF, RDFa или микроформатов
                                                 в рамках концепции Semantic
                  данных RDF                                                       (стандарт Веба Данных).
                                                   Web (включая Text Mining
                                                                               Sig.ma – браузер Semantic Web
                                                     и связанные данные).



                                                                               Dbpedia Extraction – получает
            Comprehensive Knowledge              D2R Server – инструментарий
                                                                                    структурированную
            Archive Network (CKAN) –                 для опубликования
                                                                                 информацию из Wikipedia
              каталог для наборов                 реляционных баз данных
                                                                               и делает ее машиночитаемой
                открытых данных                        в Semantic Web
                                                                                        и связанной



                                                                                 SemMF – инструментарий
                                                      MonetDB – система
                                                                                   для расчета схожести
          DL-Learner – инструментарий             управления базами данных,
                                                                                объектов, подвергающихся
          для мониторинга машинного                   поддерживающая
                                                                                       связыванию.
                обучения в OWL                    реляционные базы данных,
                                                                                  Представляет связанные
                                                      XML и RDF-данные
                                                                                объекты в виде RDF-графа


Источники: http://lod2.eu/, http://iradche.livejournal.com/9703.html
 НИУ ВШЭ, Москва, 2012
                                                                                                               15
Стек разработок проекта LOD2

             Silk Framework поддерживает
                                                      Sindice – инструментарий
                публикацию RDF-данных                                                   Sparallax – интерфейс
                                                     для объединения огромных
                     из разнородных                                                        для реализации
                                                     массивов связанных данных
             информационных источников.                                                   SPARQL-запросов,
                                                     в единое информационное
              Использует декларативный                                                       основанных
                                                            пространство
              язык Silk - Link Specification                                             на Freebase Parallax
                                                          связанных данных
                    Language (Silk-LSL)


                                                                                     The Web Information Quality
                                                      OpenLink Virtuoso – база
                                                                                    Assessment Framework (WIQA)
                                                         знаний и платформа
                                                                                          – инструментарий
             Triplify обеспечивает перевод                 виртуализации,
                                                                                    для аналитической обработки
                  данных в RDF-формат                  интегрирующая данные,
                                                                                        и фильтрации данных,
                                                     сервисы и бизнес-процессы
                                                                                      представляемых в рамках
                                                        в рамках предприятия
                                                                                      концепции Semantic Web



                                                                       LIMES – инструментарий
                                  Spatial Semantic Browers –
                                                                       для связывания данных
                                 приложение для просмотра
                                                                         в рамках концепции
                                  геоданных в формате RDF
                                                                            Semantic Web


Источники: http://lod2.eu/, http://iradche.livejournal.com/9703.html
 НИУ ВШЭ, Москва, 2012
                                                                                                                   16
Основные направления инициатив,
                         направленных на открытие науки

                            Открытие массивов научных данных



                          Создание электронных научных хранилищ
                             и профильных поисковых сервисов


                                 Разработка инструментов
                                  для совместной работы


                              Создание специализированных
                                научных социальных сетей
НИУ ВШЭ, Москва, 2012
                                                                  17
Примеры использования наборов
                           открытых данных в науке



                        Genome Commons (http://genomecommons.org/)
                        Хранилище связанных наборов данных из различных
                        источников: dbSNP, dbGaP, PharmGKB, GeneTests, OMIM,
                        MutationView и сотни специализированных баз данных.




                         TARDIS,
                         The Australian Repositories for Diffraction ImageS
                         (http://www.tardis.edu.au/)
                         Хранилище наборов данных по кристаллографии
                         и молекулярной биологии.



НИУ ВШЭ, Москва, 2012
                                                                              18
Примеры использования наборов
                           открытых данных в науке



                            Australian Social Science Data Archive
                            (http://www.assda.edu.au/)
                            Архив данных социальных наук Австралии.




                           Council of European Social Science Data Archives
                           (http://www.cessda.org/)
                           Архивы данных социальных наук
                           Европейского совета.


НИУ ВШЭ, Москва, 2012
                                                                       19
Примеры использования наборов
                           открытых данных в науке



                            National Radio Astronomy Observatory
                            (https://archive.nrao.edu/archive/)
                            Архив данных национальной
                            радиоастрономической обсерватории (США).




                            Social Science Data Archive
                            (http://dataarchives.ss.ucla.edu/)
                            Архив данных социальных наук (США).




НИУ ВШЭ, Москва, 2012
                                                                       20
Электронные научные хранилища
                        и профильные поисковые сервисы за рубежом


                                  JSTOR      ScienceDirect




                                 CiteSeerX      EBSCO




                                  Scopus      WorldCat



НИУ ВШЭ, Москва, 2012
                                                              21
Электронные научные хранилища
                        и профильные поисковые сервисы за рубежом


                               Google Books   Web of Science




                                              MS Academic
                               Open Library     Search




                                  Inspec          arXiv



НИУ ВШЭ, Москва, 2012
                                                               22
Электронные научные хранилища
                        и профильные поисковые сервисы в России


                               eLibrary       Math-Net.Ru




                            VINITI Database
                                  RAS         BookFinder




                                Руконт           eBdb



НИУ ВШЭ, Москва, 2012
                                                              23
Разработка инструментов
                        для совместной работы исследователей



                               Digital Science (http://www.digital-science.com/)
                               предоставляет программные продукты
                               для совместных научно-исследовательских работ.




                               Figshare (http://figshare.com/) предоставляет
                               исследователям следующие возможности:
                               • быстрая публикация результатов исследований;
                               • упрощенная процедура цитирования;
                               • совместное использование результатов
                                  заинтересованными исследователями.

                                      Лицензия: Creative commons
НИУ ВШЭ, Москва, 2012
                                                                            24
Разработка инструментов
                             для совместной работы исследователей




                                                                             Tools for the Citizen Scientist (NASA)
                                                                             Предоставляет
                                                                             программные продукты
                                                                             для совместных
                                                                             научно-исследовательских работ.




Источники: http://open.nasa.gov/plan/progress/, http://open.nasa.gov/plan/
  НИУ ВШЭ, Москва, 2012
                                                                                                            25
Создание специализированных
                          научных социальных сетей



                        Research Gate (http://www.researchgate.net/)
                        Социальная сеть для ученых всех научных дисциплин.




                        Research Gate (https://secure.quantiamd.com/)
                        Социальная сеть для врачей.




                        Sermo (http://www.sermo.com/)
                        Социальная сеть для врачей.

НИУ ВШЭ, Москва, 2012
                                                                        26
Создание специализированных
                           научных социальных сетей



                        MitCogNet (https://cognet.mit.edu/)
                        Социальная сеть для ученых, занимающихся
                        исследованиями мозга и мозговой деятельности.



                        BioMedExpert (http://www.biomedexperts.com/)
                        Социальная сеть для исследователей в области
                        биомедицины.



                        Social Science Research Network (http://www.ssrn.com/)
                        Социальная сеть для исследователей в области
                        социальных наук.
НИУ ВШЭ, Москва, 2012
                                                                          27
Открытые данные в науке (Open Data in Science)

Mais conteúdo relacionado

Mais procurados

Проблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми даннымиПроблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми данными
Irina Radchenko
 

Mais procurados (20)

Open Science
Open ScienceOpen Science
Open Science
 
Введение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данныхВведение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данных
 
Open Knowledge Foundation Russia
Open Knowledge Foundation RussiaOpen Knowledge Foundation Russia
Open Knowledge Foundation Russia
 
All colours-of-Open-Science
All colours-of-Open-ScienceAll colours-of-Open-Science
All colours-of-Open-Science
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data Journalism
 
Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism
 
Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)
 
Data journalism and Data Expeditions
Data journalism and Data ExpeditionsData journalism and Data Expeditions
Data journalism and Data Expeditions
 
Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?
 
Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)
 
Open Science concept in its implementation
Open Science concept in its implementationOpen Science concept in its implementation
Open Science concept in its implementation
 
Проблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми даннымиПроблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми данными
 
Open Data in Education and Science
Open Data in Education and ScienceOpen Data in Education and Science
Open Data in Education and Science
 
Open data in biology
Open data in biologyOpen data in biology
Open data in biology
 
Открытый доступ: роль библиотек
Открытый доступ:  роль библиотекОткрытый доступ:  роль библиотек
Открытый доступ: роль библиотек
 
Введение в дата-журналистику
Введение в дата-журналистикуВведение в дата-журналистику
Введение в дата-журналистику
 
Data journalism and open data educational projects
Data journalism and open data educational projectsData journalism and open data educational projects
Data journalism and open data educational projects
 
Введение в открытые данные
Введение в открытые данныеВведение в открытые данные
Введение в открытые данные
 
Open Science concept
Open Science conceptOpen Science concept
Open Science concept
 
Working with Open Data
Working with Open DataWorking with Open Data
Working with Open Data
 

Destaque

Open Data and Data Journalism in Russia
Open Data and Data Journalism in RussiaOpen Data and Data Journalism in Russia
Open Data and Data Journalism in Russia
Irina Radchenko
 

Destaque (11)

Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)
 
Open data aspects
Open data aspectsOpen data aspects
Open data aspects
 
How to visualize your datasets
How to visualize your datasetsHow to visualize your datasets
How to visualize your datasets
 
Open science platforms
Open science platformsOpen science platforms
Open science platforms
 
Open Data and Data Journalism in Russia
Open Data and Data Journalism in RussiaOpen Data and Data Journalism in Russia
Open Data and Data Journalism in Russia
 
Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects
 
Open transport data
Open transport dataOpen transport data
Open transport data
 
Open Science and Open Education
Open Science and Open EducationOpen Science and Open Education
Open Science and Open Education
 
Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)
 
Data Journalism at HSE conference
Data Journalism at HSE conferenceData Journalism at HSE conference
Data Journalism at HSE conference
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data Journalism
 

Semelhante a Открытые данные в науке (Open Data in Science)

Радченко И. Открытые биомедицинские данные
Радченко И. Открытые биомедицинские данныеРадченко И. Открытые биомедицинские данные
Радченко И. Открытые биомедицинские данные
bigdatabm
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данных
Irina Radchenko
 
Презентация авторского учебного пособия открытого дистанционного курса с испо...
Презентация авторского учебного пособия открытого дистанционного курса с испо...Презентация авторского учебного пособия открытого дистанционного курса с испо...
Презентация авторского учебного пособия открытого дистанционного курса с испо...
Oleksii Voronkin
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
Vladimir Krylov
 
Открытые данные и управление наукой (семинар в ИПРАН РАН)
Открытые данные и управление наукой (семинар в ИПРАН РАН)Открытые данные и управление наукой (семинар в ИПРАН РАН)
Открытые данные и управление наукой (семинар в ИПРАН РАН)
Elena Nikitina
 

Semelhante a Открытые данные в науке (Open Data in Science) (20)

Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)
 
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
 
Open Data
Open DataOpen Data
Open Data
 
Open Data for Government and University
Open Data for Government and UniversityOpen Data for Government and University
Open Data for Government and University
 
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
 
Радченко И. Открытые биомедицинские данные
Радченко И. Открытые биомедицинские данныеРадченко И. Открытые биомедицинские данные
Радченко И. Открытые биомедицинские данные
 
Open Data
Open DataOpen Data
Open Data
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данных
 
Introduction to Open Data
Introduction to Open DataIntroduction to Open Data
Introduction to Open Data
 
Презентация авторского учебного пособия открытого дистанционного курса с испо...
Презентация авторского учебного пособия открытого дистанционного курса с испо...Презентация авторского учебного пособия открытого дистанционного курса с испо...
Презентация авторского учебного пособия открытого дистанционного курса с испо...
 
Инструменты визуализации
Инструменты визуализацииИнструменты визуализации
Инструменты визуализации
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS)
 
Дата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsДата-экспедиции. Data Expeditions
Дата-экспедиции. Data Expeditions
 
Open Data Sharing
Open Data SharingOpen Data Sharing
Open Data Sharing
 
Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 
Открытые данные и управление наукой (семинар в ИПРАН РАН)
Открытые данные и управление наукой (семинар в ИПРАН РАН)Открытые данные и управление наукой (семинар в ИПРАН РАН)
Открытые данные и управление наукой (семинар в ИПРАН РАН)
 
Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...
 
Большие Данные
Большие ДанныеБольшие Данные
Большие Данные
 
Гражданская наука и открытые научные данные
Гражданская наука и открытые научные данныеГражданская наука и открытые научные данные
Гражданская наука и открытые научные данные
 

Mais de Irina Radchenko

Mais de Irina Radchenko (20)

Аналитик, данные и джаз
Аналитик, данные и джазАналитик, данные и джаз
Аналитик, данные и джаз
 
Open access as is
Open access as isOpen access as is
Open access as is
 
Как и где искать открытые данные?
Как и где искать открытые данные?Как и где искать открытые данные?
Как и где искать открытые данные?
 
Data expedition
Data expeditionData expedition
Data expedition
 
Data Expeditions Eduthon
Data Expeditions EduthonData Expeditions Eduthon
Data Expeditions Eduthon
 
Анализ 
и визуализация данных
Анализ 
и визуализация данныхАнализ 
и визуализация данных
Анализ 
и визуализация данных
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabus
 
Data journalist
Data journalistData journalist
Data journalist
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
 
FREYA project
FREYA projectFREYA project
FREYA project
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist
 
Вебинар по статистике
Вебинар по статистикеВебинар по статистике
Вебинар по статистике
 
Программа CATT
Программа CATTПрограмма CATT
Программа CATT
 
Open Data aspects
Open Data aspectsOpen Data aspects
Open Data aspects
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 
Open Data hackathons in Russia
Open Data hackathons in RussiaOpen Data hackathons in Russia
Open Data hackathons in Russia
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 
Open science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economyOpen science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economy
 
THOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open ResearchTHOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open Research
 
Open world and its enemies
Open world and its enemies Open world and its enemies
Open world and its enemies
 

Открытые данные в науке (Open Data in Science)

  • 1. Использование открытых данных в современных научных исследованиях Радченко Ирина Алексеевна, кандидат технических наук, доцент, научный сотрудник Центра семантических технологий НИУ ВШЭ http://about.me/Irina.Radchenko НИУ ВШЭ, Москва, 2012
  • 2. Что такое открытые данные? • Открытые данные — это концепция, заключающаяся в том, что данные должны быть свободно доступны для всех пользователей и пригодны для повторного использования без ограничений авторского права, патентов и других механизмов контроля. НИУ ВШЭ, Москва, 2012 2
  • 3. Открытые данные во временной перспективе Источник: http://visual.ly/open-data-movement НИУ ВШЭ, Москва, 2012 3
  • 4. Открытые наборы научных данных NASA CERN World Bank НИУ ВШЭ, Москва, 2012 4
  • 5. Пример использования открытых геоданных НИУ ВШЭ, Москва, 2012 5
  • 6. Открытые государственные данные за рубежом Цель: повысить открытость, доступность данных для граждан, способствовать распространению государственных данных в США: http://www.data.gov/ в Великобритании: http://www.utah.gov/data/ http://data.gov.uk/ http://data.octo.dc.gov/ http://data.london.gov.uk/ https://nycopendata.socrata.com/ http://www.govtrack.us/ в Канаде: http://openstates.org/ http://www.toronto.ca/open/ https://data.edmonton.ca/ в Австралии: http://data.nanaimo.ca/ http://data.gov.au/ http://data.vancouver.ca/ во Франции: в Швеции: http://www.data.gouv.fr/ http://www.opengov.se/data/ НИУ ВШЭ, Москва, 2012 6
  • 7. Пятизвездочная модель открытых данных по Тиму Бернерсу-Ли Источники: http://5stardata.info/, http://www.w3.org/DesignIssues/LinkedData.html НИУ ВШЭ, Москва, 2012 7
  • 8. Пятизвездочная модель открытых данных по Тиму Бернерсу-Ли ★ Данные доступны в Вебе (в любом формате), но подпадают под лицензию Открытых Данных (Open Data) — http://www.nationalarchives.gov.uk/doc/open-government-licence/. ★★ Данные доступны в качестве машинообрабатываемых структурированных данных (например, в виде Excel-таблицы вместо отсканированного изображения таблицы). ★★★ Данные соответствуют двум звездам, плюс представлены в непроприетарном формате (например, в формате CSV вместо Excel- формата). ★★★★ Данные соответствуют трем звездам, плюс представлены в открытых стандартах консорциума W3C (RDF и SPARQL), предназначенных для идентификации данных. ★★★★★ Данные соответствуют четырем звездам, плюс они связаны с другими данными с учетом контекста их использования. Источники: http://www.w3.org/DesignIssues/LinkedData.html, http://iradche.livejournal.com/8909.html НИУ ВШЭ, Москва, 2012 8
  • 9. Динамика развития Linked Open Data Темпы нарастания объемов фактов Количество наборов LOD 2007 2008 2009 2010 Время Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2012 9
  • 10. Пример использования LOD: проект DBpedia Проект DBpedia послужил главным толчком к развитию Linked Open Data. DBpedia — проект, направленный на извлечение структурированной информации из данных, собранных в рамках проекта Wikipedia. Источник: http://dbpedia.org/About, http://wiki.dbpedia.org/Applications НИУ ВШЭ, Москва, 2012 10
  • 11. Области использования Linked Open Data Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей СМИ География Публикации Созданный пользователями контент Государственные данные Междисциплинарные области Науки о жизни Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2012 11
  • 12. Преимущества использования Linked Open Data Связанность данных Доступность данных Машиночитаемость данных НИУ ВШЭ, Москва, 2012 12
  • 13. Стек Linked Open Data Прикладной уровень Интеграция Мэшапы Поисковые системы данных Базы данных и публикация Лицензии открытых данных Запросы на SPARQL данных Словари Онтологии Обмен RDF Идентификаторы URL Транспортный уровень: протокол HTTP Элементы стека данных LOD – 2 мая 2011, лицензия CC BY-CA-NC Автор Тим Дэвис Источник: http://iradche.livejournal.com/9036.html НИУ ВШЭ, Москва, 2012 13
  • 14. Следующий шаг: проект LOD2 Развитие проекта LOD2 при поддержке 7 рамочной программы Европейского союза Источник: http://lod2.eu/ НИУ ВШЭ, Москва, 2012 14
  • 15. Стек разработок проекта LOD2 PoolParty – система Sig.ma – инструментарий управления тезаурусом OntoWiki – инструментарий для разработки Веба Данных: и редактирования контента для работы с моделью RDF, RDFa или микроформатов в рамках концепции Semantic данных RDF (стандарт Веба Данных). Web (включая Text Mining Sig.ma – браузер Semantic Web и связанные данные). Dbpedia Extraction – получает Comprehensive Knowledge D2R Server – инструментарий структурированную Archive Network (CKAN) – для опубликования информацию из Wikipedia каталог для наборов реляционных баз данных и делает ее машиночитаемой открытых данных в Semantic Web и связанной SemMF – инструментарий MonetDB – система для расчета схожести DL-Learner – инструментарий управления базами данных, объектов, подвергающихся для мониторинга машинного поддерживающая связыванию. обучения в OWL реляционные базы данных, Представляет связанные XML и RDF-данные объекты в виде RDF-графа Источники: http://lod2.eu/, http://iradche.livejournal.com/9703.html НИУ ВШЭ, Москва, 2012 15
  • 16. Стек разработок проекта LOD2 Silk Framework поддерживает Sindice – инструментарий публикацию RDF-данных Sparallax – интерфейс для объединения огромных из разнородных для реализации массивов связанных данных информационных источников. SPARQL-запросов, в единое информационное Использует декларативный основанных пространство язык Silk - Link Specification на Freebase Parallax связанных данных Language (Silk-LSL) The Web Information Quality OpenLink Virtuoso – база Assessment Framework (WIQA) знаний и платформа – инструментарий Triplify обеспечивает перевод виртуализации, для аналитической обработки данных в RDF-формат интегрирующая данные, и фильтрации данных, сервисы и бизнес-процессы представляемых в рамках в рамках предприятия концепции Semantic Web LIMES – инструментарий Spatial Semantic Browers – для связывания данных приложение для просмотра в рамках концепции геоданных в формате RDF Semantic Web Источники: http://lod2.eu/, http://iradche.livejournal.com/9703.html НИУ ВШЭ, Москва, 2012 16
  • 17. Основные направления инициатив, направленных на открытие науки Открытие массивов научных данных Создание электронных научных хранилищ и профильных поисковых сервисов Разработка инструментов для совместной работы Создание специализированных научных социальных сетей НИУ ВШЭ, Москва, 2012 17
  • 18. Примеры использования наборов открытых данных в науке Genome Commons (http://genomecommons.org/) Хранилище связанных наборов данных из различных источников: dbSNP, dbGaP, PharmGKB, GeneTests, OMIM, MutationView и сотни специализированных баз данных. TARDIS, The Australian Repositories for Diffraction ImageS (http://www.tardis.edu.au/) Хранилище наборов данных по кристаллографии и молекулярной биологии. НИУ ВШЭ, Москва, 2012 18
  • 19. Примеры использования наборов открытых данных в науке Australian Social Science Data Archive (http://www.assda.edu.au/) Архив данных социальных наук Австралии. Council of European Social Science Data Archives (http://www.cessda.org/) Архивы данных социальных наук Европейского совета. НИУ ВШЭ, Москва, 2012 19
  • 20. Примеры использования наборов открытых данных в науке National Radio Astronomy Observatory (https://archive.nrao.edu/archive/) Архив данных национальной радиоастрономической обсерватории (США). Social Science Data Archive (http://dataarchives.ss.ucla.edu/) Архив данных социальных наук (США). НИУ ВШЭ, Москва, 2012 20
  • 21. Электронные научные хранилища и профильные поисковые сервисы за рубежом JSTOR ScienceDirect CiteSeerX EBSCO Scopus WorldCat НИУ ВШЭ, Москва, 2012 21
  • 22. Электронные научные хранилища и профильные поисковые сервисы за рубежом Google Books Web of Science MS Academic Open Library Search Inspec arXiv НИУ ВШЭ, Москва, 2012 22
  • 23. Электронные научные хранилища и профильные поисковые сервисы в России eLibrary Math-Net.Ru VINITI Database RAS BookFinder Руконт eBdb НИУ ВШЭ, Москва, 2012 23
  • 24. Разработка инструментов для совместной работы исследователей Digital Science (http://www.digital-science.com/) предоставляет программные продукты для совместных научно-исследовательских работ. Figshare (http://figshare.com/) предоставляет исследователям следующие возможности: • быстрая публикация результатов исследований; • упрощенная процедура цитирования; • совместное использование результатов заинтересованными исследователями. Лицензия: Creative commons НИУ ВШЭ, Москва, 2012 24
  • 25. Разработка инструментов для совместной работы исследователей Tools for the Citizen Scientist (NASA) Предоставляет программные продукты для совместных научно-исследовательских работ. Источники: http://open.nasa.gov/plan/progress/, http://open.nasa.gov/plan/ НИУ ВШЭ, Москва, 2012 25
  • 26. Создание специализированных научных социальных сетей Research Gate (http://www.researchgate.net/) Социальная сеть для ученых всех научных дисциплин. Research Gate (https://secure.quantiamd.com/) Социальная сеть для врачей. Sermo (http://www.sermo.com/) Социальная сеть для врачей. НИУ ВШЭ, Москва, 2012 26
  • 27. Создание специализированных научных социальных сетей MitCogNet (https://cognet.mit.edu/) Социальная сеть для ученых, занимающихся исследованиями мозга и мозговой деятельности. BioMedExpert (http://www.biomedexperts.com/) Социальная сеть для исследователей в области биомедицины. Social Science Research Network (http://www.ssrn.com/) Социальная сеть для исследователей в области социальных наук. НИУ ВШЭ, Москва, 2012 27