Зачем публиковать данные в GBIF и на других открытых ресурсах?
База данных нуклеотидов NCBI
Таксономическая база данных Catalogue of Life
OpenStreetMap
База данных малых космических тел JPL
Каталоги почтовых марок (например, www.stampworld.com)
Global Biodiversity Information Facility
Какие данные есть в GBIF?
Как растёт GBIF?
Охват GBIF: двойственность данных
Страны-лидеры: поставщики данных (1) и территориальность (2)
Что это даёт?
Важнейшие вводные пункты
Для чего?
Первый массив данных (18.09.2014)
Сеточное картирование флоры НП «Мещёра»
52 цитирования за 5 лет
Для чего?
Россия в свете данных GBIF
Россия как поставщик данных в GBIF
Korzhavina & Ivanenko (2019): 1362 записей о копеподах
«Большой скачок» в ноябре 2017 г.
Самый большой массив данных (2.11.2017)
Около 52 загрузок в день (среднее за 663 дня)
Что выгружают? Пример: чёрный саксаул
Что выгружают? Пример: диоскорея обыкновенная
Россия как игрок мирового рынка данных: примеры
Россия как игрок мирового рынка данных: примеры
Россия как игрок мирового рынка данных: примеры
Россия как игрок мирового рынка данных: примеры
Для чего?
Гербарий МГУ: 11-е место в мире по числу образцов в БД
Гербарий МГУ: 11-е место в мире по образцам с геопривязками
11 массивов данных и 106 цитирований у МГУ
МГУ в GBIF: 68% записей российских организаций
МГУ – лидер по данным для территории России
МГУ – лидер по данным среди российских организаций
Для чего?
Пример запроса материала для изучения ДНК
Ещё пример запроса материала
Право ещё одного голоса на МБК-2017 (КНР)
Для чего?
Гранты фонда Руффорда
Гранты фонда Руффорда
Гранты GBIF
Гранты РФФИ
Гранты РФФИ
Гранты РФФИ
Для чего?
Функция “Issues and flags”
Функция “Issues and flags”: перепутаны высоты
Жёлтая метка “Elevation min/max swapped”
Оригинальная этикетка как источник неточности
Функция “Issues and flags”: перепутаны координаты
Жёлтая метка “Presumed swapped coordinate”
Оригинальная этикетка как источник неточности
Функция “Issues and flags”: координаты есть, но страна не указана
Жёлтая метка “Country derived from coordinates”
Оригинальная этикетка
Причина: особенности системы автоматической геопривязки
Функция “Issues and flags”: координаты есть, но не попадают в заявленную страну
Жёлтая метка “Country coordinate mismatch”
Оригинальная этикетка как источник ошибки
Для чего?
Сводная таблица изменений в данных
Гербарий МГУ: статистика по странам
Гербарий МГУ: статистика по видам
Гербарий МГУ: статистика по странам и месяцам
Гербарий МГУ: статистика по гербарным образцам из Мали
Для чего?
Цифровой гербарий МГУ (http://plant.depo.msu.ru/)
Сеточное картирование флоры Владимирской области
GBIF-страница массива данных по флоре Владимирской обл.
Рамка на карте – список видов из квадрата “И12”
К флоре юго-востока Владимирской области (Васюков, 2015)
Рамка на карте – список видов из квадрата “О12”
Для чего?
Цифровизация
Концентрация
Глобализация
Универсализация
Универсализация
Универсализация
Современный учебный процесс
Для чего?
iNaturalist
iNaturalist и ИИ
Искусственный интеллект определяет растения по фото
П. Перона
Искусственный интеллект берёт геоданные!
iNaturalist берёт геоданные из GBIF
Искусственный интеллект определяет растения по фото и геоданным
Не забывайте!
Как растёт GBIF?
iNaturalist в GBIF: два определения + свободная лицензия
«Флора России» на iNaturalist: 12 января 2019 г.
«Флора России» на iNaturalist: 27 августа 2019 г.
«Флора России» на iNaturalist
iNaturalist в GBIF
iNaturalist в GBIF (сосудистые растения)
МГУ и iNaturalist
Для чего?
Один в поле – воин: сосудистые растения на карте GBIF
Давайте ещё раз задумаемся: что это даёт?
35.49M
Categories: biologybiology informaticsinformatics

Зачем публиковать данные в GBIF и на других открытых ресурсах?

1. Зачем публиковать данные в GBIF и на других открытых ресурсах?

Опыт Цифрового гербария МГУ:
выгоды для научного сообщества и
для отдельных исследователей
А.П. Серёгин, д.б.н.,
в.н.с. Гербария МГУ
«Разнообразие почвенных животных России:
публикация и эффективное использование
исходных данных» (Москва, ИПЭЭ РАН, 29-30

2. База данных нуклеотидов NCBI

3. Таксономическая база данных Catalogue of Life

4. OpenStreetMap

5. База данных малых космических тел JPL

6. Каталоги почтовых марок (например, www.stampworld.com)

7. Global Biodiversity Information Facility

8. Какие данные есть в GBIF?

9. Как растёт GBIF?

10. Охват GBIF: двойственность данных

11. Страны-лидеры: поставщики данных (1) и территориальность (2)

United States of America 485,969,283
United Kingdom
93,514,957
Sweden
88,091,042
Australia
81,817,453
France
65,602,823
Canada
64,859,047
Netherlands
58,002,542
Germany
45,994,918
Norway
45,423,775
Belgium
38,847,999
Spain
37,409,154
Denmark
31,395,338
Finland
28,639,159
South Africa
25,818,716
Mexico
12,938,722
India
12,161,701
Brazil
11,758,320
Colombia
10,345,908
Costa Rica
9,651,135
(1)
United States of America 457,831,294
Sweden
86,101,708
Australia
84,714,711
Canada
70,624,998
United Kingdom
68,368,416
France
58,842,049
Netherlands
49,144,910
Norway
45,322,548
Germany
37,870,863
Spain
37,691,734
Belgium
35,313,400
Denmark
30,823,580
Finland
28,556,259
South Africa
25,297,658
Mexico
17,193,444
Brazil
14,288,290
India
13,244,381
Costa Rica
11,380,299
Colombia
8,150,105
(2)

12. Что это даёт?

миру?
стране?
университету?
гербарию?
мне?
обществу?

13. Важнейшие вводные пункты

1. Наша страна самая большая в мире.
2. Никогда не оправдывайтесь этим.
3. Просто мы будем больше всех в мире
работать. Почему? См. пункт 1.

14. Для чего?

1. Для научного использования

15. Первый массив данных (18.09.2014)

16. Сеточное картирование флоры НП «Мещёра»

2002 г.
Fragaria vesca
Серегин, 2004
Серегин, 2013
2012 г.

17. 52 цитирования за 5 лет

The global biogeography of polyploid plants
Rice, A. Šmarda, P. Novosolov, M. Drori, M. Glick, L. Sabath, N. ... (2019) Nature Ecology & Evolution
Biotic resistance or introduction bias? Immigrant plant
performance decreases with residence times over
millennia
Sheppard, C. Schurr, F. (2018) Global Ecology and Biogeography
Predicting plant conservation priorities on a global scale
Pelletier, T. Carstens, B. Tank, D. Sullivan, J. Espíndola, A. (2018)
Proceedings of the National Academy of Sciences
The future of hyperdiverse tropical ecosystems
Barlow, J. França, F. Gardner, T. Hicks, C. Lennox, G. Berenguer, E. ...
- (2018) Nature

18. Для чего?

2. Для национального престижа

19. Россия в свете данных GBIF

20. Россия как поставщик данных в GBIF

21. Korzhavina & Ivanenko (2019): 1362 записей о копеподах

Korzhavina & Ivanenko (2019):
1362 записей о копеподах

22. «Большой скачок» в ноябре 2017 г.

23. Самый большой массив данных (2.11.2017)

24. Около 52 загрузок в день (среднее за 663 дня)

25. Что выгружают? Пример: чёрный саксаул

26. Что выгружают? Пример: диоскорея обыкновенная

27. Россия как игрок мирового рынка данных: примеры

Казахстан

28. Россия как игрок мирового рынка данных: примеры

Монголия

29. Россия как игрок мирового рынка данных: примеры

Латвия

30. Россия как игрок мирового рынка данных: примеры

Мали

31. Для чего?

3. Для академической
репутации

32. Гербарий МГУ: 11-е место в мире по числу образцов в БД

The vascular plants collection (P) at the Herbariu…
5,426,095
MEL AVH data
5,071,904
Naturalis Biodiversity Center (NL) - Botany
4,824,298
Tropicos Specimen Data
4,668,829
The New York Botanical Garden Herbarium (NY)
3,266,213
NMNH Extant Specimen Records
2,952,134
Meise Botanic Garden Herbarium (BR)
1,424,986
PRECIS
1,117,942
Harvard University Herbaria: All Records
1,060,214
Phanerogamic Botanical Collections (S)
1,018,284
Moscow University Herbarium (MW)
1,001,832
EURISCO, The European Genetic Resources Search Cat… 956,422
Royal Botanic Gardens, Kew - Herbarium Specimens
921,988
Lund Botanical Museum (LD)
911,304
Royal Botanic Garden Edinburgh Herbarium (E)
866,672
Herbarium specimens of Université de Montpellier 2…
856,341
CSIC-Real Jardín Botánico-Colección de Plantas Vas…
760,400
RB - Rio de Janeiro Botanical Garden Herbarium Col…
728,839
Vascular Plant Herbarium, Oslo (O)
691,146
Natural History Museum (London) Collection Specime… 682,567

33. Гербарий МГУ: 11-е место в мире по образцам с геопривязками

MEL AVH data
Tropicos Specimen Data
Naturalis Biodiversity Center (NL) - Botany
The New York Botanical Garden Herbarium (NY)
PRECIS
Lund Botanical Museum (LD)
Vascular Plant Herbarium, Oslo (O)
Field Museum of Natural History (Botany) Seed Pla…
NMNH Extant Specimen Records
BRI AVH data
Moscow University Herbarium (MW)
Finnish Floristic Database (Finnish Museum of Natu…
Plantae of Costa Rica (INBio)
Natural History Museum (London) Collection Specime…
OEH Atlas of NSW Wildlife
Vascular plant specimens of National Museum of Nat…
The vascular plants collection (P) at the Herbariu…
CSIC-Real Jardín Botánico-Colección de Plantas Vas…
Royal Botanic Gardens, Kew - Herbarium Specimens
R. L. McGregor Herbarium Vascular Plants Collectio…
4,667,925
3,125,919
1,488,255
1,021,598
903,698
871,034
584,762
554,080
512,474
500,208
412,188
397,381
351,417
332,557
328,787
308,427
304,971
278,013
251,446
244,332

34. 11 массивов данных и 106 цитирований у МГУ

35. МГУ в GBIF: 68% записей российских организаций

36. МГУ – лидер по данным для территории России

Moscow University Herbarium (MW)
iNaturalist Research-grade Observations
Geographically tagged INSDC sequences
EOD - eBird Observation Dataset
A grid-based database on vascular plant distributi…
EBCC Atlas of European Breeding Birds
A global database for the distributions of crop wi…
Arctic Ocean Diversity
Birds of Northern Eurasia
Paleobiology Database
EURISCO, The European Genetic Resources Search Cat…
Estonian University of Life Sciences
CRIS data set
Birds and Mammals Collections of the Zoological Mu…
Phytoplankton from the White Sea, Barents Sea, Nor…
International Barcode of Life project (iBOL)
Amphibians of the Former USSR
A grid-based database on vascular plant distributi…
Natural History Museum, University of Tartu
MICROBIS database
645,328
199,510
195,631
171,034
123,054
80,923
69,255
62,945
62,749
60,192
53,495
51,719
44,862
40,189
37,325
33,996
32,561
31,669
31,519
29,841

37. МГУ – лидер по данным среди российских организаций

Moscow University Herbarium (MW)
EOD - eBird Observation Dataset
A grid-based database on vascular plant distributi…
Birds of Northern Eurasia
Birds and Mammals Collections of the Zoological Mu…
CRIS data set
Amphibians of the Former USSR
Raptors of the World
A grid-based database on vascular plant distributi…
Phenological observations of biota on the territor…
A grid-based database on vascular plant distributi…
Flora of the Volga River basin
The Myxomycetes Collection at the V. L. Komarov Bo…
Vascular plants of the Amur River Basin, Russia: s…
Fungal records database of Khanty-Mansi Autonomous…
Occurrences of the invasive plant species Heracleu…
Long-term dynamics of Collembola communities in a …
ZMMU MSU, White Sea Branch
Ophiuroidea collections of the Zoological Institut…
Occurrence Data of Vascular Plants from Abandoned …
1,002,033
171,034
123,054
65,917
54,120
54,054
52,474
36,928
31,669
24,358
22,625
20,389
12,828
12,371
11,779
10,894
10,475
8,840
8,693
8,077

38. Для чего?

4. Для активизации
сотрудничества

39. Пример запроса материала для изучения ДНК

40. Ещё пример запроса материала

41. Право ещё одного голоса на МБК-2017 (КНР)

42. Для чего?

5. Для привлечения
финансирования

43. Гранты фонда Руффорда

44. Гранты фонда Руффорда

45. Гранты GBIF

46. Гранты РФФИ

47. Гранты РФФИ

48. Гранты РФФИ

49. Для чего?

6. Для чистки данных

50. Функция “Issues and flags”

51. Функция “Issues and flags”: перепутаны высоты

52. Жёлтая метка “Elevation min/max swapped”

53. Оригинальная этикетка как источник неточности

54. Функция “Issues and flags”: перепутаны координаты

55. Жёлтая метка “Presumed swapped coordinate”

56. Оригинальная этикетка как источник неточности

57. Функция “Issues and flags”: координаты есть, но страна не указана

58. Жёлтая метка “Country derived from coordinates”

59. Оригинальная этикетка

60. Причина: особенности системы автоматической геопривязки

61. Функция “Issues and flags”: координаты есть, но не попадают в заявленную страну

62. Жёлтая метка “Country coordinate mismatch”

63. Оригинальная этикетка как источник ошибки

64. Для чего?

7. Чтобы иметь полноценную
актуальную статистику

65. Сводная таблица изменений в данных

66. Гербарий МГУ: статистика по странам

67. Гербарий МГУ: статистика по видам

68. Гербарий МГУ: статистика по странам и месяцам

69. Гербарий МГУ: статистика по гербарным образцам из Мали

70. Для чего?

8. Чтобы не тратиться на свой
портал

71. Цифровой гербарий МГУ (http://plant.depo.msu.ru/)

Поддержка портала и постоянная заливка
новых данных стоят 350 000 рублей в год

72. Сеточное картирование флоры Владимирской области

Frangula alnus
Серегин, 2012
Серегин, 2014

73. GBIF-страница массива данных по флоре Владимирской обл.

74. Рамка на карте – список видов из квадрата “И12”

75. К флоре юго-востока Владимирской области (Васюков, 2015)

76. Рамка на карте – список видов из квадрата “О12”

77. Для чего?

9. Чтобы не отстать от
прогресса

78. Цифровизация

В мире – 387 500 000 гербарных образцов (физически) (Thiers, 2019)
В GBIF – 75 000 000 гербарных образцов (в виде электронных записей)
Это 19,4%

79. Концентрация

80. Глобализация

Поисковые системы в мире: лидеры

81. Универсализация

Париж
Кью
Нью-Йорк
Москва

82. Универсализация

Париж
Кью
Нью-Йорк
Москва

83. Универсализация

NY00247926
P00747877
K000464620
MW0734831

84. Современный учебный процесс

85. Для чего?

10. Чтобы учить искусственный
интеллект определять растения
и животные по фотографиям

86. iNaturalist

87. iNaturalist и ИИ

88. Искусственный интеллект определяет растения по фото

89. П. Перона

90. Искусственный интеллект берёт геоданные!

91. iNaturalist берёт геоданные из GBIF

92. Искусственный интеллект определяет растения по фото и геоданным

93. Не забывайте!

«У каждого из вас в кармане
суперкомпьютер!»
(В. Благодеров, National Museums Scotland)

94. Как растёт GBIF?

95. iNaturalist в GBIF: два определения + свободная лицензия

96. «Флора России» на iNaturalist: 12 января 2019 г.

97. «Флора России» на iNaturalist: 27 августа 2019 г.

98. «Флора России» на iNaturalist

99. iNaturalist в GBIF

100. iNaturalist в GBIF (сосудистые растения)

101. МГУ и iNaturalist

Moscow University Herbarium (MW)
iNaturalist Research-grade Observations
Geographically tagged INSDC sequences
EOD - eBird Observation Dataset
A grid-based database on vascular plant distributi…
EBCC Atlas of European Breeding Birds
A global database for the distributions of crop wi…
Arctic Ocean Diversity
Birds of Northern Eurasia
Paleobiology Database
EURISCO, The European Genetic Resources Search Cat…
Estonian University of Life Sciences
CRIS data set
Birds and Mammals Collections of the Zoological Mu…
Phytoplankton from the White Sea, Barents Sea, Nor…
International Barcode of Life project (iBOL)
Amphibians of the Former USSR
A grid-based database on vascular plant distributi…
Natural History Museum, University of Tartu
MICROBIS database
645,328
199,510
195,631
171,034
123,054
80,923
69,255
62,945
62,749
60,192
53,495
51,719
44,862
40,189
37,325
33,996
32,561
31,669
31,519
29,841

102. Для чего?

Вместо заключения

103. Один в поле – воин: сосудистые растения на карте GBIF

104. Давайте ещё раз задумаемся: что это даёт?

миру?
стране?
университету?
гербарию?
мне?
обществу?
English     Русский Rules