Уже шесть дней идёт квалификация Командного кубка «Флоры России» 2024 года. За эти дни 158 человек отметились зачётными наблюдениями. В пяти регионах число участников превысило 10 человек. Если вы ничего не знаете о Кубке, то, во-первых, ещё не поздно присоединиться, а, во-вторых, самое время внимательно прочитать правила квалификации.
В 2019, 2020 и 2021 годах наш Кубок также проводился в командном формате. Ненадолго ему на смену (2022 и 2023 гг.) пришёл вариант с личным зачётом. В этом году мы возвращаемся к захватывающему командному зачёту и парным поединкам навылет. Участникам доступен видеообзор прошлых кубков.
Если бы итоги подводились сегодня, то квалификационный раунд прошли бы 16 регионов (помечены *) со следующими результатами:
Место
Регион
Наблюдений
Участников
1
* Chuvash
1572
14
2
* Moskovskaya Oblast
1405
14
3
* Irkutsk
1239
5
4
* Krasnodar
1051
7
5
* Penza
852
15
6
* Moscow City
667
14
7
* Tula
608
11
8
* Saratov
515
6
9
* City of St. Petersburg
505
9
10
* Tyumen'
461
5
11
* Sverdlovsk
279
4
12
Sakha
266
1
13
* Crimea
263
2
14
* Leningrad Oblast
253
5
15
* Voronezh
250
3
16
* Kaliningrad
231
2
17
* Yaroslavl'
218
3
18
Bryansk
188
2
19
Kamchatka
188
3
20
Tomsk
183
1
21
Vladimir
180
4
22
Chelyabinsk
173
5
23
Samara
150
3
24
Primor'ye
150
5
25
Omsk
139
4
26
Rostov
110
1
27
Dagestan
99
3
28
Kalmyk
80
2
29
Khanty-Mansiy
79
2
30
Krasnoyarsk
77
3
31
Kostroma
74
2
32
Kemerovo
71
1
33
Zabaykal'ye
70
1
34
Volgograd
62
1
35
Stavropol'
61
1
36
Tver'
44
2
37
Ryazan'
32
1
38
Sakhalin
32
1
39
Lipetsk
26
3
40
Perm'
16
1
41
Altay
16
2
42
Kursk
14
1
43
Novosibirsk
14
2
44
Kaluga
4
1
45
Arkhangel'sk
2
1
46
Ul'yanovsk
2
1
47
Ivanovo
1
1
48
Khabarovsk
1
1
49
Mariy-El
1
1
50
Mordovia
1
1
Пока квалификационный порог преодолели 23 региона. Где-то не хватает участников (всего один, а нужно не менее двух), а где-то наблюдений (нужно не менее 100). Так, в 18 регионах зачётные наблюдения сделал всего один участник, а в 24 регионах сделано менее ста наблюдений. Кубок имеют статус командного, так что участникам-одиночкам обязательно нужно найти напарников из своего региона.
Напомню, что по итогам квалификации (в зависимости от числа регионов, преодолевших квалификационный порог) дальше пройдёт 16, 32 или даже 64 региона.
Задача квалификации: выявить регионы с активными сообществами, в спокойной обстановке познакомить между собой потенциальных участников региональных команд и дать время на подключение к Кубку новичков iNaturalist и тех, кто о Кубке ещё ничего не знает. Квалификация пройдёт до 23 июня включительно.
В связи с началом лета мы увеличили копилку "Флоры России" - теперь в ней собраны данные по 700 видам-кандидатам. Напомним, что теперь модель компьютерного зрения дополняется новыми видами ежемесячно.
В общем, здесь мы добавляем данные по видам, которые нейронная сеть пока не узнает. Цель для каждого вида: не менее 100 фотографий и (при этом) не менее 60 наблюдений, половина из которых определена сообществом. Изучайте карту, ищите растения из ваших мест, делайте их фотографии в природе и загружайте на iNaturalist!
Раз в месяц виды, достигшие формальных порогов, добавляются в модель. Присоединяйтесь!
Уже три дня идёт квалификация Командного кубка «Флоры России» 2024 года. Правила квалификации опубликованы ранее.
В 2019, 2020 и 2021 годах наш Кубок также проводился в командном формате. Ненадолго ему на смену (2022 и 2023 гг.) пришёл вариант с личным зачётом. В этом году мы возвращаемся к захватывающему командному зачёту и парным поединкам навылет. Участникам доступен видеообзор прошлых кубков.
Если бы итоги подводились сегодня, то были бы вот такие результаты квалификационного раунда:
Место
Регион
Наблюдений
Участников
1
Moskovskaya Oblast
628
8
2
Krasnodar
565
5
3
Penza
424
11
4
Chuvash
423
5
5
Irkutsk
349
4
6
Moscow City
316
8
7
Tula
310
8
8
Saratov
204
4
9
Leningradskaya Oblast
186
2
10
Bryansk
169
1
11
Tomsk
169
1
12
Samara
145
3
13
Tyumen'
126
3
14
Kaliningrad
122
2
15
Yaroslavl'
109
2
16
City of St. Petersburg
108
5
17
Kamchatka
105
3
18
Vladimir
91
2
19
Omsk
67
3
20
Chelyabinsk
63
4
21
Sakha
63
1
22
Voronezh
59
2
23
Khanty-Mansiy
52
2
24
Volgograd
48
1
25
Krasnoyarsk
37
3
26
Primor'ye
22
4
27
Lipetsk
22
2
28
Rostov
22
1
29
Zabaykal'ye
21
1
30
Sakhalin
16
1
31
Ryazan'
10
1
32
Perm'
7
1
33
Dagestan
4
1
34
Novosibirsk
3
1
35
Sverdlovsk
2
1
36
Arkhangel'sk
1
1
37
Kursk
1
1
38
Tver'
1
1
Пока квалификационный порог преодолели 15 регионов. Где-то не хватает участников (всего один, а нужно не менее двух), а где-то наблюдений (нужно не менее 100). Самое время отважным участникам-одиночкам позвать на подмогу других наблюдателей из своего региона.
Напомню, что по итогам квалификации (в зависимости от числа регионов, преодолевших квалификационный порог) дальше пройдёт 16, 32 или даже 64 региона.
Задача квалификации: выявить регионы с активными сообществами, в спокойной обстановке познакомить между собой потенциальных участников региональных команд и дать время на подключение к Кубку новичков iNaturalist и тех, кто о Кубке ещё ничего не знает. Квалификация пройдёт до 23 июня включительно.
Сегодня начинается квалификация Командного кубка «Флоры России» 2024 года. Правила квалификации опубликованы. В 2019, 2020 и 2021 годах наш Кубок также проводился в командном формате. Ненадолго ему на смену (2022 и 2023 гг.) пришёл вариант с личным зачётом. В этом году мы возвращаемся к захватывающему командному зачёту и парным поединкам навылет. Рекомендуем посмотреть видеообзор прошлых кубков.
К утру 27 мая 2024 года для участия в квалификации зарегистрировалось 90 участников из 58 регионов! Из большинства областей, краёв и республик пока всего по одному участнику, так что без взаимного информирования друзей, коллег и единомышленников никак не обойтись. Опыт прошлых лет показывает, что команда (и командная тактика) - это залог успешного участия в Кубке.
Квалификация - это чрезвычайно важный этап. Её итоги совершенно непредсказуемы, поэтому ближайшие четыре недели участникам предстоит выложиться по полной программе!
Сколько команд пройдёт дальше? Неизвестно! Может быть 4, может быть 8, а может 16, 32 или даже 64! Например, если квалификационные пороги выполнит семь регионов, то дальше пройдёт только четыре, а остальные три останутся с носом. При этом живое онлайн-табло отсутствует и только по карте и запросам через фильтр можно примерно прикинуть, в каких регионах сколько наблюдений и сколько участников.
Когда можно присоединиться к квалификации? Хоть в последний день - 23 июня 2024 года. Тогда все наблюдения сосудистых растений, сделанные вами в России за последние четыре недели, автоматически войдут в статистику квалификации. Это может в последний момент заметно изменить расклад по командам, которые проходят дальше, так что квалификацию каждому из участников нужно отработать как следует.
Узнал о Кубке случайно - мне не пришло уведомление проекта "Флора России". Такое бывает. Из-за нагрузки на серверы уведомления проектов иногда не приходят даже подписчикам. Прежде всего, проверьте, подписаны ли вы на проект "Флора России". Также вы можете подписаться здесь на персональные уведомления журнала. И обязательно скиньте информацию о Кубке своим знакомым, кого это может заинтересовать.
Что делать, если из моего региона всего один участник (я сам)? Кубок проводится в командном формате, поэтому вам нужен как минимум второй участник. Посмотрите по статистике региональных проектов портала "Флора России", кто в вашем регионе активно занимается фотодокументацией флоры и напишите ему (ей). Возможно, у вас замечательный организационный талант, но вы об этом просто не знаете.
Я совсем не знаю растений. Стоит ли мне принимать участие? Да, конечно. С чего-то ведь надо начинать! Сосудистые растения - это самая доступная для фотонаблюдений группа живых организмов. Они не бегают, не прыгают, не летают, не прячутся, не кусаются. Их можно сфотографировать с разных ракурсов, получить надёжную подсказку системы компьютерного зрения, а затем и мнение экспертов.
Сейчас я дома, а летом уеду на море. Пролетаю мимо Кубка. Что ж, думаю вы хотите, чтобы ваш домашний регион прошёл в основную сетку соревнований? Так что квалификация стоит вашего внимания. А активные команды Краснодарского края, Крыма, Дагестана и Севастополя сделают всё возможное, чтобы дождаться вашей помощи, например, в августовском полуфинале. В общем, один человек в разных кругах может делать наблюдения в разных регионах.
Завтра начинается квалификация Командного кубка «Флоры России» 2024 года. Правила квалификации опубликованы накануне.
В 2019, 2020 и 2021 годах наш Кубок также проводился в командном формате. Ненадолго ему на смену (2022 и 2023 гг.) пришёл вариант с личным зачётом. В этом году мы возвращаемся к захватывающему командному зачёту и парным поединкам навылет.
Два года назад состоялся брифинг перед стартом личного кубка 2022 года. В нём я подробно рассказал о том, как проводился Командный кубок. Сегодня отличный повод пересмотреть этот ролик! Всего 12 минут короткой истории поможет новичкам получить правильное представление о наших соревнованиях, а опытным участникам вспомнить формат и заслуженных победителей прошлых лет.
Напоминаю, что завтра начинается квалификационная часть Кубка. Она продлится ровно четыре недели: наблюдения должны быть сделаны в природе с 27 мая по 23 июня 2024 года. Внимательно читайте правила.
В этом году кубок «Флоры России» 2024 пройдёт в командном формате. Мы возвращаемся к формату 2019, 2020 и 2021 гг., когда сражались региональные команды. Однако будет несколько существенных нововведений.
Итоги 2019 года:
(1) Брянская область
(2) Омская область
(3) Ярославская область
Итоги 2020 года:
(1) Севастополь
(2) Курская область
(3) Тульская область
Итоги 2021 года:
(1) Республика Крым
(2) Курская область
(3) Брянская область
Предполагается, что по результатам квалификационного раунда, сетку составят 4, 8, 16, 32 или 64 региональные команды.
ПРАВИЛА КВАЛИФИКАЦИИ
(1) Потенциальному участнику региональной команды необходимо стать подписчиком проекта "Кубок - 2024: квалификация" (https://www.inaturalist.org/projects/kubok-2024-kvalifikatsiya) и загружать наблюдения дикорастущих растений России на платформу iNaturalist.
(2) Квалификационными наблюдениями считаются наблюдения сосудистых растений "Исследовательского уровня" и уровня "Требуется индентификация" от подписчиков проекта "Кубок - 2024: квалификация". Наблюдения должны быть сделаны в природе с 27 мая по 23 июня 2024 года.
(3) Региональная команда считается выполнившей квалификационный порог, если в регионе делают наблюдения не менее двух участников (наблюдателей), а число наблюдений в проекте "Кубок - 2024: квалификация" из этого региона превысит 100 штук. Итоговая выгрузка статистики будет произведена 24 июня 2024 года около 8 утра по Москве.
(4) Если число региональных команд, выполнивших квалификационный порог:
будет от 0 до 3, то Кубок в 2024 году не проводится;
будет от 4 до 7, то Кубок начнется с 1/2 финала (проходят первые 4 команды по числу наблюдений);
будет от 8 до 15, то Кубок начнется с 1/4 финала (проходят первые 8 команд по числу наблюдений);
будет от 16 до 31, то Кубок начнется с 1/8 финала (проходят первые 16 команд по числу наблюдений);
будет от 32 до 63, то Кубок начнется с 1/16 финала (проходят первые 32 команды по числу наблюдений);
будет свыше 64, то Кубок начнется с 1/32 финала (проходят первые 64 команды по числу наблюдений).
Дополнительную информацию по Командным кубкам 2019, 2020 и 2021 гг. можно посмотреть по ссылке: https://www.inaturalist.org/posts/88437 в календаре проекта. Регламент Кубка будет опубликован по итогам квалификации, будет существенно доработан по сравнению с прошлыми розыгрышами, но кардинальных изменений не планируется.
Предварительные окна для проведения кругов Командного кубка:
29 - 30 июня
6 - 7 июля
10 - 11 августа
17 - 18 августа
ЗАЧЕМ ЭТО НУЖНО?
Мотивация участников командного кубка «Флора России» - 2024 может быть разнообразной, но для каждого участника совершенно особенной. Она включает в себя несколько аспектов.
Соревновательный дух: участие в кубке может стать возможностью для команд проявить свои знания, навыки и опыт в области изучения флоры России. Это может быть интересным и увлекательным соревнованием, которое позволит участникам проверить свои способности и сравнить их с другими командами.
Общение с природой: один на один со степью, поймой или лесом. В компании единомышленников. Или вдвоем с собакой. Не важно, где вы и с кем, но точно не в душном летнем городе.
Научное и образовательное значение: кубок может предоставить участникам возможность расширить свои знания о флоре России, узнать новые факты и интересные детали о растениях. Это может способствовать развитию научного интереса и повышению уровня образования участников.
Возможность поделиться опытом: участники кубка могут обменяться опытом, знаниями и идеями друг с другом. Это может создать атмосферу сотрудничества и взаимопомощи, что также является мотивацией для участия.
Поддержка сообщества: участие в командном кубке может дать участникам ощущение принадлежности к сообществу людей, интересующихся флорой России. Поддержка и взаимодействие с единомышленниками также могут быть мотивацией для активного участия в мероприятии.
Развитие навыков: участие в кубке требует от участников развития определённых навыков, таких как анализ данных, работа с информацией, коммуникация и сотрудничество. Эти навыки могут быть полезными не только в рамках кубка, но и в повседневной жизни.
Интерес к ботанике: изучение флоры России может быть увлекательным и познавательным занятием. Участие в кубке позволяет участникам углубиться в эту тему и получить удовольствие от процесса исследования.
Повышение самооценки: успешное участие в кубке и достижение хороших результатов может повысить самооценку участников и дать им уверенность в своих способностях.
Рейтинг за год: в январе мы вручаем сертификаты 500 наиболее активным подписчикам проекта "Флора России" за истекший год. Активное участие в кубке поможет легко набрать достаточное число наблюдений в дружеской обстановке наших соревнований.
На счётчике сегодня новая круглая отсечка: 3 400 000 наблюдений в проекте "Флора России"! Для очередных 50 тыс. наблюдений нашему сообществу потребовалось 16 дней (в прошлый раз на 50 тысяч ушло 15 дней). За последние 16 дней число наблюдателей флоры России выросло сразу на 565 человек, а число выявленных и подтверждённых видов выросло на 6 таксонов в условиях активной чистки номенклатуры.
We've got another milestone on the counter - 3,400,000 observations in the "Flora of Russia" project! For the 50-thousandth mark, our community spent 16 days (comparing to 15 days for previous 50K). During last 16 days, the number of observers of the flora of Russia increased by 565 folks. We've got 6 new identified and confirmed species in line with an active cleaning of nomenclature.
За последние 16 дней сразу 1854 человека из 26,5 тыс. наблюдателей смогли выйти на улицу, сделать хотя бы одно наблюдение в природе и загрузить его на iNaturalist. В этот раз доля свежих полевых наблюдений составила 73% (против 27%, поступивших из архивов пользователей или вытащенных экспертами из бэклога).
Over the past 16 days, 1854 people have been able to go outside, make at least a single observation in nature and upload it to iNaturalist. This time, the share of fresh field observations was 73% versus 27% that came from archives or pulled by the experts from the backlog.
Давайте снова зафиксируем статистику для истории.
3 400 000 наблюдений наш проект достиг 21 мая 2024 г. около 16:00 MSK.
The project reached 3,400,000 observations in May 21, 2024 at 16:00 MSK.
С прошлого стандартного замера проект вырос на 49,8 тыс. наблюдений, а антипроект вырос на 11,2 тыс. наблюдений. Такой рост бэклога будет наблюдаться всё лето. На сегодняшний день доля неопределенных материалов по флоре России составила 12,72% (в прошлый раз было 12,63%). В общем, если вы планировали размещать свои большие многолетние архивы на iNaturalist, то, как показывает опыт, лучше это делать уже осенью: ближайшие 3-4 месяца они будут стремительно замываться потоком новых летних фотографий.
Как и прежде мы благодарны всем, кто ставит галочку "В культуре" для снятых культивируемых растений. Пожалуйста, прочитайте специальный релиз, посвященный загрузке 100 000-го наблюдения культурной флоры России, хотя мы уже прошли отсечку в 200 000!
2) Региональные проекты "Флоры России" очень разные по числу наблюдений, участников и подписчиков. Собственно, именно они в сумме и составляют данные основного проекта. На главной странице зонтичного проекта можно посмотреть региональный зачёт по числу фотонаблюдений, видов и наблюдателей.
3) Антипроект (бэклог) "Флоры России" включает неопределённые и неверифицированные наблюдения и является важнейшей точкой входа для наших экспертов. Бэклог составляет свыше 500 000 наблюдений после активного сезона, но постепенно сдувается. Это обычный ход вещей: как правило, число наблюдений в нём сокращается с сентября по апрель и растёт в тёплое время года.
4) Большая "Флора России" включает как определённые, так и неверифицированные наблюдения. Она нужна для оценки общего состояния данных по флоре России, загруженных пользователями. Например, здесь удобно смотреть, какова доля неопределенных наблюдений. Это плоский проект без региональной структуры.
5) "Серая зона" включает наблюдения культурных растений и забракованные данные, т.е. наблюдения, не отвечающие формальным критериям качества. Мы благодарны всем, кто ставит галочку "Культурное" для снятых культивируемых растений.
6) Потеряшки "Флоры России" - это такой небольшой проект, который включает около 700-800 определённых и верифицированных наблюдений, которые случайно не попали в региональные порталы. Это происходит из-за: (1) слишком большого радиуса привязки наблюдений, (2) несовершенства шейп-файлов регионов, (3) намеренного искажения или загрубления координат или радиусов, (4) привязки к административным единицам, а не к конкретным точкам.
7) И, наконец, у нас есть копилка "Флоры России". Её история такова: ещё в 2021 г. вышла очередная новая модель автоматического распознавания видов iNaturalist. Для того, чтобы привлечь внимание сообщества к видам, которые в ближайшие месяцы могут дополнить модель, мы и запустили копилку. В ней собраны данные по 500 видам-кандидатам. По этим растениям нужно набрать минимум 100 наблюдений. Виды в копилке постоянно обновляются - мы исключаем из неё виды, преодолевшие пороговую отметку и добавляем новые.
Приглашаем всех участников iNaturalist подписываться не только на проект МГУ "Флора России", но и на региональные страницы этого портала, на антипроект (бэклог) и "серую зону". В паспорте каждого наблюдения будет, таким образом, отражена как ссылка на общероссийский проект (в т.ч. ещё до определения или при съемке культурных растений), так и региональная принадлежность наблюдения.
Традиционные таблички даны ниже.
1. Самые активные участники (число наблюдений) | Top-observers (number of observations)
● Снова вышла новая модель автоматического распознавания видов. Теперь модель дополняется новыми видами ежемесячно! Мы обновили копилку "Флоры России" - в ней собраны данные по 600 видам-кандидатам.
● Экологическая инициатива "Pivotal" приглашает экспертов к сотрудничеству для определения живых организмов по фото и аудиофайлам. Работа оплачивается, но для этого нужно иметь счёт, куда могут перечисляться средства из Великобритании. Это сообщение не является рекламой, а размещено в информационных целях. Все подробности тут
● На платформе iNaturalist опубликованы модели (расчётные карты ареалов) 80 000 видов растений, животных и грибов мира. Подробности даны в релизе.
● Закончился Лекторий "Флоры России". Мы провели 30 лекций: 16 в весеннем семестре и 14 в осеннем семестре. На днях мы подвели итоги. Все записи лежат в открытом доступе.
● Цифровой гербарий МГУ запустил большую платформу для онлайн-волонтёров помогатор. Даже 15 минут в день вашего участия очень помогут нам в индексации изображений гербарных образцов. На днях загружено большое новое задание.
● Опубликован второй релиз карт "Атласа флоры России". Мы подробно рассказали об этом важном событии. Каждая сеточная карта по квадратам 100×100 км на 8793 видов сделана на основе датасета FLORUS. Работа над чисткой карт продолжается. Скоро будет третий релиз.
● Проект "Флора России" на iNaturalist теперь официально зарегистрирован на платформе dobro.ru в качестве волонтёрского проекта. Это платформа, на которой ведётся учёт российских волонтёрских инициатив, в том числе программ научного волонтёрства. Пожалуйста, подпишитесь на нас на этой странице, используя учётку с Госуслуг. Это будет очень полезно для дальнейшей спокойной работы iNaturalist в России.
Для написания данного поста использован конвертер текстовых и табличных данных, который осуществляет разметку текста. Конвертер разработал Константин Романов (@kildor). Если у вас есть свои проекты, то вам эта ссылка, уверен, пригодится!
В эфире снова новости компьютерного зрения. Напомним, что в восьмой модели автоматического распознавания видов, которая была запущена 19 августа 2022 г., были использованы новые критерии отбора видов для обучающего датасета. В мае 2024 г. они были уточнены: теперь минимальный порог равен 100 фотографиям при наличии не менее 60 наблюдений. Кроме того, помимо обучающего набора, должно быть несколько фотографий для тестирования и валидации модели. С осени 2022 г. примерно раз в месяц те виды, которые добрались до квалификационного порога, добавляются в модель без пересчёта включенных ранее видов. Это позволило заметно ускорить включение новых растений.
Новая модель (v2.13, т.е. тринадцатая ежемесячная порция обновлений "большой" второй модели) основана на данных, выгруженных из системы 31 марта 2024 г. - в ней появилось сразу 526 новых видов растений, в т.ч. 33 вида проекта "Флора России".
После этого дополнения модели, мы быстро сделали чистку "Копилки флоры России". Оказалось, что с 5 апреля 2024 г. ещё 18 видов копилки (из 500) стали известны системе, и она их предлагает пользователям при определении снимков:
Некоторые виды (с большинством наблюдений из-за границы или с большим числом фотографий при малом числе наблюдений) прошли порог, так и не побывав в нашей копилке:
Итак, каждый месяц ещё несколько десятков видов флоры России становятся известными моделям компьютерного зрения iNaturalist. В большинстве регионов свыше 95% загружаемых фотографий (в Средней России 99%) относится к таким видам, которые известны системе, а, значит, чем лучше и правильнее пользователь фотографирует объект, тем больше шансов, что он сразу получит верный ответ.
Компьютерное зрение как часть технологий искусственного интеллекта сделало возможным распознавание живых организмов по изображениям. Ещё двадцать с лишним лет назад вдохновлённые люди рассказывали о том, что развитие молекулярных методов приведёт к тому, что в руках учёного будет устройство размером с пульт от телевизора, в него можно будет положить кусочек листика, и машина с точностью сможет определить вид этого растения. Сейчас прогресс дошёл до того, что нужно просто взять смартфон, навести камеру на растение, сфотографировать его, и мы получим, причём с очень большой долей надёжности, ответ на вопрос, что это такое. О том, что такое компьютерное зрение платформы iNaturalist рассказано в лекции А.П. Серегина.
Уже после записи этой лекции в сентябре 2023 г. произошло исключительно важное событие - теперь для подсказок системы компьютерного зрения используются не данные о реальных находках, а так называемые "модели" (вероятностные карты возможных встреч вида). Этому посвящен отдельный пост (перевод на русский). Несмотря на то, что некоторые подсказки выглядят странными, их общая точность повысилась, поэтому именно моделям был отдан приоритет.
Если вам действительно важно быстро узнать, что это за растение, не дожидаясь отклика экспертов (что важно во время летнего пика наблюдений), неторопливо делайте аккуратные снимки с разных ракурсов и обязательно перечитайте пост "Как снимать, что снимать: учимся у классиков. Особенно это актуально летом, когда возможности экспертного сообщества на порядок ниже потока свежих летних фотографий.
После обновления копилки на место исключенных видов в "Копилку" добавлено 119 дополнительных видов. В итоге, наш список был увеличен на сто видов и включает теперь 600 видов! Как и прежде, после выхода обновлений мы будем регулярно менять виды, преодолевшие этот порог, на те, что находятся ниже по списку.
Ждём выход большой третьей модели, чтобы сделать текущую сверку покрытия модели и привести копилку в идеальный порядок.
КАКОВА ТОЧНОСТЬ ПОДСКАЗОК?
Давайте внимательно посмотрим на график из последнего релиза. В нем сравниваются модели 2.12 (апрель 2024 г.) и 2.13 (май 2024 г.). Показано три категории столбиков: средние значения, разбивка по таксономическим группам и по континентам (странам света). У каждого столбика две доли: точность определения собственно по фото и добавка к точности с использованием геомоделей. Здесь рассматривается только точность первой подсказки на уровне вида.
В среднем, эти показатели по всем таксонам и континентам составляют 88,2% наблюдений, которые верно определяются компьютерным зрением.
Среди таксономических групп лучше всего по картинкам определяются именно растения. С учетом геомоделей - паукообразные и растения.
По частям света (независимо от таксонов) на первом месте Европа. Тут общая точность более 92%. За ней следует Северная Америка, где точность первой подсказки около 91%.
Так что друзья есть отличная новость для участников проекта "Флора России" и всех, кто загружает растения на iNaturalist: именно растения (а особенно сосудистые растения) и именно из Европы (а, на самом деле, из внетропических областей Евразии) - это то, что нашими общими усилиями iNaturalist определяет лучше всего.
АЛГОРИТМ ВКЛЮЧЕНИЯ ВИДОВ В КОПИЛКУ
1) Ждём выхода новой модели и релиза в блоге iNaturalist по этому поводу.
2) Берем полный список видов проекта "Флора России".
3) Скриптом проверяем, какие виды не включены в текущую модель компьютерного зрения.
4) Убираем из "Копилки" виды, попавшие в текущую модель.
5) Берем топ-600 видов по числу наблюдений проекта "Флора России" (в этот раз порог 23 наблюдения).
6) Добавляем ВСЕ их наблюдения с фото из всех стран в копилку - для обучения используются в т.ч. наблюдения, сделанные в культуре.
7) Делаем новые наблюдения этих видов, загружаем их на сайт, проверяем определения.
8) См. пункт 1.
КАК МОЖНО ПОМОЧЬ?
НОВЫЕ ДАННЫЕ. Поскольку теперь используется новый алгоритм для географического уточнения подсказок системы, то ещё более важными становятся новые наблюдения всех видов, в том числе обычных и хорошо знакомых системам компьютерного зрения. Каждая новая точка будет уточнять модели ареалов, а, значит, делать предсказания еще более точными.
НОВЫЕ ФОТО. Цель копилки - максимально ускорить процесс сбора фотографий по видам, которым чуть-чуть не хватает для включения в модель автоматического распознавания видов. Эти фото будут использованы в следующем обучающем наборе. Все мы замечаем, что каждый раз модель становится всё более компетентной и редко допускает грубые ошибки. Участники целенаправленно пополняют копилку, ориентируясь как на список видов (добавляя региональные фильтры), так и на карту, по которой мы можем глянуть на ближайшие точки видов-кандидатов и постараться сделать дополнительные наблюдения именно этих видов. Поверьте: такие поиски даже в соседнем лесу могут превратиться в увлекательное приключение! Но не забывайте, что из каждого наблюдения на обучение модели пойдёт только 5 фотографий (для соответствия критерию по разнообразию гаджетов).
Вот все формальные пороги для новых видов:
ранг вида (гибриды, подвиды и разновидности не включаются)
минимум 100 фото
минимум 60 наблюдений
фото имеют определение сообщества (но не обязательно "исследовательский уровень")
НОВЫЕ ГАДЖЕТЫ. Для ряда видов имеется недостаточное разнообразие устройств: напрямую в релизах iNaturalist об этом не говорится, но Алекс Шепард в комментариях к постам рассказал, что наложены дополнительные ограничения на разнообразие источников, из которых поступают фотографии. При выгрузке обучающего набора фотографий из их метаданных берутся сведения, на какие устройства был снят тот или иной вид. К сожалению, точные значения пороговых отметок при этом не обнародованы. Если небольшое разнообразие устройств и наблюдателей не позволяет сделать обучающую выборку репрезентативной, то такой вид оставляется в сторонке для дальнейшего накопления данных. Такие ограничения вводятся потому, что, как показал эмпирический опыт, при обучении модель становится сильно зависимой от типа и марки устройств, на которые производилась съемка и, например, может узнавать какой-то вид, снятый на айфонах, но не видеть его на прочих фотографиях.
ДРУГИЕ ФЕНОФАЗЫ. Многие виды, которые не включены в систему, скупо представлены, например, в плодах или в вегетативном состоянии. А это особенно актуально осенью! Для надежного определения видов с помощью алгоритмов компьютерного зрения нужны фотографии растений в различные сезоны. Так что съемки одного и того же вида в том же месте, но, например, с жёлтыми листьями или ранней весной также очень полезны для совершенствования нейросетевых алгоритмов.
НОВЫЕ ОПРЕДЕЛЕНИЯ. Как и в целом на iNaturalist, очень многое зависит от экспертов и их работы. Несмотря на преодоление пороговых отметок, многие виды пока не включены в модель. Почему? У части видов пока недостаточная доля наблюдений исследовательского уровня (особенно у видов с большим числом наблюдений из-за рубежа, а также в сложных группах типа Salix, Carex, Poaceae и т.п.). Так что без участия экспертов в определении фото видов-кандидатов совершенствование модели компьютерного зрения невозможно в принципе. Например, довольно много видов флоры Приморья не включены в модель из-за большого числа неподтверждённых наблюдений из Южной Кореи.
РЕЗУЛЬТАТ. Именно первое включение вида в модель основано на наиболее чистом датасете фотонаблюдений, поскольку эти изображения вручную определены экспертами и наблюдателями (без учета мнения модели). Затем неизбежно начинают накапливаться ошибки, основанные на использовании подсказок, и обучение следующей модели хотя бы частично становится основанным на автоматически определенных фотографиях. Впрочем, обучающий массив при этом неизбежно растёт.
Накануне в статистике проекта "Флора России" после корректировки счётчика мы прошли очередную круглую цифру - 26 000 человек сделали хотя бы одно наблюдение исследовательского уровня по флоре нашей страны. Это событие - результат как прицельного разбора завалов экспертами этой весной, так и активного появления новичков с началом полевого сезона. Отдельно следует отметить, что число регистраций на iNaturalist из России растёт не столь быстро - свои первые наблюдения растений сделали люди, которые завели учётки ещё в прошлом году и даже раньше.
Впрочем, это всего лишь цифра основного проекта, которую мы традиционно отмечаем: с учетом неразобранных завалов наблюдения растений России загружали на платформу более 27,9 тыс. человек. Выходит, где-то в недрах бэклога застряли единичные наблюдения ещё 1,6 тыс. участников.
2) Совершенно неясно, кто стал юбилейным участником платформы. Но можно посмотреть, откуда было сделано первое наблюдение каждого из последней тысячи новых участников. Вот раскладка по регионам (извините за отсутствие транслита):
4) Из числа наших подписчиков первым участником iNaturalist стал Вадим Прохоров (@vadim_prokhorov), который завёл учётку десять лет назад - 15 февраля 2013 года. Вот уж действительно старожил!
5) Далеко не все наблюдатели растений России знают о нашем проекте, а уж тем более не все являются его подписчиками. Максимальная доля подписчиков была отмечена у нас 2 июня 2020 года - в тот день 18,4% наблюдателей, имевших хотя бы одно наблюдение по флоре России, были нашими участниками. Быстрый рост популярности мобильных приложений (и прежде всего Seek, где проекты не видны) заметно снизили эту долю. Впрочем, она остаётся стабильной - как и год назад она составляет 13,4%.
6) Всего два участника, входящие в сотню нашего проекта по числу наблюдений, не являются его подписчиками. В топ-200 таких семь человек, а в топ-500 - 58 человек (в июле 2023 г. таковых было 84 человека). Искренняя благодарность всем, кто идёт вместе с нами!
7) Интересный факт: 1% самых активных наблюдателей (т.е. первые 263 человек) сделали в общей сложности 65,6% наблюдений исследовательского уровня по флоре России. С июля 2023 г. эта цифра выросла еще на 1,6% - активность ведущих наблюдателей всё же заметно выше скорости расширения сообщества.
8) Если вам надоели сообщения из журнала проекта "Флора России", то вы можете их отключить, оставаясь подписчиком проекта. Для этого недавно появилась кнопочка "Ваше членство" на правой красной панели главной страницы проекта. На вопрос "Получать уведомления от журнала проекта?" нужно выбрать "Нет".
9) Константин Романов (@kildor) написал небольшую утилиту, которая автоматически экспортирует список участников проекта. Благодаря этому мы сегодня снова можем пригласить к участию в проекте "Флора России" тех, кто не является его подписчиком, но входит в число 500 самых активных наблюдателей (перечислены в алфавитном порядке). За последние три месяца в этом списке появилось несколько новых имён, что не может не радовать!
10) Обязательно подписывайтесь на наш проект, чтобы получать новости сообщества. Там уже 3534 подписчика!
11) Впрочем, мы приглашаем всех участников iNaturalist подписываться не только на проект МГУ "Флора России", но и на региональные страницы этого портала (список тут), на антипроект (бэклог) и "серую зону". В паспорте каждого наблюдения будет, таким образом, отражена как ссылка на общероссийский проект (в т.ч. ещё до определения или при съемке культурных растений), так и региональная принадлежность наблюдения. О том, что такое "серая зона", написано в специальном посте.
12) Среди участников проекта "Флора России" мы активно пропагандируем культуру открытых данных благодаря чему обеспечивается взаимодействие iNaturalist и Global Biodiversity Information Facility (GBIF). Недавно были обновлены данные из iNaturalist в GBIF. О том, что такое GBIF и почему это важно написано здесь. В настройках учётной записи вы всегда можете поменять для всех своих наблюдений тип лицензии, выбрав одну из открытых - CC0, CC-BY, CC-BY-NC.
13) Ниже приведены топ-20 регионов по числу наблюдателей (участников, сделавших хотя бы одно верифицированное экспертами наблюдение) - этот список заметно отличается от рейтинга регионов по числу наблюдений.
1 Флора Подмосковья | Moscow Oblast Flora 5060
2 Флора Москвы | Flora of Moscow 4944
3 Флора Санкт-Петербурга | St Petersburg Flora 2100
4 Флора Краснодарского края | Krasnodar Krai Flora 2082
5 Флора Ленинградской области | Leningrad Oblast Flora 1826
6 Флора Крыма | Flora of the Crimea 1210
7 Флора Тульской области | Tula Oblast Flora 1043
8 Флора Свердловской области | Sverdlovsk Oblast Flora 1010
9 Флора Башкирии | Bashkortostan Flora 939
10 Флора Тверской области | Tver Oblast Flora 934
11 Флора Нижегородской области | Nizhny Novgorod Oblast Flora 893
12 Флора Новосибирской области | Novosibirsk Oblast Flora 871
13 Флора Татарстана | Tatarstan Flora 833
14 Флора Калужской области | Kaluga Oblast Flora 813
15 Флора Карелии | Flora of Karelia 785
16 Флора Иркутской области | Irkutsk Oblast Flora 770
17 Флора Воронежской области | Voronezh Oblast Flora 718
18 Флора Челябинской области | Chelyabinsk Oblast Flora 718
19 Флора Калининградской области | Kaliningrad Oblast Flora 702
20 Флора Владимирской области | Vladimir Oblast Flora 652
На счётчике сегодня новая круглая отсечка: 3 350 000 наблюдений в проекте "Флора России"! Для очередных 50 тыс. наблюдений нашему сообществу потребовалось 15 дней (в прошлый раз на 50 тысяч ушло 45 дней). За последние 15 дней число наблюдателей флоры России выросло на 309 человек, а число выявленных и подтверждённых видов выросло на 8 таксонов в условиях активной чистки номенклатуры.
We've got another milestone on the counter - 3,350,000 observations in the "Flora of Russia" project! For the 50-thousandth mark, our community spent 15 days (comparing to 45 days for previous 50K). During last 15 days, the number of observers of the flora of Russia increased by 309 folks. We've got 8 new identified and confirmed species in line with an active cleaning of nomenclature.
За последние 15 дней сразу 2007 человек из 25,9 тыс. наблюдателей смогли выйти на улицу, сделать хотя бы одно наблюдение в природе и загрузить его на iNaturalist. В этот раз доля свежих полевых наблюдений составила 82% (против 18%, поступивших из архивов пользователей или вытащенных экспертами из бэклога).
Over the past 15 days, 2007 people have been able to go outside, make at least a single observation in nature and upload it to iNaturalist. This time, the share of fresh field observations was 82% versus 18% that came from archives or pulled by the experts from the backlog.
Давайте снова зафиксируем статистику для истории.
3 350 000 наблюдений наш проект достиг 5 мая 2024 г. около 17:00 MSK.
The project reached 3,350,000 observations in May 05, 2024 at 17:00 MSK.
С прошлого стандартного замера проект вырос на 48,8 тыс. наблюдений, а антипроект вырос на 10,5 тыс. наблюдений в связи с началом весны и прошедшим City Nature Challenge. На сегодняшний день доля неопределенных материалов по флоре России составила 12,63% (в прошлый раз, т.е. 21 апреля 2024 г., мы прошли минимальную отметку этого межсезонья в 12,55%). В общем, если вы планировали размещать свои большие многолетние архивы на iNaturalist, то, как показывает опыт, лучше это делать уже осенью: ближайшие 4-5 месяцев они будут стремительно замываться потоком новых летних фотографий.
Как и прежде мы благодарны всем, кто ставит галочку "В культуре" для снятых культивируемых растений. Пожалуйста, прочитайте специальный релиз, посвященный загрузке 100 000-го наблюдения культурной флоры России, хотя мы уже подбираемся к отсечке в 200 000!
2) Региональные проекты "Флоры России" очень разные по числу наблюдений, участников и подписчиков. Собственно, именно они в сумме и составляют данные основного проекта. На главной странице зонтичного проекта можно посмотреть региональный зачёт по числу фотонаблюдений, видов и наблюдателей.
3) Антипроект (бэклог) "Флоры России" включает неопределённые и неверифицированные наблюдения и является важнейшей точкой входа для наших экспертов. Бэклог составляет свыше 500 000 наблюдений после активного сезона, но постепенно сдувается. Это обычный ход вещей: как правило, число наблюдений в нём сокращается с сентября по апрель и растёт в тёплое время года.
4) Большая "Флора России" включает как определённые, так и неверифицированные наблюдения. Она нужна для оценки общего состояния данных по флоре России, загруженных пользователями. Например, здесь удобно смотреть, какова доля неопределенных наблюдений. Это плоский проект без региональной структуры.
5) "Серая зона" включает наблюдения культурных растений и забракованные данные, т.е. наблюдения, не отвечающие формальным критериям качества. Мы благодарны всем, кто ставит галочку "Культурное" для снятых культивируемых растений.
6) Потеряшки "Флоры России" - это такой небольшой проект, который включает около 700-800 определённых и верифицированных наблюдений, которые случайно не попали в региональные порталы. Это происходит из-за: (1) слишком большого радиуса привязки наблюдений, (2) несовершенства шейп-файлов регионов, (3) намеренного искажения или загрубления координат или радиусов, (4) привязки к административным единицам, а не к конкретным точкам.
7) И, наконец, у нас есть копилка "Флоры России". Её история такова: ещё в 2021 г. вышла очередная новая модель автоматического распознавания видов iNaturalist. Для того, чтобы привлечь внимание сообщества к видам, которые в ближайшие месяцы могут дополнить модель, мы и запустили копилку. В ней собраны данные по 500 видам-кандидатам. По этим растениям нужно набрать минимум 100 наблюдений. Виды в копилке постоянно обновляются - мы исключаем из неё виды, преодолевшие пороговую отметку и добавляем новые.
Приглашаем всех участников iNaturalist подписываться не только на проект МГУ "Флора России", но и на региональные страницы этого портала, на антипроект (бэклог) и "серую зону". В паспорте каждого наблюдения будет, таким образом, отражена как ссылка на общероссийский проект (в т.ч. ещё до определения или при съемке культурных растений), так и региональная принадлежность наблюдения.
Традиционные таблички даны ниже.
1. Самые активные участники (число наблюдений) | Top-observers (number of observations)
● Снова вышла новая модель автоматического распознавания видов. Теперь модель дополняется новыми видами ежемесячно! Мы обновили копилку "Флоры России" - в ней собраны данные по 500 видам-кандидатам.
● На платформе iNaturalist опубликованы модели (расчётные карты ареалов) 80 000 видов растений, животных и грибов мира. Подробности даны в релизе.
● Закончился Лекторий "Флоры России". Мы провели 30 лекций: 16 в весеннем семестре и 14 в осеннем семестре. На днях мы подвели итоги. Все записи лежат в открытом доступе.
● Цифровой гербарий МГУ запустил большую платформу для онлайн-волонтёров помогатор. Даже 15 минут в день вашего участия очень помогут нам в индексации изображений гербарных образцов. На днях загружено большое новое задание.
● Опубликован второй релиз карт "Атласа флоры России". Мы подробно рассказали об этом важном событии. Каждая сеточная карта по квадратам 100×100 км на 8793 видов сделана на основе датасета FLORUS. Работа над чисткой карт продолжается. Скоро будет третий релиз.
● Проект "Флора России" на iNaturalist теперь официально зарегистрирован на платформе dobro.ru в качестве волонтёрского проекта. Это платформа, на которой ведётся учёт российских волонтёрских инициатив, в том числе программ научного волонтёрства. Пожалуйста, подпишитесь на нас на этой странице, используя учётку с Госуслуг. Это будет очень полезно для дальнейшей спокойной работы iNaturalist в России.
Для написания данного поста использован конвертер текстовых и табличных данных, который осуществляет разметку текста. Конвертер разработал Константин Романов (@kildor). Если у вас есть свои проекты, то вам эта ссылка, уверен, пригодится!