Датасет "Большие данные современной мировой экономики: цифровая платформа для интеллектуальной аналитики – 2022"
Просмотров: 6252
В условиях цифровой экономики центральным элементом хозяйственной деятельности и наиболее ценным ресурсом становятся данные. Достижения научно-технического прогресса сегодня настолько выдающиеся, что позволяют проводить интеллектуальный анализ данных на базе искусственного интеллекта (AI) с применением технологий обработки Больших данных (Big Data). Интернет вещей (IoT) повсеместные вычисления (UC) и другие прорывные технологии индустрии 4.0 позволяют вести полный учет хозяйственной деятельности, обеспечивая ее прозрачность, подконтрольность и прогнозируемость.
Однако, серьезным барьером на пути оптимизации работы с информацией является ее разрозненность и фрагментарность. Используя передовые технологические возможности, некоторые Международные организации создают датасеты для упрощения работы с предоставляемой ими статистикой. В качестве наиболее успешного примера можно привести датасет Международного валютного фонда (IMF), классифицирующий страны по экономическим и географическим категориям, позволяющий отбирать любые показатели из предлагаемого перечня и содержащий прогнозные данные на период до 2025 г.
В 2018-2019 гг. ежегодный датасет (Report Reader) выпускал Всемирный экономический форум (WEF). Это дата сет с ограниченными возможностями – он позволял сортировать данные или по странам, или по индикаторам, перечень индикаторов был доступен в выплывающем окне и сразу не виден, что усложняло работу с датасетом. Всемирный банк (WB) предлагает данные по широкому перечню областей, но единственная возможность оптимизации работы с данными, которую он предлагает, заключается в импорте в Microsoft Excel . В остальном данные Всемирного банка бессистемны, даже объединение выборок в Microsoft Excel затруднено из-за того, что в каждой выборке количество стран, по которым приведены данные, различно.
В существующей российской статистике, к примеру, Росстата (GKS) и Научно-исследовательского института «Высшая школа экономики» (НИУ ВШЭ) большинство данных не приводится в цифровом виде (представлены в виде картинок, которые невозможно редактировать) и ежегодно вводятся изменения в составе и наименовании показателей, поддающихся статистическому учету. Это существенно затрудняет или даже делает полностью неосуществимым анализ временных рядов (изучение динамики хозяйственных явлений и процессов).
Таким образом, дата сеты представляют высокую актуальность для современной науки, поскольку формируют основу для высокоэффективных эмпирических исследований, а дефицит дата сетов усложняет и тормозит прикладные исследования, приводя к преобладающему развитию теоретической науки и невозможности выявления новых задач и значимых закономерностей для их решения. Международные организации признают растущую потребность современной науки в дата сетах, но реализуют отдельные мелкомасштабные инициативы, не позволяющие решить эту проблему.
Институт научных коммуникаций (ИНК) вносит свой вклад в решение поставленной проблемы и создает первый дата сет на русском языке, объединяющий ведущую мировую статистику. Дата сет ИНК генерирует Большие данные современной мировой экономики и представляет собой цифровую платформу для интеллектуальной аналитики данных.
В дата сете содержатся показатели по наиболее актуальным направлениям проведения научных экономических исследований:
Индустрия 4.0:
Индекс цифровой конкурентоспособности (IMD) (данные за 2019-2021 гг.);
Индекс готовности стран к передовым технологиям(ЮНКТАД) (данные за 2021 г.);
Экономика знаний:
Индекс инноваций (WIPO) (данные за 2019-2021 гг.);
Индекс знаний (UNDP) (данные за 2020-2021 гг.);
Экономический рост
ВВП (IMF)(данные за 2019-2021 гг.);
Темп экономического роста (IMF)(данные за 2019-2021 гг.);
ВВП на душу населения (IMF)(данные за 2019-2021 гг.);
Устойчивое развитие:
Индекс качества жизни (Numbeo)(данные за 2019-2022 гг.);
Индекс счастья (UN)(данные за 2019-2020 гг.);
Индекс устойчивого развития (Sustainable Development Solutions Network)(данные за 2019-2022 гг.);.
Преимущества датасета ИНК :
Надежность: в дата сет объединена статистика авторитетных международных организаций, в частности, IMD , WEF , WIPO , WB , Numbeo , New Economic Foundation и Sustainable Development Solutions Network, UNDP и ЮНКТАД);
Экспертный рейтинг: мы добавили в датасет Рейтинг стран мира по уровню развития индустрии 4.0 в 2021 г. (по итогам года), актуальный на 2022 г.;
Актуальность и репрезентативность: в дата сете содержатся новейшие данные (по итогам 2019 г.), которые формируют основу проведения эмпирических исследований в 2020 г.;
Международный охват : дата сет содержит статистику по полной выборке современных стран мира, благодаря чему он открывает широкие возможности для всемирной аналитики;
Системность: сбор и систематизация основных статистических данных в общем дата сете;
Четкость структуры: чтобы сделать работу с дата сетом наиболее простой, быстрой и удобной для пользователей, в его структуре выделены тематические разделы;
Информативность: в дата сете представлена актуальная международная статистика на русском языке;
Наличие шаблонов: дата сет предлагает два шаблона данных: страны G 7 (развитые) и страны БРИКС (развивающиеся), страны СНГ, страны ЕАЭС, благодаря чему возможен ускоренный отбор необходимых данных для экономических экспериментов, направленных на сравнение стран основных категорий, в режиме реального времени;
Импорт данных: датасет позволяет отобрать необходимую информацию и импортировать ее в Microsoft Excel для последующей аналитики;
Интерактивность: датасет позволяет сортировать и комбинировать различные данные, объединяя их в общий массив данных именно таким образом, как это необходимо каждому пользователю;
Работа по принципу блокчейн: датасет позволяет делиться информацией, изменять и обрабатывать ее по запросам пользователей, при этом исходные данные остаются неизменны, что очень удобно и безопасно.
Датасет разработан доктором экономических наук, профессором, президентом ИНК Попковой Еленой Геннадьевной