ГОСТ «Информационные технологии. Большие данные. Обзор и словарь» идентичен международному стандарту Information technology – Big data – Overview and vocabulary, подчеркивают его разработчики из Национального центра цифровой экономики МГУ и Института развития информационного общества. Разработка стандарта осуществлена в рамках бюджетной программы государственной поддержки центра компетенций «Национальной технологической инициативы» (НТИ) по технологиям хранения и анализа больших данных МГУ, отмечает представитель АНО «Платформа НТИ».
«Термины, установленные настоящим стандартом, обязательны для применения во всех видах документации и литературы по данной научно-технической отрасли, входящих в сферу работ по стандартизации и (или) использующих результаты этих работ», – отмечено в описании стандарта.
В ГОСТе приведены переводы англоязычных терминов, относящихся к большим данным, на русский язык и расшифровка их значений. Например, «аналитика данных» (data analytics) – это «составное понятие, охватывающее получение, сбор, проверку и обработку данных, включая их количественную оценку, визуализацию и интерпретацию». А, к примеру, «вариативность данных» (data variability) – «изменения в скорости передачи, формате или структуре, семантике или качестве массива данных».
«Принятие первого национального стандарта задает вектор совместных действий власти, бизнеса, научно-образовательного сообщества по развитию экономики данных в России, – отмечает председатель совета директоров Института развития информационного общества Юрий Хохлов. – Мы ставим перед собой задачу сократить отставание в стандартизации больших данных». Первыми в IT-отрасли вводятся терминологические стандарты, а затем к ним добавляются все остальные, объясняет он.
По словам Хохлова, предстоит принять еще восемь национальных стандартов в сфере больших данных, касающихся их эталонной архитектуры, безопасности, методов анализа, сценариев использования и др.: «Часть из них уже разработана, прошла общественное обсуждение, часть будет разрабатываться одновременно с международными стандартами».
По состоянию на конец 2019 г. Boston Consulting Group оценивала объем российского рынка больших данных в 45 млрд руб. с темпом прироста 12% в течение последних пяти лет. Согласно подсчетам Ассоциации больших данных, объем рынка больших данных в России составляет 10–30 млрд руб. При этом, по усредненным прогнозам российских и иностранных экспертов, к 2024 г. ожидается рост этого показателя до 300 млрд руб.
Международный опыт
Первый интернациональный стандарт в сфере big data «Большие данные – Требования на основе облачных вычислений и их возможности» Международный союз электросвязи утвердил в 2015 г. В 2018 г. Международная организация по стандартизации (ISO) утвердила стандарты эталонной архитектуры больших данных, сценариев использования big data, а также направления дальнейшей стандартизации больших данных. В 2020 г. ISO опубликовала стандарты безопасности при использовании персональных данных в big data – проектах и начала работу над серией стандартов о качестве больших данных для аналитики и машинного обучения.