ISO IEC 5259-1-2024 PDF
Название на английском:
St ISO IEC 5259-1-2024
Название на русском:
Ст ISO IEC 5259-1-2024
Оригинальный стандарт ISO IEC 5259-1-2024 в PDF полная версия. Дополнительная инфо + превью по запросу
Полное наименование и описание
Ст ISO/IEC 5259-1:2024 — Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 1: Overview, terminology, and examples. Документ даёт обзорную основу, унифицированную терминологию и практические примеры для управления качеством данных, используемых в аналитике и машинном обучении.
Аннотация
Часть 1 серии ISO/IEC 5259 устанавливает концептуальную рамку для оценки и повышения качества данных на разных этапах жизненного цикла данных, описывает ключевые понятия и предоставляет примеры применения (use cases) для помощи организациям при внедрении практик качества данных для аналитики и ML. Стандарт служит вводной и связующей частью для последующих частей серии, где раскрываются меры, процессы и механизмы управления качеством данных.
Общая информация
- Статус: Опубликован (International Standard).
- Дата публикации: Июль 2024 (издание 1).
- Организация-издатель: ISO/IEC (произведено в рамках ISO/IEC JTC 1/SC 42 — Artificial Intelligence).
- ICS / категории: 35.020; 01.040.35 (информационные технологии, словари и терминологии).
- Редакция / версия: Издание 1 (2024).
- Количество страниц: 19 страниц (публикация ISO).
Область применения
Стандарт применим к организациям и проектам, использующим данные для аналитики и машинного обучения — от подготовки требований к данным и проектирования наборов данных до оценки пригодности данных для обучения и валидации моделей. Он предназначен для специалистов по данным, инженеров по качеству данных, разработчиков ML, менеджеров проектов и руководителей, которые определяют политику качества данных и практики на уровне организации или проекта.
Ключевые темы и требования
- Определение и унификация терминов, связанных с качеством данных для аналитики и ML (словарь терминов и основные понятия).
- Описание ключевых измеримых характеристик качества данных и их ролей в ML-пайплайнах (связь с последующими частями серии, где даются меры и метрики).
- Рамка оценки качества данных в контексте жизненного цикла данных: сбор, подготовка, разметка, хранение, использование и мониторинг.
- Примеры и сценарии использования (use cases) для иллюстрации практических проблем качества данных: неполнота, смещение выборки, некорректные метки, несоответствие форматов и др.
- Рекомендации по интеграции практик качества данных с управлением, процессами и механизмами надзора в организации (введение в управление качеством данных).
- Связь и совместимость с существующими моделями качества данных (например, на базе ISO/IEC 25012) и другими стандартами JTC 1/SC 42.
Применение и пользователи
Основные пользователи: дата-сайентисты, инженеры ML и данных, архитекторы данных, менеджеры по качеству, специалисты по управлению данными, аудиторы и регуляторы. Применяется в проектах разработки моделей ML, аналитических платформах, при подготовке наборов данных для обучения и верификации, а также для выработки корпоративных политик качества данных и процедур проверки пригодности данных.
Связанные стандарты
ISO/IEC 5259-1 — часть серии ISO/IEC 5259. Сопутствующие документы серии включают ISO/IEC 5259-2 (Data quality measures), ISO/IEC 5259-3 (Data quality management requirements and guidelines), ISO/IEC 5259-4 (Data quality process framework) и ISO/IEC 5259-5 (Data quality governance framework). Кроме того, стандарт опирается на и дополняет существующие модели качества данных, например ISO/IEC 25012 (Data quality model), а также взаимосвязан с другими стандартами SC 42 по терминологии и понятиям в области ИИ.
Ключевые слова
качество данных; data quality; машинное обучение; аналитика; жизненный цикл данных; метрики качества данных; измерения качества; управление данными; разметка данных; bias; representativeness; валидация данных; терминология ИИ.
FAQ
В: Что это за стандарт?
О: Это первая часть серии ISO/IEC 5259, дающая обзор, терминологию и примеры по качеству данных для аналитики и машинного обучения; служит вводной и связующей основой для остальных частей серии.
В: Что он регулирует?
О: Стандарт не «регулирует» в смысле закона, но устанавливает международную рекомендационную основу (термины, рамки, примеры) для оценки и улучшения качества данных, используемых в аналитике и ML; конкретные меры и процессы раскрываются в последующих частях серии.
В: Кто обычно использует?
О: Дата-сайентисты, инженеры данных и ML, специалисты по качеству данных, менеджеры по продукту и ИТ-руководители, а также организации, стремящиеся формализовать требования и практики качества данных для аналитики и ML.
В: Он актуален или заменён?
О: ISO/IEC 5259-1:2024 — издание 1, опубликованное в июле 2024 года; на момент публикации оно является действующим международным стандартом и не заменено. Для проверки возможных последующих изменений или переводных/национальных редакций рекомендуется сверяться с актуальной информацией национального органа по стандартизации.
В: Это часть серии?
О: Да — часть серии ISO/IEC 5259 (части 1–5). Часть 1 даёт общий обзор и терминологию; части 2–5 содержат меры, требования к управлению качеством, процессную рамку и рекомендации по управлению (governance).
В: Какие ключевые слова?
О: Ключевые слова включают: качество данных, data quality, измерения качества, жизненный цикл данных, ML, аналитика, данные для обучения, метрики, управление качеством, терминология ИИ.