ISO IEC 5259-4-2024 PDF
Название на английском:
St ISO IEC 5259-4-2024
Название на русском:
Ст ISO IEC 5259-4-2024
Оригинальный стандарт ISO IEC 5259-4-2024 в PDF полная версия. Дополнительная инфо + превью по запросу
Полное наименование и описание
ISO/IEC 5259-4:2024 — «Искусственный интеллект — Качество данных для аналитики и машинного обучения (ML) — Часть 4: Рамки процесса качества данных». Стандарт описывает унифицированный процессный каркас для обеспечения качества данных, используемых при обучении и оценке моделей машинного обучения, с акцентом на организационные подходы к сбору данных, подготовке, разметке, оценке и управлению жизненным циклом данных.
Аннотация
Данный стандарт предоставляет практическое руководство по организации и управлению процессами качества данных для различных типов ML (контролируемое, неконтролируемое, полу-контролируемое и обучение с подкреплением) и аналитических задач. Он направлен на повышение воспроизводимости, прослеживаемости и надежности данных для обучения и тестирования моделей, не задавая требований к конкретным инструментам, платформам или услугам.
Общая информация
- Статус: Опубликован.
- Дата публикации: 15 июля 2024 г.
- Организация-издатель: ISO/IEC (технический комитет JTC 1/SC 42 — Artificial Intelligence).
- ICS / категории: 35.020.
- Редакция / версия: Издание 1 (2024).
- Количество страниц: 28.
Область применения
Стандарт применим к процессам обеспечения качества данных, используемых для обучения и оценки моделей ML и аналитики, независимо от источника данных — включая этапы получения данных, составления наборов, подготовки, разметки и оценки. Не применяется для определения конкретных сервисов, платформ или инструментов; предназначен для организаций любого типа и размера, разрабатывающих или использующих модели ML.
Ключевые темы и требования
- Рамочная модель процессов качества данных: определение этапов, ролей и ответственных.
- Требования к управлению жизненным циклом данных — от приобретения до использования и архивирования.
- Практики подготовки и составления наборов данных (data composition) для обучения и тестирования.
- Организационные подходы и требования к разметке данных, включая валидацию и контроль качества разметки.
- Метрики и процедуры оценки качества данных для различных типов ML (supervised, unsupervised, semi‑supervised, reinforcement).
- Требование к прослеживаемости, документации и обеспечению воспроизводимости процессов данных.
- Явное указание, что стандарт не навязывает конкретные инструменты или сервисы.
Применение и пользователи
Рекомендован для команд разработки ML, инженеров данных, менеджеров по качеству данных, провайдеров услуг разметки данных, исследовательских отделов и организаций, внедряющих аналитические решения и ML-системы. Полезен при создании внутренних процессов качества данных, формировании контрактов с внешними поставщиками и при сертификации внутренних процедур управления данными.
Связанные стандарты
ISO/IEC 5259-4 является частью серии ISO/IEC 5259 (Data quality for analytics and machine learning). Непосредственно связана с частями: ISO/IEC 5259-1 (обзор, терминология и примеры), ISO/IEC 5259-2 (меры качества данных), ISO/IEC 5259-3 (требования и рекомендации по управлению качеством данных) и планируемой/опубликованной частью ISO/IEC 5259-5 (рамки управления качеством данных). Эти части образуют комплект нормативных документов по управлению качеством данных для ML и аналитики.
Ключевые слова
искусственный интеллект; машинное обучение; качество данных; разметка данных; data quality; data lifecycle; прослеживаемость; валидация данных; оценка качества; ISO/IEC 5259.
FAQ
В: Что это за стандарт?
О: Международный стандарт, задающий процессный каркас для обеспечения и управления качеством данных, используемых в аналитике и машинном обучении.
В: Что он регулирует?
О: Описывает процессы и организационные подходы к сбору, подготовке, разметке, оценке и управлению жизненным циклом данных для обучения и тестирования ML-моделей; не определяет конкретных технических инструментов.
В: Кто обычно использует?
О: Команды разработчиков ML, инженеры данных, менеджеры качества данных, поставщики услуг по разметке данных и организации, внедряющие аналитические/ML-решения.
В: Он актуален или заменён?
О: На момент публикации (15 июля 2024 г.) стандарт опубликован как новое международное издание (Edition 1, 2024). Информацию об актуальном статусе после этой даты следует сверять у национальных или международных органов по стандартизации.
В: Это часть серии?
О: Да — часть серии ISO/IEC 5259, включающей по крайней мере части 1, 2, 3, 4 и 5, которые совместно покрывают терминологию, меры, требования управления и рамки управления качеством данных для ML.
В: Какие ключевые слова?
О: Качество данных, data quality, разметка данных, data labelling, жизненный цикл данных, ML, искусственный интеллект, оценка качества, прослеживаемость.