ISO IEC 5259-2-2024 PDF
Название на английском:
St ISO IEC 5259-2-2024
Название на русском:
Ст ISO IEC 5259-2-2024
Оригинальный стандарт ISO IEC 5259-2-2024 в PDF полная версия. Дополнительная инфо + превью по запросу
Полное наименование и описание
ISO/IEC 5259-2:2024 — Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 2: Data quality measures. Стандарт определяет модель качества данных и набор измеримых характеристик и показателей для оценки и отчётности по качеству данных в контексте аналитики и машинного обучения.
Аннотация
Документ задаёт терминологию, модель качества данных и конкретные меры (метрики) качества, а также рекомендации по их использованию и представлению результатов оценки. Цель — создать единый подход к оценке пригодности данных для аналитических задач и обучения моделей, снизить риски и повысить доверие к результатам ML и аналитики.
Общая информация
- Статус: Опубликован.
- Дата публикации: Ноябрь 2024 г.
- Организация-издатель: ISO/IEC (ISO/IEC JTC 1/SC 42 — Artificial Intelligence).
- ICS / категории: 35.020 (Информационные технологии).
- Редакция / версия: Издание 1 (2024).
- Количество страниц: 38 (официальная версия ISO).
Основные сведения и статус публикации подтверждены при публикации стандарта Международной организацией по стандартизации.
Область применения
Стандарт применим к организациям любого типа, которые создают, обрабатывают или используют данные для аналитики и машинного обучения и стремятся системно оценивать и документировать качество данных. Поддерживает как структурированные, так и неструктурированные данные (текст, изображения, аудио и т.д.).
Ключевые темы и требования
- Модель качества данных: определение характеристик качества, релевантных для аналитики и ML (полнота, корректность, согласованность, обновляемость и др.).
- Набор измеримых показателей (метрик) для каждой характеристики качества и рекомендации по вычислению и интерпретации.
- Руководство по отчётности: как документировать результаты оценок качества, форматы представления и уровни агрегации.
- Применимость к разным типам данных: инструкции по адаптации мер для структурированных и неструктурированных наборов данных.
- Согласование с существующими стандартами качества данных и практиками управления данными для обеспечения совместимости и преемственности.
Применение и пользователи
Основные пользователи: специалисты по данным (data engineers, data scientists), команды ML/AI, специалисты по качеству данных, менеджеры по продукту и руководители по управлению рисками и соответствию. Практическое применение включает оценку входных наборов данных перед обучением моделей, мониторинг качества данных в производстве и подготовку отчётов для аудиторов и заинтересованных сторон.
Связанные стандарты
ISO/IEC 5259-2 является частью серии ISO/IEC 5259 (управление качеством данных для аналитики и ML) и дополняет: ISO/IEC 5259-1 (обзор, терминология и примеры), ISO/IEC 5259-3 (требования и рекомендации по управлению качеством данных), ISO/IEC 5259-4 (процессный каркас качества данных) и другие смежные документы. Стандарт также опирается на и взаимосвязан с существующими стандартами по качеству данных, такими как ISO/IEC 25012 и ISO 8000. Упаковка и информация о серии подтверждены в комплекте публикаций ISO/IEC 5259.
Ключевые слова
качество данных; метрики качества; оценка данных; машинное обучение; аналитика; управление данными; ISO/IEC 5259; SC 42.
FAQ
В: Что это за стандарт?
О: Международный стандарт, задающий модель и измеримые показатели качества данных в контексте аналитики и машинного обучения (ISO/IEC 5259-2:2024).
В: Что он регулирует?
О: Не регулирует в смысле законодательства, а предоставляет набор рекомендаций и формализованных метрик для оценки и отчётности по качеству данных, которые организации могут применять для повышения надёжности аналитики и ML.
В: Кто обычно использует?
О: Data инженеры, data scientists, специалисты по качеству данных, сотрудники по управлению рисками и соответствию, команды разработки ML-продуктов и аналитики — все, кто отвечает за подготовку и поддержание пригодности данных для моделей и аналитических задач.
В: Он актуален или заменён?
О: На момент публикации (ноябрь 2024) стандарт является действующим изданием (Edition 1). Для региональных внедрений/адаптаций могут существовать национальные версии и публикации (например, национальные принятые версии могут иметь иную дату или идентификацию). Следует проверять актуальность у национального органа по стандартизации при внедрении.
В: Это часть серии?
О: Да — это часть серии ISO/IEC 5259, включающей части 1, 2, 3, 4 и прочие связанные документы по управлению и обеспечению качества данных для аналитики и ML. Серия предлагается как комплект для комплексного управления качеством данных.
В: Какие ключевые слова?
О: Качество данных, метрики качества, оценка данных, данные для ML, аналитика, управление данными, соответствие, ISO/IEC 5259.