ЕС вводит обязательный шаблон раскрытия контента обучения ИИ

С 2 августа 2025 года в Европейском союзе вступает в силу новое требование к провайдерам моделей искусственного интеллекта (ИИ) общего назначения (GPAI): публикация открытого резюме о данных, использованных для обучения продукта ИИ. 

Кого касается?

Новое правило обязательно для всех разработчиков GPAI-моделей – как коммерческих, так и open-source. Если такой продукт вводится на рынок ЕС, то резюме должно быть размещено: 

  • Не позднее момента выхода модели на рынок ЕС – для всех новых моделей.
  • Не позднее 2 августа 2027 года – для уже существующих моделей, находящихся на рынке до 2 августа 2025 г.

Что должно быть в резюме?

Структура резюме построена вокруг трех ключевых блоков:

  1.  Общая информация
    • В этом разделе указываются данные о разработчике и модели, а также общая информация об обучающих материалах – например, какие типы данных использовались (текст, видео, аудио), в каком объеме (приблизительно) и каковы их основные характеристики.
       
  2. Список источников данных
    • Здесь указывается, откуда брались данные для обучения модели: общедоступные датасеты, частные (ограниченного доступа) датасеты, данные, собираемые с веб-сайтов, пользовательские данные, синтетически сгенерированные данные.
       
  3. Обработка данных
    Этот раздел касается того, как обрабатываются данные с точки зрения прав заинтересованных сторон в соответствии с законодательством ЕС. В частности, нужно указать:
    •  как соблюдаются авторские права,
    •  как удаляется незаконный контент,
    • какие меры принимаются для защиты законных интересов.

От разработчиков также требуется раскрытие информации о том, использовалась ли при обучении модели информация, собранная в ходе взаимодействия пользователей со всеми их сервисами и продуктами, включая взаимодействие с ИИ-моделями (раскрытие самих персональных данных не требуется).

При этом учитывается необходимость баланса между прозрачностью и защитой конфиденциальной информации. Разработчики не обязаны раскрывать бизнес-секреты, если это может нанести ущерб бизнесу.

Резюме должно обновляться минимум раз в шесть месяцев, а также при любом дообучении модели, которое влияет на ее обучающий датасет.

Если третья сторона модифицирует ИИ-модель, то новая версия должна иметь собственное резюме, охватывающее только данные, использованные при модификации. Также нужно указать название модифицированной модели и сослаться на оригинал.

Ответственность за несоблюдение

  • Резюме публикуется на сайте провайдера и во всех каналах дистрибьюции ИИ-модели.
  • Непубликация резюме до 2 августа 2026 года (для новых моделей) может повлечь штраф до 3% общего (глобального) годового оборота компании или 15 млн. евро - в зависимости от того, что больше.

В целях обеспечения соблюдения нового требования Европейской комиссией был опубликован официальный шаблон резюме об обучающем контенте для моделей ИИ общего назначения.

Источник на официальном сайте ЕС.

Напишите нашему юристу, чтобы узнать подробности

Написать юристу

Уважаемые журналисты, использование материалов с сайта REVERA в публикациях возможно только после нашего письменного разрешения.