The New York Times обновила свои условия обслуживания, чтобы запретить сбор корпоративного контента для обучения систем машинного обучения или искусственного интеллекта.
Что известно
В обновленных условиях указано, что инструменты автоматизированного сбора контента нельзя использовать без письменного разрешения издателя. Несоблюдение ограничений может привести к неуказанным штрафам или пеням, говорится в документе.
Несмотря на введение новых правил в свою политику, публикация, по-видимому, не внесла никаких изменений в файл robots.txt, который информирует поисковые системы о том, какие URL-адреса доступны.
Этот шаг, вероятно, является ответом на недавнее обновление политики конфиденциальности Google. Поисковый гигант заявил, что может собирать открытые данные из Интернета для обучения своих различных сервисов искусственного интеллекта, таких как Bard или Cloud AI.
Многие из используемых больших языковых моделей также обучаются на больших наборах данных, которые могут содержать защищенные авторским правом материалы из общедоступного Интернета. Часто они собираются без разрешения правообладателей.