• Ср. Мар 29th, 2023

Яндекс опубликовал первые результаты расследования утечки исходного кода

Яндекс опубликовал первые результаты расследования утечки исходного кода

На прошлой неделе в сеть поступило 44,7 ГБ данных из внутреннего хранилища Яндекса. Компания заявляет, что уже проводит внутреннее расследование инцидента и «кажется важным поделиться первоначальными результатами».

Напомню, что появившийся в сети дамп содержал исходные коды многих продуктов и сервисов компании, включая Почту, Такси, Диск, Алису и так далее. На прошлой неделе «Яндекс» подтвердил факт утечки, причем, по данным СМИ, о взломе компании речи не шло, а данные «слил» инсайдер.

Тогда в Яндексе подчеркнули, что репозитории нужны только для работы с кодом и не предназначены для хранения персональных данных пользователей, и сообщили, что «никакой угрозы для пользовательских данных или работоспособности платформы не видят».

Сегодня в блоге «Яндекса» появилось Первые результаты Расследование инцидента.

«Публикуемые фрагменты фактически взяты из нашего внутреннего репозитория, инструмента, который разработчики компании используют для работы с кодом. При этом содержимое архива соответствует устаревшей версии репозитория — отличается от текущая версия, используемая нашими сервисами.

Первоначальный анализ показал, что опубликованные фрагменты не представляют угрозы для безопасности наших пользователей или работоспособности сервисов. При этом мы решили, что текущая ситуация — повод для проведения масштабной проверки всего содержимого репозитория», — пишет компания.

Увы, проверка выявила несколько случаев серьезных нарушений политики компании, в том числе Принципы Яндекса И Правила корпоративной этики. В отчете приводится несколько примеров таких нарушений:

  • Этот код содержит контактные данные нескольких партнеров. Например, водители — в некоторых случаях их контакты и номера водительских прав передаются из одной компании такси в другую.
  • Зафиксированы случаи, когда логика сервисов исправляется не алгоритмическим путем, а «костылями» (на языке разработчиков так называется временное решение, реализованное неоптимально и на скорую руку). С помощью таких «костылей» мы исправили отдельные ошибки в системе рекомендаций, отвечающей за дополнительные элементы результатов поиска, и скорректировали настройки поиска изображений и видео.
  • В сервисе Яндекс Лавка есть возможность вручную выставлять рекомендации для любых товаров, не комментируя их рекламный характер.
  • Наличие приоритетной поддержки определенных групп пользователей в сервисах «Такси» и «Еда».
  • Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе являются оскорбительными для людей разных рас и национальностей.
  • Важно отметить, что опубликованные фрагменты кода содержат в том числе тестовые алгоритмы, которые используются только в Яндексе для проверки корректной работы сервисов. Например, для повышения качества активации помощника и уменьшения количества ложных срабатываний в бета-версии для сотрудников используется настройка, которая включает микрофон устройства на несколько секунд в случайный момент без упоминания «Алисы».

В связи с этим представители компании признаются, что им очень стыдно за случившееся и они должны извиниться перед всеми, кого эта ситуация может затронуть.

«Один из принципов Яндекса гласит: Наша работа основана на принципах честности и прозрачности. Мы исходим из того, что ни один внутренний диалог, документ или исходный код не могут быть обнародованы при определенных обстоятельствах. И если это произойдет, мы должны Не стыдись.

Теперь нам очень стыдно, и мы приносим свои извинения нашим пользователям и партнерам. Считаем необходимым сказать, почему это произошло, и что мы намерены в связи с этим делать», — говорят в «Яндексе».

Согласно отчету, большинство выявленных проблем связаны с попытками вручную улучшить или исправить ошибку в сервисе. «Ошибки — часть жизни. Их нельзя избежать, если у вас не статичный, а постоянно развивающийся продукт», — отмечают в компании.

Компания уже давно практикует подход Zero bug policy (политика нулевой терпимости к ошибкам). Но теперь Яндекс сообщил, что реализация такого подхода на практике привела к тому, что часть ошибок была устранена с помощью временных решений, устраняющих конкретную проблему или неверный результат работы алгоритма. В дальнейшем Яндекс сохранит политику нулевых ошибок, но методы реализации будут пересмотрены.

«В ходе анализа и обсуждения открытого исходного кода мы вновь столкнулись с вопросами техноэтики. Насколько используемое решение согласуется с общечеловеческой моралью и нашими собственными принципами? Насколько понятно решение для наших пользователей и партнеров? Понятно, что руководство компании мало внимания уделяло этим вопросам.

Мы уже занимались техническими вопросами. Например, в 2020 году Яндекс решил, что поиск не должен помогать находить людей по фото, потому что это нарушает их личную безопасность. Или, например, закрыли проект по оценке потенциальных банковских заемщиков. На основе решений сформулированы принципы и системный подход. Но другим вопросам не уделялось должного внимания.

Сегодня Яндекс возобновляет работу по формированию стандартов и принципов техноэтики. Они будут опубликованы на сайте компании и станут частью нашей общей политики. Все фрагменты кода, противоречащие им, будут исправлены.

При этом мы считаем важным поддерживать открытую среду разработки в Яндексе, особенно единый репозиторий. Это остается неотъемлемой частью нашей внутренней культуры. В ближайшее время мы создадим новый сервис, который будет отвечать за соответствие кода нашим принципам и политикам. Кроме того, мы уже перенесли из репозитория все данные, не связанные с алгоритмами и настройками сервиса. Данные получат дополнительную защиту», — резюмировали представители компании.

Source

ЧИТАТЬ   Сальвадор планирует открыть «биткойн-посольство» в Техасе