Ограниченные данные Canva Creator раскрыты через базу данных чат-ботов на основе искусственного интеллекта

База данных Chroma, которой управляет российский стартап чат-ботов ИИ My Jedai, была обнаружена в сети, где были обнаружены ответы на опросы более 500 создателей Canva . Раскрытые данные включали адреса электронной почты, отзывы о программе Canva Creator и личные впечатления дизайнеров из более чем дюжины стран.
Раскрытие данных было обнаружено фирмой по кибербезопасности UpGuard, которая подтвердила, что база данных была общедоступной и не имела аутентификации. Хотя большая часть базы данных хранила общие или общедоступные данные, одна конкретная коллекция выделялась: она содержала ответы на подробный опрос, проведенный для Canva Creators, глобальной группы авторов контента для платформы дизайна.
Данные опроса включали 571 уникальный адрес электронной почты и подробные ответы на 51 вопрос, охватывающие такие темы, как роялти, пользовательский опыт и принятие ИИ. Некоторые адреса электронной почты появлялись несколько раз, что указывает на то, что пользователи заполняли опрос более одного раза.
Согласно отчету UpGuard, предоставленному Hackread.com перед публикацией в понедельник, этот инцидент является первой известной утечкой, связанной с базой данных Chroma — технологией, которая используется, чтобы помочь чат-ботам ссылаться на определенные документы при ответе на запросы.
База данных, размещенная на IP-адресе в Эстонии, по-видимому, контролируется My Jedai, небольшой российской компанией, предоставляющей услуги чат-ботов на основе искусственного интеллекта. Пользователи платформы могут загружать документы любого типа для питания своих чат-ботов, часто без особого технического надзора.
Наличие данных Canva в этом контексте вызвало вопросы о том, как конфиденциальная информация попадает в системы обучения ИИ или бэкэнды чат-ботов. Хотя Chroma изначально не является небезопасной, она требует надлежащей настройки для предотвращения публичного раскрытия. В этом случае база данных была оставлена широко открытой для Интернета.
Canva отреагировала на результаты исследования заявлением для Hackread:
«Недавно нам стало известно, что файл, содержащий адреса электронной почты и ответы на опросы небольшой группы создателей Canva, был загружен на сторонний веб-сайт. Информация не была связана с учетными записями Canva или данными платформы каким-либо образом. База данных, принадлежащая стороннему сайту, не была должным образом защищена, что привело к тому, что информация стала доступной».
«О проблеме нам сообщил исследователь безопасности, который обнаружил раскрытую информацию с помощью специальных инструментов, но она не является широкодоступной для обычных пользователей Интернета и не индексируется популярными поисковыми системами. Мы подтвердили, что содержимое файла было удалено, и журналы сайта показывают, что к нему не обращались другие».
«Мы уже связались с затронутыми создателями и соблюдаем все наши юридические обязательства, включая уведомление регулирующих органов в случае необходимости. Мы глубоко заинтересованы в сохранении безопасности данных нашего сообщества и пересматриваем наши процессы, чтобы не допустить повторения подобных ситуаций».
- Представитель Canva
Хотя нет никаких признаков того, что данные использовались не по назначению, эксперты отмечают, что даже ограниченная личная информация в сочетании с содержанием опроса может быть полезна для целенаправленных попыток фишинга . Респонденты поделились подробностями о своих профессиональных ролях, творческих привычках и удовлетворенности платформой Canva — информацией, которая может быть использована, если попадет в чужие руки.
My Jedai, компания, база данных которой была раскрыта, является микропредприятием, основанным в России. Она позволяет пользователям создавать чат-ботов, работающих на основе их собственных документов. Компания быстро отреагировала, как только получила уведомление, и обезопасила раскрытую базу данных в течение дня после обращения UpGuard.
Утечка показывает, как технологии ИИ создают новые, непредсказуемые каналы для раскрытия данных. Поскольку все больше компаний внедряют такие инструменты, как Chroma, для поддержки ботов, работающих с клиентами, или внутренних помощников, давление, связанное с необходимостью вводить данные в эти системы, может привести к ошибкам и сокращениям.
Этот случай также подчеркивает, насколько широко инструменты ИИ используются по всему миру, часто неожиданными способами. Данные, собранные в ходе опросов австралийским технологическим гигантом, оказались в незащищенной базе данных, управляемой небольшой российской фирмой, размещенной на серверах в Эстонии. С ростом использования LLM и сторонних инструментов чат-ботов традиционные границы хранения данных становится все труднее отслеживать.
UpGuard отметил, что многие документы в базе данных безвредны или даже бессмысленны, включая «мистические доктрины» и романтические советы, взятые с общедоступных сайтов, таких как Marie Claire и WikiHow.
Однако наличие реальных корпоративных данных, включая внутренние стенограммы чатов и ссылки на ограниченные платформы обмена файлами, показывает, насколько легко конфиденциальная информация может проникнуть в системы искусственного интеллекта без надлежащей защиты.
HackRead