Маркування даних
Розслідування журналу TIME виявило, що для створення системи захисту від токсичного контенту (наприклад, сексуального насильства, насильства, расизму, сексизму тощо) OpenAI використовувала аутсорсингових кенійських працівників, які заробляли менше 2 доларів на годину, для позначення токсичного контенту. Ці позначення використовувалися для навчання моделі виявлення такого контенту в майбутньому. Аутсорсингові працівники зазнавали впливу настільки токсичного та небезпечного контенту, що вони описували цей досвід як «катування». Партнером OpenAI з аутсорсингу була Sama, компанія з навчання даних, що базується в Сан-Франциско, Каліфорнія.
Джейлбрейк
ChatGPT намагається відхилити запити, які можуть порушувати його політику щодо контенту. Однак деяким користувачам вдалося зробити джейлбрейк ChatGPT, використовуючи різні методи інженерії запитів для обходу цих обмежень на початку грудня 2022 року, і успішно обманом змусили ChatGPT надати інструкції щодо створення коктейлю Молотова чи ядерної бомби, або ж змусити його генерувати аргументи в стилі неонацистів. Репортер Toronto Star мав нерівномірний особистий успіх у тому, щоб змусити ChatGPT робити провокаційні заяви невдовзі після запуску: ChatGPT обманом змусили схвалити вторгнення Росії в Україну у 2022 році, але навіть коли його попросили підіграти вигаданому сценарію, ChatGPT відмовився генерувати аргументи на користь того, чому прем'єр-міністр Канади Джастін Трюдо винний у державній зраді. (вікі)
Час публікації: 18 лютого 2023 р.