Anthropic обмежить «джейлбрейк» Claude: що змінилося?

Коротко

Компанія Anthropic впровадила нову функцію для моделей Claude Opus 4 та 4.1, яка дозволяє їм припиняти розмови у випадках постійних шкідливих або образливих взаємодій з користувачами. Це рішення має на меті зменшити ризики, пов'язані з потенційно небезпечними запитами та сприяти дослідженню благополуччя штучного інтелекту. Користувачі зможуть розпочинати нові розмови після припинення попередньої.

Нова функція Anthropic для двох своїх моделей штучного інтелекту Claude може стати початком кінця для спільноти, яка займається джейлбрейком штучного інтелекту. Компанія оголосила в повідомленні на своєму веб-сайті, що моделі Claude Opus 4 і 4.1 тепер мають можливість припиняти розмову з користувачами. За словами Anthropic, ця функція буде використовуватися тільки в «рідкісних, крайніх випадках постійно шкідливих або образливих взаємодій з користувачами».

Для уточнення, Anthropic зазначила, що ці дві моделі Claude можуть виходити зі шкідливих розмов, таких як «запити користувачів щодо сексуального контенту, що стосується неповнолітніх, та спроби отримати інформацію, яка б уможливила масштабне насильство або терористичні акти». З Claude Opus 4 і 4.1 ці моделі будуть припиняти розмову «лише в крайньому випадку, коли кілька спроб перенаправити розмову не дали результату і надія на продуктивну взаємодію вичерпалася», за словами Anthropic. Однак Anthropic стверджує, що більшість користувачів не відчують, як Claude перериває розмову, навіть коли мова йде про дуже суперечливі теми, оскільки ця функція буде зарезервована для «екстремальних випадків».

У випадках, коли Claude завершує чат, користувачі більше не можуть надсилати нові повідомлення в цій розмові, але можуть одразу розпочати нову. Anthropic додала, що завершення розмови не вплине на інші чати, а користувачі можуть навіть повернутися назад і редагувати або повторно надсилати попередні повідомлення, щоб змінити напрямок розмови.

Для Anthropic цей крок є частиною дослідницької програми, яка вивчає ідею благополуччя штучного інтелекту. Хоча ідея антропоморфізації моделей штучного інтелекту залишається предметом дискусій, компанія заявила, що можливість вийти з «потенційно неприємної взаємодії» є недорогим способом управління ризиками для благополуччя штучного інтелекту. Anthropic все ще експериментує з цією функцією і закликає своїх користувачів надавати відгуки, коли вони стикаються з таким сценарієм.

Джерело

← Попередня стаття

iPhone 17e: Apple планує бюджетний смартфон у 2026 році

Наступна стаття →

Google Pixel 10 Pro Fold: Витік технічних характеристик перед

Anthropic обмежить «джейлбрейк» Claude: що змінилося?

Anthropic обмежить «джейлбрейк» Claude: що змінилося?

Коротко

Россия ударила по государственному университету в Сумах, разрушен корпус – фото

Сибига ответил Сийярто: Можете присылать жалобы и угрозы своим друзьям в Москве

Зеленский: Путин будет совершать показательные убийства, чтобы унизить дипломатию

Sky News: В Европе разошлись во мнениях по месту встречи Трампа, Зеленского и Путина

Американская разведка разделилась в оценке военного потенциала РФ на Донбассе – Axios

Axios: В Белом доме обсуждали, наденет ли Зеленский костюм на встречу с Трампом

Трамп проиграл Путину и теперь попытается отыграться на Зеленском

Снігоприбиральна техніка замість "червоного хідника": що чекає на Зеленського у Білому домі

Китай прокоментував зустріч Трампа з Путіним та візит Зеленського до США

Пакунок школяра: батьки першокласників отримають 5 000 грн через "Дію"

Новина

Оберіть ваше місто

Anthropic обмежить «джейлбрейк» Claude: що змінилося?

Anthropic обмежить «джейлбрейк» Claude: що змінилося?

Коротко

Рекомендуємо прочитати

Россия ударила по государственному университету в Сумах, разрушен корпус – фото

Сибига ответил Сийярто: Можете присылать жалобы и угрозы своим друзьям в Москве

Зеленский: Путин будет совершать показательные убийства, чтобы унизить дипломатию

Sky News: В Европе разошлись во мнениях по месту встречи Трампа, Зеленского и Путина

Американская разведка разделилась в оценке военного потенциала РФ на Донбассе – Axios

Axios: В Белом доме обсуждали, наденет ли Зеленский костюм на встречу с Трампом

Трамп проиграл Путину и теперь попытается отыграться на Зеленском

Снігоприбиральна техніка замість "червоного хідника": що чекає на Зеленського у Білому домі

Китай прокоментував зустріч Трампа з Путіним та візит Зеленського до США

Пакунок школяра: батьки першокласників отримають 5 000 грн через "Дію"

Новина

Оберіть ваше місто