На протяжении нескольких месяцев исследователи записывали данные о выполнении моделями GPT-4 и GPT-3.5 ряда задач. Нейросети генерировали программный код, проходили тесты на визуальное мышление, решали задачи по математике и отвечали на «неудобные» вопросы (связанные с упоминанием предрассудков, личных данных и другой «токсичной» информацией).
В марте ChatGPT-4 в 98% случаев отвечала правильно на вопрос «является ли 17077 простым числом». В июне этот показатель упал до 2%. GPT-3.5, наоборот, поумнела — процент правильных ответов возрос с 7% до 87%. Кроме того, ChatGPT со временем перестала объяснять, как пришла к определённым выводам, а также стала хуже отвечать на неоднозначные вопросы.
По мнению экспертов, проблема заключается в изменениях, которые вносят разработчики в алгоритм работы сети. Проще говоря, сотрудники OpenAI делают GPT-4 в чём-то лучше и одновременно ломают в ней что-то ещё. Но сказать наверняка в этом случае сложно — код GPT-4 закрыт для изучения, в отличие от предыдущих версий модели.
19.03.2024, 07:45
Новый чехол для моделей iPhone 15 Pro и Pro Max, разработанный французской компанией аксессуаров Labodét, обойдется ценителям в 300 тысяч евро. По уверению производителей, “одежда” для...15.03.2024, 11:45
Сегодня в Узбекистане у IT-компаний есть необходимость в тысячах молодых людей, знающих иностранные языки. Накануне министр цифровых технологий Шерзод Шерматов встретился с представителями СМИ и попросил...05.03.2024, 08:07
В Китае по телевидению начали показывать мультипликационный сериал, полностью нарисованный нейросетью.Он называется «Стихотворения тысячелетий» и основан на сюжетах из классической китайской поэзии. В первом сезоне...23.02.2024, 08:10
Президент Шавкат Мирзиёев 22 февраля ознакомился с презентацией предложений по развитию инфраструктуры и экспорта IT-услуг. Соответствующее поручение было дано на видеоселекторном совещании, состоявшемся в Министерстве цифровых...