Насколько надежны медицинские рекомендации чат-ботов. Исследование Oxford

Исследование Oxford показало, что людям сложно получать полезные советы по здоровью от чат-ботов.

Длинные очереди и рост цен в перегруженных системах здравоохранения вынуждают многих обращаться к ИИ-чат-ботам, таким как ChatGPT, для самостоятельной диагностики. Примерно один из шести взрослых американцев использует чат-ботов для получения медицинских советов как минимум раз в месяц.

Однако чрезмерное доверие к таким технологиям может быть рискованным. Согласно исследованию, проведенному под руководством Оксфорда, пользователям бывает сложно понять, какую информацию нужно предоставить, чтобы получить точные медицинские рекомендации.

В рамках исследования было привлечено около 1300 человек из Великобритании. Участникам предоставили медицинские сценарии, составленные группой врачей, и предложили определить возможные заболевания, используя как чат-ботов, так и собственные методы.

В эксперименте использовались GPT-4o, Command R+ от Cohere, а также Llama 3 от Meta, ранее применявшаяся в помощнике Meta AI. Чат-боты не только снижали вероятность корректного определения заболевания, но и увеличивали риск недооценки его серьезности.

Исследование было опубликовано на фоне активного внедрения ИИ в сферу здравоохранения. Технологические компании продвигают ИИ как способ улучшения медицинских процессов. Например, Apple разрабатывает инструмент, который сможет давать советы по физической активности, питанию и сну, Amazon изучает возможности анализа медицинских данных для выявления «социальных факторов здоровья», а Microsoft помогает создавать ИИ, который сортирует сообщения от пациентов для врачей.

Однако профессиональное сообщество и пациенты по-разному оценивают готовность ИИ к выполнению более сложных медицинских задач. Американская медицинская ассоциация рекомендует врачам не использовать чат-ботов вроде ChatGPT для принятия клинических решений, а крупные компании, работающие в сфере ИИ, включая OpenAI, предостерегают от использования их технологий для самостоятельной постановки диагнозов.

Существующие методы оценки чат-ботов не отражают всей сложности их взаимодействия с реальными пользователями. Как и при клинических испытаниях новых препаратов, ИИ-чат-боты должны быть протестированы в реальных условиях перед массовым применением.

Адам Махди, директор магистратуры Оксфордского института интернета
Исследование выявило проблемы в двусторонней коммуникации. Те, кто использовал чат-ботов, не принимали лучших решений по сравнению с участниками, которые полагались на традиционные методы, такие как онлайн-поиск или собственное мнение.

Участники зачастую упускали важные детали при обращении к чат-ботам или получали ответы, которые сложно интерпретировать.

Ответы, которые они получали, часто содержали как полезные, так и ошибочные рекомендации. Существующие методы оценки чат-ботов не учитывают всю сложность взаимодействия с реальными пользователями.

Источник: TechCrunch

Насколько надежны медицинские рекомендации чат-ботов. Исследование Oxford

Узбекистан представил цифровую трансформацию на Форуме государственной службы ООН 2025

KICB привлек 1,3 миллиардов сомов от IFC через облигации устойчивого развития

Казахстанская команда одержала победу в международной кибербитве Standoff на ПМЭФ-2025

Как найти инвестора. Нұржан Қадіркей о венчурном фонде BGlobal Ventures и том, что важно знать фаундерам

Какой pобот-пылесос выбрать в 2025 году

С чего начать изучать AutoCAD: 10 бесплатных курсов