Учените са изследвали 30 случая, лекувани в спешна помощ в Нидерландия през 2022 г., като са подали на ChatGPT анонимна история на пациента, лабораторни тестове и собствени наблюдения на лекарите, като са го помолили да постави пет възможни диагнози. След това те сравнили списъка на чатбота със същите пет диагнози, предложени от лекарите от Спешна помощ с достъп до същата информация, след което направили кръстосана проверка с правилната диагноза във всеки случай. Лекарите са посочили правилната диагноза в първите пет в 87% от случаите, в сравнение с 97% за ChatGPT версия 3.5 и 87% за версия 4.0.