Технология распознавания речи в лучевой диагностике: длительность подготовки заключений

29 ноября 2023
Вестник_№2_2023
Автор: Кудрявцев Н.Д., Владзимирский А.В.

Полноценное, качественное и своевременное заполнение медицинской документации играет важную роль в принятии правильных врачебных решений. В ряде исследований продемонстрировано, что врачи тратят 37–72% своего рабочего времени именно на заполнение медицинской документации [1–4]. Протокол рентгенологического исследования является основным методом коммуникации врачей-рентгенологов с лечащими врачами пациентов. Увеличивающаяся рабочая нагрузка на врачей-рентгенологов, связанная с увеличением количества диагностических исследований и их объема, приводит к сокращению времени, которое врач может затратить на подготовку протоколов исследований, что непосредственно сказывается на качестве подготовленных медицинских документов.

Возникшая ситуация от организаторов здравоохранения требует оптимизации кадровых и материально-технических ресурсов, в том числе за счет внедрения инновационных технологий. Одним из решений может стать применение технологии распознавания речи, которая все активнее используется в отечественном здравоохранении [5, 6]. Данная технология  позволяет автоматически распознавать, преобразовывать речь врача в текст и заполнять поля медицинского документа. Результаты научных исследований продемонстрировали, что голосовое заполнение ускоряет процесс заполнения медицинской документации для разных медицинских специальностей, в том числе в рентгенологии [7, 8].

В нашем предыдущем исследовании оценивалось влияние технологии распознавания речи только для результатов компьютерной (КТ) и магнитно-резонансной томографии (МРТ) [4], а в большинстве зарубежных исследований сравнивается длительность заполнения протоколов рентгенологических исследований при участии медицинского транскрипциониста и с помощью технологии распознавания [7].

Таким образом, цель нашего исследования – оценка влияния технологии распознавания речи на длительность подготовки протоколов исследований для различных рентгенологических модальностей.

Материал и методы

Ретроспективное исследование было проведено на базе Московского референс-центра ГБУЗ «НПКЦ ДиТ ДЗМ». В исследование методом простой случайной выборки было включено 12 912 протоколов рентгенологических исследований, подготовленных 67 врачами-рентгенологами в Едином радиологическом информационном сервисе в составе Единой медицинской информационно-аналитической системы Москвы (ЕРИС ЕМИАС) за май–ноябрь 2022 г.В исследование были включены: флюорография, диагностическая маммография, КТ органов грудной клетки при подозрении на новую коронавирусную инфекцию COVID-19, МРТ головного мозга с контрастированием и КТ органов грудной клетки, брюшной полости и малого таза с контрастированием. Распределение по типам рентгенологических исследований представлено в табл. 1.

Таблица 1. Количество протоколов рентгенологических исследований, включенных в исследование

 

Примечание. КТ – компьютерная томография; МРТ – магнитно-резонансная томография.


В рамках исследования проводился анализ данных из ЕРИС ЕМИАС: наименование диагностического исследования, дата и время начала подготовки протокола исследования, дата и время визирования протокола исследования, ФИО врача, проводившего подготовку протокола.

Критерии включения: протоколы, подготовленные с помощью традиционного (клавиатурного) или голосового ввода, протоколы с описанием патологических изменений, протоколы, подготовленные врачами с опытом применения технологии распознавания речи не менее 6 мес.

Критерии исключения: протоколы, не имеющие описание патологических изменений, протоколы исследований длительность подготовки которых составила <1 мин (60 с) (для флюорографических исследований – <10 с) и >1 ч (3600 с), протоколы, в подготовке которых принимало участие более одного врача, протоколы, подготовка которых проводилась в несколько этапов.

Программное обеспечение для голосового ввода: для заполнения протоколов рентгенологических исследований с помощью технологии распознавания речи использовалось система голосового ввода Voice2Med (версия 4.1.1052.18, ООО «ЦРТ», Санкт-Петербург, Россия).

Методы статистического анализа. Обработка полученных данных была выполнена с использованием методов описательной статистики с указанием следующих характеристик: число значений (N), среднее арифметическое (Mean), стандартное отклонение (SD), минимум (Min), максимум (Max), медиана (Med), первый и третий квартили (Q1, Q3), межквартильный интервал (IQR). Для определения типа распределения данных использовался тест Колмагорова–Смирнова, а также среди проверяемых распределений были распределение Бернулли, биноминальное распределение, распределение Коши, распределение χ2, лог-нормальное, логистическое и отрицательное биноминальное распределение, распределение Стьюдента и Вейбулла, равномерное распределение, гамма-распределение и распределение Пуассона (по результатам анализа данные длительности заполнения протоколов рентгенологических исследований не соответствовали ни одному из вышеперечисленных типов распределения). Межгрупповое сравнение выполнено с помощью U-критерий Манна–Уитни с уровнем статистической значимости 0,05. Обработка данных проводилась с помощью языка программирования R в среде RStudio (Version 4.2.1, RStudio, Inc.) [9].

Результаты

Флюорография. Средняя длительность под-готовки протокола в группе клавиатурного ввода составила 189,9 с (0:03:09), в группе голосового ввода – 236,2 с (0:03:56). Медиана длительности описания в 1-й и во 2-й группах составила 107,0 (0:01:47) и 139,5 с (0:02:19) соответственно. Гистограммы длительности описания исследований представлены на рис. А. Продолжительность интерпретации результатов флюорографических исследований при использовании клавиатурного ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 2.


Таблица 2. Описательная статистика данных по длительности подготовки протоколов флюорографических исследований, с





По результатам исследования средняя длительность подготовки протоколов флюорографических исследований при использовании клавиатурного ввода оказалась меньше на 19,6%, медиана – на 23,3%, чем при использовании технологии распознавания речи.

 

Гистограммы длительности подготовки протоколов рентгенологических исследований с помощью клавиатурного и голосового вводов: А – флюорографические исследований; Б – маммографические исследования; В – рентгенографические исследования с целью диагностики травматических переломов; Г – КТ органов грудной клетки при подозрении на COVID-19; Д – МРТ головного мозга; Е – КТ органов грудной клетки, брюшной полости и малого таза с контрастированием
КТ – компьютерная томография; МРТ – магнитно-резонансная томография.

Диагностическая маммография. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 387,1 с (0:06:27), в группе голосового ввода – 444,8 с (0:07:24). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 224,0 (0:03:44) и 271,0 с (0:04:31) соответственно. Диаграммы длительности описания исследования представлены на рис. Б. Продолжительность интерпретации результатов флюорографических исследований при использовании клавиатурного ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 3.

Таблица 3. Описательная статистика данных по длительности подготовки протоколов диагностических маммографических исследований, с

 


По результатам исследования средняя длительность подготовки протоколов маммографических исследований при использовании клавиатурного ввода оказалась меньше на 14,9%, медиана – на 21,0%, чем при использовании технологии распознавания речи.

Рентгенографические исследования с целью диагностики травматических переломов. Средняя длительность подготовки протокола в группе клавиатурного ввода составила247,8 с (0:04:07), в группе голосового ввода – 189,0 с (0:03:09). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 146,0 (0:02:26) и 107,0 с (0:01:47) соответственно. Диаграммы длительности описания исследования представлены на рис. В. Продолжительность интерпретации результатов рентгенографических исследований при использовании системы голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов рент-генографических исследований представлена в табл. 4.

Таблица 4. Описательная статистика данных по длительности подготовки протоколов рентгенографических исследований, с

 

По результатам исследования средняя длительность подготовки протоколов рентгенографических исследований с помощью технологии распознавания речи оказалась меньше на 23,7%, медиана – на 26,7%, чем при использовании клавиатурного ввода.

КТ органов грудной клетки при подозрении на COVID-19. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 379,7 с (0:06:19), в группе голосового ввода –382,7 с (0:06:22). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 271,0 (0:04:31) и 275,0 (0:04:35) с соответственно. Диаграмма длительности описания исследования в зависимости от группы представлена на рис. Г. Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 5.


Таблица 5. Описательная статистика данных по длительности подготовки протоколов КТ органов грудной клетки с признаками вирусной пневмонии COVID-19, с




При анализе результатов достоверного различия длительности подготовки протоколов КТ-исследований органов грудной клетки с по- мощью клавиатурного и голосового ввода не получено (p=0,12).

МРТ головного мозга. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 709,9 с (0:11:49), в группе голосового ввода – 559,9 с (0:09:19). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 486,0 (0:08:06) и 354,0 (0:05:54) соответственно. Гистограмма длительности описания исследования в зависимости от группы представлена на рис. Д. Продолжительность интерпретации результатов МРТ головного мозга с контрастированием при использовании голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов МРТ головного мозга с контрастированием представлена в табл. 6.

Таблица 6. Описательная статистика данных по длительности подготовки протоколов МРТ-исследований головного мозга с контрастированием, с



По результатам исследования средняя длительность подготовки протоколов МРТ головного мозга с контрастированием при применении технологии распознавания речи уменьшилась на 21,4%, медиана – на 27,2%.

КТ органов грудной полости, брюшной полости и органов малого таза с контрастированием. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 2714,6 с (0:45:15), в группе голосового ввода – 1778,4 с (0:29:38). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 2114,0 (0:35:14) и 1369,0 с (0:22:49) соответственно. Гистограмма длительности описания исследования представлена на рис. Е. Продолжительность интерпретации результатов КТ органов грудной полости, брюшной полости и органов малого таза с контрастированием при использовании голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов КТ органов грудной полости, органов брюшной полости и органов малого таза с контрастированием представлена в табл. 7.

Средняя длительность подготовки протоколов КТ при применении технологии распознавания речи уменьшилась на 34,5%, медиана – на 35,2%.

Таблица 7. Описательная статистика данных по длительности подготовки протоколов КТ органов грудной полости, органов брюшной полости и органов малого таза с контрастированием, с



Обсуждение

Полученные результаты демонстрируютразную эффективность применения системы голосового ввода при подготовке протоколов рентгенологических исследований. По нашему мнению, это связано с различными типами протоколов, используемых при описании диагностических исследований.

С одной стороны, применение системыголосового ввода замедлило время подготовки протоколов маммографических исследований. Это объясняется применением в медицинских организациях Департамента здравоохранения г. Москвы структурированного электронного медицинского документа (СЭМД) для описания результатов маммографических исследований.

Применение СЭМД в совокупности со стандартизированной шкалой BI-RADS позволяет улучшить коммуникацию между специалиста ми разного профиля и оптимизировать процесс принятия решения о дальнейшей тактике ведения пациентов [10, 11]. Схожий результат наблюдался во время использования технологии распознавания речи при подготовке протоколов флюорографических исследований. Однако применение СЭМД препятствует использованию системы голосового ввода.

При описании КТ органов грудной клетки у пациентов с подозрением на новую коронавирусную инфекцию COVID-19 система голосового ввода не повлияла на длительность процесса подготовки протоколов исследований. Это можно объяснить гибридным типом протокола, в котором присутствует как структурированная, стандартизированная часть, так и поле свободного ввода для описания дополнительных находок [12]. Стандартизированная и структурированная части протокола, содержащие информацию о локализации, распространении, объеме поражения и характере изменений паренхимы легких, значительно ускоряют процесс заполнения медицинского документа. Поле свободного ввода требовало от врачей ручного или голосового заполнения выявленных дополнительных находок.

Наибольшую эффективность система голосового ввода продемонстрировала при подготовке протоколов МРТ головного мозга и КТ органов грудной клетки, брюшной полости и малого таза. При подготовке протоколов подобного типа исследований врачи используют нарративный метод описания. Такие исследования зачастую содержат большое количество патологических изменений, как целевых, так и случайных находок, что требует от врача-рентгенолога их детального описания в медицинском документе. В подтверждение этого стоит отметить, что среднее значение и медиана длительности подготовки протоколов для вышеописанных КТ и МРТ имели наибольшее значение в обеих группах при сравнении с длительностью подготовки протоколов других типов исследований. Основная сложность стандартизации протоколов вышеуказанных исследований заключается в большой вариабельности возможных патологических изменений и отсутствии единого общепринятого словаря рентгенологической терминологии [10]. Однако нами уже была предпринята попытка разработки подобного словаря для применения совместно с системой голосового ввода при описании протоколов КТ [13].

Отдельно стоит отметить эффективностьприменения системы голосового ввода при подготовке протоколов рентгенографических исследований, проведенных в травматологических пунктах. Это связано с тем, что при описании таких исследований используются протокол сосвободным полем ввода, где врач-рентгенолог в 2–3 предложениях, применяя нарративный метод, интерпретирует рентгенологические находки.

Полученные результаты сложно сравнить с зарубежными исследованиями по данному научному направлению. Ранее в некоторых зарубежных странах применялась отличная от отечественной методология подготовки протоколов рентгенологических исследований. Врачи-рентгенологи производили аудиозаписи с помощью диктофона, которые в дальнейшем расшифровывали и переводили в текстовый формат медицинские транскрипционисты. Подавляющее большинство современных зарубежных исследований подтверждает эффективность применения технологии распознавания речи при сравнении с результатами, полученными от медицинских транскрипционистов [7, 8].

Система голосового ввода является новыминструментом для российских врачей-рентгенологов. По результатам опроса, 62,8% врачей-рентгенологов отметили, что технология распознавания речи повышает эффективность работы вне зависимости от типа рентгенологических исследований, которые они описывают [14]. Можно предположить, что для части специалистов вербальный тип подготовки медицинской документации может быть более приемлем в связи с их индивидуально-психологическими чертами. Данная гипотеза требует дальнейшего изучения.

Заключение

Применение системы голосового ввода при подготовке протоколов рентгенологических исследований продемонстрировало разную эффективность. Для структурированных и стандартизированных протоколов, которые применяются при описании результатов маммографических и флюорографических исследований, технология оказалась неэффективна. Наибольшая результативность был достигнута при подготовке протоколов КТ и МРТ, которые зачастую содержат большое количеством патологических изменений и требуют объемного описания выявленных рентгенологических находок.



СВЕДЕНИЯ ОБ АВТОРАХ

Кудрявцев Никита Дмитриевич (Nikita D. Kudryavtsev) – младший научный сотрудник сектора стандартизации и контроля качества отдела инновационных технологий, ГБУЗ «НПКЦ ДиТ ДЗМ», Москва, Российская Федерация
E-mail: n.kudryavtsev@npcmr.ru
https://orcid.org/0000-0003-4203-0630

Владзимирский Антон Вячеславович (Anton V. Vladzymyrskyy) – доктор медицинских наук, заместитель директора по научной работе, ГБУЗ «НПКЦ ДиТ ДЗМ», Москва, Российская Федерация
E-mail: a.vladzimirsky@npcmr.ru
https://orcid.org/0000-0002-2990-7736