Google quiere utilizar el reconocimiento vocal para la transcripción de conversaciones médicas | Nación Farma

Google quiere utilizar el reconocimiento vocal para la transcripción de conversaciones médicas

- Por

Un  registro médico completo y bien elaborado ayuda a crear una buena atención clínica, ya que le permite al facultativo manejar información de calidad con respecto a los pacientes que atiende, así como también sirve para comunicar su pensamiento, inquietudes y planes al resto del equipo en medio de un trabajo interdisciplinario.

El problema: demasiados registros y agotamiento

Desafortunadamente, los médicos pasan una parte nada despreciable de su tiempo  llenando documentación, en vez de atender a los pacientes a su cargo. Este tiempo, según datos obtenidos en los E.E.U.U., se traduce en unas 6 horas, aproximadamente, de una jornada laboral de 11 horas, en la completación de los registros electrónicos de salud (EHR).

Esta tarea que debe realizar el médico en cuanto a la transcripción de la información recopilada a partir de los pacientes, tanto de la anamnesis como de la revisión médica, es de vital importancia para completar la historia clínica para que los registros médicos sean precisos y de que todas las observaciones, prescripciones y conversaciones del médico con los pacientes estén adecuadamente documentadas.

De manera consecuente con esta extensa labor que implica extensas horas en labores de “secretaría”, un estudio realizado recientemente encontró que más de la mitad de los médicos encuestados informaron experimentar al menos un síntoma de agotamiento.
Para ayudar a transcribir la información obtenida, muchos médicos han comenzado a utilizar a los escribanos médicos como parte de su trabajo. Estos secretarios escuchan las conversaciones entre el paciente y el médico y elaboran las notas para completar el EHR, que según los datos aportados por otro estudio, la introducción de los ayudantes no solo mejoró el nivel de satisfacción de los médicos, sino también la calidad y precisión de estos datos incorporados.

Una desventaja de este sistema es que la cantidad de conversaciones médico-paciente que necesita un secretario es muy superior a la capacidad de las personas que se encuentran disponibles para realizar los registros médicos, además, no en todos los servicios de salud es factible implementar este sistema, que además lleva un costo adicional asociado.

El aporte de Google

Google quería ver si las tecnologías de reconocimiento de voz que están disponibles en Google Assistant, Google Home y Google Translate podrían ser utilizadas para automatizar el proceso de transcripción y ayudar a los médicos a tomar notas de manera más rápida.

Con este propósito, Google, en un reciente estudio para probar este concepto desarrolló un sistema que utilizaba dos modelos automáticos de reconocimiento de voz: uno que está basado en el fonema de Connectionist Temporal Classification (CTC) y otro, estructurado en base al grafema Listen Attend and Spell (LAS). Fueron probados utilizando unas 14,000 horas de voz grabada.
El resultado que arrojó evidenció una tasa de error en la transcripción de palabras muy importante,  del 20,1% para el modelo CTC y del 18,9% para el modelo LAS, además, en el caso del modelo CTC, fue necesario que los investigadores limpiaran el ruido en las grabaciones previo a su procesamiento y análisis.

Pero pese a los errores que mostró el estudio ” Reconocimiento de voz para conversaciones médicas “, los investigadores probaron que es posible construir modelos de Reconocimiento Automático de Habla (ASR) para transcribir conversaciones médicas. Si bien la mayoría de las soluciones actuales de ASR en el ámbito médico se centran en la transcripción de dictados médicos (es decir, el habla de un solo emisor que basa su discurso  en terminología médica predecible), esta investigación muestra que es posible construir un modelo ASR que maneje conversaciones de varios oradores y que sirva para cubrir toda la complejidad que involucra el diagnóstico médico. Por lo tanto, este análisis mostró que ambos modelos funcionan de manera adecuada en aquella información médica relevante y, por lo tanto, pueden ser prácticos para la transcripción de conversaciones de índole médica.

En base a los resultados favorables que Google pudo obtener de este estudio, pronto comenzará a trabajar con médicos e investigadores de la Stanford University para determinar qué tipo de información clínicamente relevante puede extraerse de manera automática de las conversaciones médico-paciente, para poder así reducir el tiempo que conlleva el llenado de documentación, aumentando de esta manera el tiempo productivo en la atención los pacientes, que se traduzca en una práctica más minuciosa y especializada, con médicos más descansados, al estar liberados de sus tareas administrativas delegables.