En las partes 1 y 2 de esta serie anteriormente explicamos las ventajas y razones por las que empresas, contact centers e instituciones graban llamadas telefónicas.  En este último post de la serie vamos a abordar algunos consejos técnicos y operativos que deben tomarse en cuenta para una exitosa grabación de llamadas telefónicas.

Consideraciones tecnológicas y operativas 

La grabación de llamadas es una práctica que se lleva a cabo desde hace décadas. Sin embargo, la tecnología ha evolucionado significativamente por lo que es vital estar enterado de las más nuevas técnicas y procedimientos para hacerlo eficientemente.  A continuación te describimos algunas de las más importantes consideraciones a tener en cuenta cuando se implementa o renueva un sistema de grabación de llamadas telefónicas.

SIP vs TDM

Hoy en día la tecnología dominante en telefonía es SIP (Session Initiation Protocol), que es como se conoce al protocolo más popular de Voz por IP (VOIP o Voice over IP).  Esta tecnología está optimizada para que la voz viaje en forma de paquetes de datos entre equipos de cómputo y consecuentemente es la que más fácilmente permite que las llamadas telefónicas sean grabadas, almacenadas, transmitidas y reproducidas por equipos de cómputo convencionales. 

Por otro lado, todavía hay instalados en el mercado muchos equipos de telefonía con tecnología TDM (Time Division Multiplexing) que presentan un reto mayor para la grabación de llamadas.  En TDM, a diferencia de SIP, es necesario convertir las conversaciones a streams de audio digital en formatos que puedan ser interpretados, almacenados y reproducidos por computadoras convencionales.

Esta conversión se hace típicamente mediante equipos de conversión denominados gateways, que pueden llegar a ser costosos y difíciles de escalar.

Sin duda la tecnología SIP es la mejor cuando se requiere una grabación masiva de llamadas telefónicas y las empresas que todavía utilicen equipos que todavía utilicen TDM deberán analizar si les conviene adquirir equipos de grabación que les permitan mantener su tecnología anterior o ya migrar a SIP.

Metadata e Indices

La utilidad y valor de las grabaciones telefónicas es tan alta como sea la facilidad de usarlas cuando se requieren. Si todas las llamadas son grabadas, pero resulta difícil o imposible localizarlas cuando se requieren, de poca o nula utilidad serán. En cambio, un sistema de grabación de llamadas que permite localizar una llamada específica, entre miles o millones de llamadas, en cuestión de segundos, es el que demostrará ser más útil y valioso.  

Para caer en este segundo caso, donde las grabaciones se pueden localizar inmediatamente, es importante que el sistema de grabación etiquete cada llamada con metadata, o información relacionada a la llamada, como fecha, hora, duración, números telefónicos, agente, cliente, motivo, codificación de resultado, producto, etc. 

En la medida que la metadata sea rica en detalle es que las llamadas serán fácilmente localizables al momento de requerirse. La metadata de las grabaciones puede viajar en el nombre de cada archivo, lo que permitiría encontrarlos usando las funciones del sistema operativo o alguna utilería de manipulación de archivos.

Otra forma, más elaborada de almacenar la metadata de los audios, es en una tabla o base de datos, idealmente indizada, que permita la rápida localización de archivos de audio, entre miles o millones de grabaciones. 

Esta última requiere que los usuarios y administradores tengan conocimientos de bases de datos, elaboración de consultas (queries) y en general un nivel medio de experiencia con bases de datos.

Formatos de archivos de audio, bitrates y sampling

Los sistemas de grabación de llamadas modernos tienen la capacidad de almacenar los audios en archivos con distintos niveles de calidad de audio y compatibilidad para su posterior reproducción y almacenamiento.

En cuanto a tamaños de archivo para fines de transmisión y almacenamiento normalmente la regla es que a mayor calidad en ancho de banda de muestreo o sampling, y bits de muestreo por segundo o bitrate, mayor será el tamaño de los archivos a almacenar. Para grabación de llamadas los bitrates típicamente oscilan entre 32kbps para calidad mínima aceptable hasta 256kbps o más para alta calidad.

Algunos de los formatos de archivos de audio más populares entre los sistemas de grabación de llamadas son: .WAV, .OGG, .MP3, .M4A, .FLAC, .3GP, .WMA, entre otros. 

Para conocer más sobre los distintos formatos de audio hacer clic aqui. Para procesamiento avanzado de audios, como pueden ser reconocimiento de voz, se recomienda un muestreo de al menos 16kHz. 

Observancia legal

La mayoría de los países toman el asunto de la privacidad personal como algo muy serio, al grado de que existen leyes que regulan la manera en que se pueden grabar llamadas telefónicas legalmente. 

Aunque varía de país en país, la mayoría de las legislaciones en la materia exigen el cumplimiento de las siguientes normativas:

  • Una de las partes (o en algunas jurisdicciones todas las partes) involucradas en una conversación telefónica deben saber que están siendo grabadas desde el inicio de la conversación. 
  • Debe informar a las partes el propósito de grabar la conversación.
  • Debe darse a los interlocutores la opción de que la conversación no sea grabada y darse alguna alternativa práctica para llevar a cabo el asunto, por otro medio.
  • En algunos países se requiere consentimiento de las partes para grabar las llamadas.
  • Notificación audible de que la llamada está siendo grabada. (P.ej. tonos a intervalos regulares)

Reconocimiento y analítica de voz

La grabación masiva de llamadas telefónicas típicamente resulta en volúmenes audios tan grandes que se dificulta mucho su análisis.  Afortunadamente existen herramientas modernas que permiten automatizar gran parte del análisis de los audios. Estas herramientas procesan los audios de manera masiva (en tiempo real o con post-procesamiento) de la siguiente manera:

  • Reconocimiento de voz: Consiste en análisis avanzado de los audios, extrayendo los diálogos y convirtiéndolos a texto que puede ser consumido por personas o software.
  • Conteos semánticos que permiten identificar las palabras o frases empleadas, así como su incidencia, por cada una de las partes involucradas en la conversación.
  • Análisis de sentimiento: Mapeo de las palabras y frases pronunciadas contra un diccionario de palabras asociadas a sentimientos. El resultado de este tipo de análisis es una calificación general de una conversación como positiva, neutral o negativa, que permite aislar solo aquellas conversaciones con calificaciones determinadas (p.ej. muy positivas o muy negativas) para su análisis posterior.
  • Detección automática de idioma: permite que las llamadas que vayan a ser auditadas para calidad sean turnadas a los supervisores que hablen el idioma de la conversación.
  • Apego a guión: es posible automatizar la revisión del apego a un guión específico. Por ejemplo: verificar que los agentes hayan saludado y despedido con ciertas frases específicas, o que hayan mencionado ciertas palabras como parte de su gestión de llamada.

Como podemos ver, la tecnología permite hacer un tratamiento muy avanzado de la gestión de llamadas que puede incrementar sustancialmente la productividad de un centro de contacto.