Transcription Services

TRANSCRIPCIÓN BASE (×1)

Qué es

El archivo de texto plano (.txt) que genera directamente el motor Whisper. Sin intervención humana ni procesamiento por IA posterior.

Qué incluye

Texto corrido en un solo bloque, en el orden cronológico del audio. Puede incluir errores de transcripción, repeticiones, fragmentos en otros idiomas, muletillas y ruido textual.

Qué NO incluye

Identificación de hablantes. Separación en párrafos lógicos. Corrección de errores. Eliminación de ruido. Marcado de tramos inaudibles. Ningún tipo de formato ni estructura.

Para quién es útil

Clientes que quieren el texto bruto para procesarlo ellos mismos con sus propias herramientas. Investigadores, periodistas, profesionales que solo necesitan buscar en el texto.

Formato de entrega

Archivo .txt plano, codificación UTF-8.


NIVEL 1 — LIMPIEZA (×1.2)

Qué es

Una versión limpia y legible de la transcripción. El texto mantiene el orden cronológico exacto de la grabación. No se reestructura, no se reorganiza, no se sintetiza. Se limpia.

Qué incluye

3.1 Eliminación de ruido textual

Se eliminan: repeticiones involuntarias generadas por Whisper (ej: "Gracias" repetido 50 veces), fragmentos en idiomas incorrectos (Whisper a veces cambia de idioma), caracteres corruptos o ininteligibles, bucles de transcripción.

3.2 Corrección de errores evidentes

Se corrigen: errores de transcripción claramente identificables (ej: "texto respondido" → "texto refundido" cuando se refiere a legislación), números y fechas cuando el error es obvio por contexto. NO se corrigen contenidos ambiguos — se dejan tal cual.

3.3 Identificación tentativa de hablantes

Se etiquetan los hablantes con identificadores genéricos: [PRESIDENCIA], [CONCEJAL-1], [CONCEJAL-2], [SECRETARIO], [HABLANTE NO IDENTIFICADO]. La atribución se infiere del contexto (quién preside, quién responde a quién, nombres mencionados). Se marca explícitamente como TENTATIVA en el documento.

3.4 Marcado de tramos inaudibles

Los tramos donde la transcripción genera texto ininteligible se marcan como [INAUDIBLE — descripción]. Se incluye orientación sobre qué falta para facilitar la verificación con el audio original.

3.5 Separación en párrafos

El texto se divide en párrafos coherentes por intervención de cada hablante. Cada cambio de interlocutor genera un párrafo nuevo.

Qué NO incluye

Reorganización del contenido (el orden es estrictamente cronológico). Extracción de votaciones o acuerdos. Síntesis o resumen de intervenciones. Notas editoriales. Estructura por puntos del orden del día. Formato de acta ni ningún formato específico.

Para quién es útil

Cualquier cliente que necesite un texto legible como base de trabajo. Secretarios que van a redactar el acta ellos mismos. Profesionales que necesitan revisar qué se dijo en una reunión.

Formato de entrega

Documento .docx con encabezado de metadatos, leyenda de hablantes, disclaimer sobre la identificación tentativa, y transcripción cronológica.


NIVEL 2 — ESTRUCTURADO (×1.5)

Qué es

Una versión organizada y procesada de la transcripción. El contenido se reestructura por secciones temáticas (puntos del orden del día en un pleno, temas en una reunión). Incluye extracción de datos clave y atribución de intervenciones.

Qué incluye (todo lo del Nivel 1, más)

4.1 Estructura por secciones

El contenido se organiza bajo epígrafes que reflejan los puntos tratados. En un pleno municipal: puntos del orden del día. En una reunión: temas abordados. El texto deja de ser cronológico puro para ser temático.

4.2 Extracción de votaciones y acuerdos

Se extraen y formatean las votaciones con resultado: votos a favor, en contra, abstenciones. Los acuerdos adoptados se señalan.

4.3 Atribución de intervenciones

Los hablantes se identifican por nombre cuando es posible (no solo por etiqueta genérica). La atribución sigue siendo inferida y puede requerir verificación, pero es más precisa que en el Nivel 1 porque el contexto de la reestructuración ayuda a identificar quién habla.

4.4 Síntesis de intervenciones confusas

Los intercambios caóticos con múltiples personas hablando a la vez se sintetizan en un resumen de lo tratado, con nota indicando que el tramo original era confuso.

4.5 Notas contextuales

Se añaden notas breves cuando el contexto lo requiere: referencias legales corregidas, aclaraciones sobre terminología, indicaciones de que falta información por verificar.

Qué NO incluye

Formato de acta oficial. Adaptación al estilo o plantilla del cliente. Redacción formal administrativa. Validación jurídica del contenido. Estos elementos formarían parte de un posible Nivel 3 (Premium) que se definiría junto al cliente.

Para quién es útil

Ayuntamientos que necesitan el contenido organizado para redactar el acta. Empresas que quieren un resumen estructurado de sus reuniones. Cualquier organismo que necesite consultar rápidamente qué se trató y qué se decidió.

Formato de entrega

Documento .docx con encabezado de metadatos, tabla de asistentes identificados, índice de puntos tratados, contenido organizado por secciones, votaciones formateadas y notas técnicas sobre incidencias de la transcripción.