UNIVERSIDAD NACIONAL DE TRUJILLO
ESCUELA DE POSTGRADO
SECCIÓN DE POSTGRADO EN EDUCACIÓN Y CC.CC.
MAESTRÍA LINGÜÍSTICA Y COMUNICACIÓN

Proyecto de Investigación
NIVEL DE EFECTIVIDAD DE LA SÍNTESIS DE VOZ TTS PARA MEJORAR LA
COMPRENSIÓN LECTORA EN ESTUDIANTES DE SECUNDARIA Y SUPERIOR.
Autor:
Bach. CLAUDIO ARTURO GARCÍA CASTRO
Asesor: DR. CARLOS CALDERÓN CALDERÓN
TRUJILLO-PERÚ
2023
I.
GENERALIDADES
I.1 Título:
Efectividad de la síntesis de
voz TTS para mejorar la comprensión lectora en estudiantes de secundaria o
superior.
I.2 Autor:
1.2.1 Nombre: Claudio Arturo García Castro
1.2.2 Grado Académico: Bachiller en Ciencias de
la Comunicación
1.2.3
Título Profesional: Bachiller en Ciencias de la Comunicación
1.2.4
Dirección:
1.2.5
Programa de interés: Maestría en Lingüística y Comunicación
1.3
Asesor
1.3.1
Nombre: Carlos Calderón Calderón
1.3.2
Grado académico: Doctor en Ciencias
de la Educación
1.3.3
Título profesional: Lic. en
Educación, mención Idiomas
1.3.4
Dirección laboral: Universidad
Nacional de Trujillo
1.3
Tipo de Investigación
1.3.1
De acuerdo al fin que se persigue: Aplicada
1.3.2
De acuerdo al diseño de investigación:
Descriptiva
1.5. Localidad e institución donde se desarrollará el
proyecto
1.5.1
Localidad: Trujillo, La Libertad / Cajamarca, Cajamarca
1.5.2
Institución: Universidad Privada del Norte / Cabrera I.E.
1.6
Duración de la ejecución del
proyecto (en meses): 12
1.7
Cronograma de trabajo
|
ACTIVIDAD |
MES 1 |
MES 2 |
MES 3 |
MES 4 |
MES 5 |
MES 6 |
MES 7 |
MES 8 |
MES 9 |
MES 10 |
MES 11 |
MES 12 |
|
Preparación de instrumentos de recolección de datos |
X |
x |
x |
|
|
|
|
|
|
|
|
|
|
Recolección de datos |
|
|
|
x |
x |
x |
|
|
|
|
|
|
|
Análisis de datos |
|
|
|
|
|
|
x |
x |
x |
|
|
|
|
Elaboración del informe |
|
|
|
|
|
|
|
|
|
x |
x |
x |
1.8 Recursos
1.8.1 Personal
1.8.2 Bienes
1.8.2.1. De consumo
1.8.2.2. De inversión
1.8.3 Servicios
1.9 Presupuesto
1. Presupuesto:
Sesiones de lectura TTS
- alquiler de aula: (por hora) 100
soles, 20 sesiones. (s/. 2000)
- tabletas: 500
soles la unidad, 12 unidades. (s/. 6000)
- audífonos: 30 soles par, 12 pares (s/. 360)
- laptop: Intel
Core i7: 2500 soles. (s/. 2500)
Subtotal: s/. 10 860
Gastos de refrigerios:
s/. 100
Subtotal:
s/. 100
Papelería para pruebas de
comprensión lectora e impresiones:
Lapiceros, 20 unidades, precio: s/.
40
Papel: 250
unidades de papel bond, s/. 12
Impresiones: s/.
50
Subtotal:
s/. 102
Pago estadista:
Pago a estadista: s/.
1500
Subtotal:
s/. 1500
Transporte:
Trujillo: s/.
400
Cajamarca:
Interprovincial: s/.
360
Local: s/.
200
Subtotal:
s/. 960
TOTAL:
13, 522 NUEVOS SOLES
1.10 Financiamiento
1.10.1 Con recursos propios
II.
PLAN DE INVESTIGACION*
II.1 Antecedentes, realidad problemática y justificación del
problema
2.1.1
Antecedentes
Nordström, T., Nilsson, S., Gustafson, S., & Svensson,
I. (2019). En su estudio “Assistive
technology applications for students with reading difficulties” investigan el impacto de la tecnología de asistencia en la
habilidad de lectura tradicional, la capacidad de asimilar y comunicar texto a
largo plazo, y la motivación de los estudiantes en el trabajo escolar y la
lectura. Se encontró que la tecnología de asistencia, como la tecnología de
texto a voz (TTS), mejora la decodificación y la capacidad de absorber texto.
Sin embargo, los resultados sobre la asimilación y comunicación de textos
fueron menos claros. Se destacó la importancia de la motivación en el trabajo
escolar, y la intervención de la tecnología de asistencia demostró contribuir
significativamente a la motivación y seguridad de los estudiantes. La
tecnología de asistencia no solo compensa las dificultades, sino que también
promueve el desarrollo de habilidades de lectura. Es necesario realizar
investigaciones adicionales para obtener una mejor comprensión del impacto, a
largo plazo, de la tecnología de asistencia en estudiantes con dificultades en
la lectura y escritura.
Otra investigación, realizada
por G Wood, H. Moxley, L. Tighe, K. Wagner en el año 2017 y que lleva por
título “Does Use of Text-to-Speech and
Related Read-Aloud Tools Improve Reading Comprehension for Students with
Reading Disabilities?” concluyó que: La utilización de la tecnología de
texto a voz o lectura en voz alta tiene un efecto beneficioso en la comprensión
de lectura de individuos con dificultades en este ámbito. Apuntan que los
estudios están demostrando cada vez más la efectividad de la tecnología de
texto a voz y herramientas relacionadas en la mejora de la comprensión textual . Sin embargo, se necesitan más investigaciones
para explorar diferentes tipos de presentación de texto, como diferentes
paquetes de software y dispositivos de visualización, y también para comprender
mejor cómo los estudiantes interactúan con estas tecnologías y cómo impactan en
su comprensión de lectura. Aunque los mecanismos exactos aún no están claros,
los resultados sugieren que la presentación de texto a voz/lectura en voz alta
puede ser útil para los estudiantes con dificultades en la lectura. Indica que
se requieren diseños de estudio más sólidos para controlar los posibles
efectos.
2.1.2 Realidad problemática
El problema de la comprensión lectora
La importancia de la lectura
trasciende la educación formal, alcanzando ámbitos sociales y culturales más
allá del entorno escolar. Además, fomentar prácticas de lectura adecuadas
contribuye al desarrollo de la comprensión lectora en los estudiantes de nivel
secundaria, lo que puede repercutir en su formación lectora y en su desempeño
académico y personal. (Valencia, 2021) La capacidad de comprensión lectora es
esencial tanto en el contexto educativo como en la vida diaria, dado que nos
posibilita interpretar textos escritos y desenvolvernos eficazmente en la
sociedad. No obstante, se han observado pruebas de que los estudiantes no
alcanzan niveles apropiados de comprensión de lectura. Por ejemplo, según la
prueba PISA 2018 realizada por la OCDE, Perú se ubicó entre los últimos países
evaluados, con un promedio de 401 puntos en comprensión lectora, muy por debajo
del promedio general de 487 puntos. La Evaluación Censal de Estudiantes 2018
(ECE), realizada por el Ministerio de Educación, arrojó resultados similares,
con un 56,1% de desaprobación en comprensión lectora en estudiantes de segundo
de secundaria a nivel nacional. Estas deficiencias en la comprensión lectora
persisten incluso en el nivel de educación superior. Un estudio realizado por
De la Puente en dos universidades particulares de Lima Metropolitana reveló que
el 96,7% de los estudiantes no pudo comprender ninguna de las pruebas de
comprensión lectora aplicadas.
Esto indica que el perfil del
analfabeto funcional se ha evolucionado en las últimas décadas. Antes se
asociaba con jóvenes o adultos de sectores socioeconómicos desfavorecidos, pero
en la actualidad no se limita necesariamente a estas circunstancias. Incluso
aquellos que disponen de los medios económicos para acceder a la educación
universitaria privada pueden presentar deficiencias en la competencia lectora.
En resumen, tanto a nivel nacional como en el ámbito universitario, se
evidencian deficiencias en la comprensión lectora. Estos problemas persisten a
pesar de los recursos disponibles y la capacidad económica de algunos
estudiantes, lo que destaca la necesidad de abordar esta realidad problemática
y buscar soluciones efectivas.
En relación a los elementos que influyen en las
dificultades en la comprensión de lectura.
Según Defior (1996), existen
ocho factores que intervienen en las dificultades de la comprensión lectora. El
primer factor es la dificultad en la codificación, donde los lectores se
enfocan en reconocer letras y palabras, lo cual sobrecarga la memoria operativa
y tiene un impacto en la comprensión. El segundo factor es la falta de claridad
sobre los requisitos de la tarea, donde los lectores se enfocan en la
decodificación léxica y descuidan el procesamiento sintáctico y semántico, así
como las estrategias cognitivas y metacognitivas. El tercer factor es la
pobreza de vocabulario, ya que los malos lectores tienen dificultades para
comprender textos debido a un menor número de palabras que comprenden. El
cuarto factor es la escasez de conocimientos previos, ya que el conocimiento
almacenado en la memoria desempeña una función relevante en la comprensión de
textos. El quinto factor es el problema de memoria, donde la memoria de corto
plazo afecta la comprensión de ideas y la conexión temática. El sexto factor es
el desconocimiento o falta de dominio de estrategias de comprensión, lo que
dificulta la comprensión del texto. El séptimo factor es la falta de control y
dirección del proceso de lectura, donde la metacognición y el empleo de
estrategias cognitivas y metacognitivas son fundamentales. El octavo factor es
la interdependencia de todos los factores que tienen influencia en la
comprensión, incluyendo los factores afectivo-motivacionales. Estos factores
trabajan de manera interrelacionada y evidencian la complejidad del proceso de
comprensión lectora.
Sobre tendencias y cambios en los hábitos de lectura en la
era digital.
Las TIC han transformado la
experiencia lectora, diversificando las plataformas y permitiendo la
interacción con comunidades virtuales, lo que ha resultado en un cambio de
roles entre las instituciones tradicionales intermediarias de la lectura. En
este sentido, es importante reconocer las prácticas lectoras emergentes entre
los jóvenes universitarios para actualizar modelos y estrategias de lectura en
las instituciones educativas. Conocer estas prácticas actuales de lectura y
escritura en profundidad es fundamental para desarrollar programas de formación
lectora y escritura creativa en las universidades. Estos programas deben
considerar los diversos soportes y plataformas utilizados por la generación
actual de jóvenes, con el objetivo de replantear el significado de la lectura y
cómo este acto implica respuestas, reacciones e interacciones creativas en el
contexto actual, transformando así los roles y prácticas tradicionales
relacionadas con la lectura.
Desarrollo de tecnologías de síntesis de voz y su
aplicabilidad en la educación.
La síntesis de voz es una
tecnología que permite generar sonidos de habla a partir de texto escrito. Esta
tecnología tiene diversas aplicaciones en la educación, como facilitar el
acceso a la información a personas con discapacidad visual o auditiva, mejorar
la pronunciación y el vocabulario de los estudiantes de idiomas, o crear
contenidos multimedia interactivos y personalizados. Según García-Mata et al.
(2000), la síntesis de voz se basa en dos componentes principales: el análisis
del texto y la generación del habla. El análisis del texto consiste en extraer
la información lingüística y prosódica del texto, como las unidades fonéticas,
el acento, la entonación y la duración. La generación del habla consiste en
producir los sonidos correspondientes a partir de una base de datos de muestras
de voz o de un modelo matemático del tracto vocal. Existen diferentes métodos y
técnicas para realizar estos procesos, que varían según el idioma, la calidad y
la naturalidad del habla sintetizada. Algunos ejemplos de sistemas de síntesis
de voz en español son HADIFIX, desarrollado por la Universidad de Bonn, o el
sistema AT&T Next-Gen TTS, que utiliza redes neuronales para generar habla
natural y expresiva.
Tecnología de conversión de texto a voz y comprensión lectora
En un estudio realizado por
Wood, Tighe & Wagner (2018) se afirma que, con el objetivo de mejorar las
habilidades de comprensión de lectura de los estudiantes, se ha ampliado la
implementación de la tecnología de conversión de texto a voz y las herramientas
de lectura en voz alta. Estas herramientas permiten la traducción del texto
escrito a formato hablado, lo que posibilita escuchar el texto mientras se
sigue leyendo. Asimismo, observan que no se dispone de información clara sobre
la efectividad de la conversión de texto a voz en la mejora de la comprensión
lectora. Por ello, es importante analizar los impactos de estas herramientas
tecnológicas en los estudiantes con dificultades en comprensión lectora.
Según el estudio de Svensson,
Nordström, Lindeblad, Gustafson, Björn, Sand, Almgren/Bäck y Nilsson (2021),
titulado “Efectos de la tecnología de asistencia para estudiantes con
dificultades en lectura y escritura”, el empleo de la tecnología de apoyo muestra
indicios de tener efectos transferibles en las habilidades de lectura y ofrece
respaldo, particularmente para los estudiantes con mayores dificultades.
Además, se observa un incremento en la motivación hacia las tareas escolares en
general. Nuestra experiencia también resalta los desafíos que surgen al medir
la aptitud para comprender y comunicar el texto. Asimismo, se indica que,
durante aproximadamente treinta años, se ha utilizado la tecnología de
asistencia como una herramienta para abordar las dificultades en la lectura, y
en años recientes, se han introducido tabletas con aplicaciones que permiten la
conversión de texto a voz y de voz a texto para brindar apoyo en las
habilidades de lectura y escritura. A pesar de esto, observan, existe una escasez
de investigaciones rigurosas y científicas que examinen en detalle los
beneficios de esta tecnología. La investigación en mención tuvo como propósito
analizar los impactos de la tecnología de asistencia en estudiantes que
enfrentan serias dificultades en el ámbito de la lectura. Para ello contó con
la participación de 149 individuos, divididos en un grupo de intervención y un
grupo de control. El grupo de intervención recibió un total de 24 sesiones de
entrenamiento en el uso de tecnología de asistencia, mientras que el grupo de
control siguió recibiendo el tratamiento estándar o habitual.
Estas herramientas pueden
tener diversos usos y beneficios, tanto para las personas con dificultades de
lectura o visión, como para aquellas que desean mejorar sus habilidades
lectoras o acceder a información de forma más cómoda y rápida. Uno de los aspectos
que pueden verse favorecidos por el uso de la síntesis de voz es la motivación
y el interés por la lectura, especialmente en el ámbito académico. Según un
estudio realizado por Muñoz et al. (2016), los estudiantes con alta motivación
por la lectura académica presentan dinámicas vinculadas con el desafío, el
ingreso a la lógica universitaria y las proyecciones académico-profesionales.
Estos factores pueden ser estimulados por el uso de la síntesis de voz, ya que
esta herramienta puede facilitar la comprensión de textos complejos, favorecer
la autonomía y el autoaprendizaje, y ampliar las posibilidades de acceso a
fuentes diversas y actualizadas.
Las herramientas de síntesis
de voz son programas o aplicaciones que convierten el texto escrito en voz
hablada, utilizando tecnologías de inteligencia artificial y redes neuronales.
Estas herramientas pueden tener diversos beneficios para la motivación y el
interés por la lectura, especialmente para personas con dificultades lectoras,
como la dislexia, o con barreras de acceso al texto impreso, como la ceguera o
la baja visión. Según un estudio realizado por Speechify, una aplicación de texto a voz, el uso de esta
herramienta aumentó el nivel de comprensión lectora, la concentración y la
retención de información de los usuarios, así como su velocidad de lectura y su
disfrute por los textos. Además, el estudio señala que las herramientas de
texto a voz permiten optimizar el tiempo de lectura, llevarla a cualquier lugar
y escoger entre diferentes voces naturales y fluidas que se adapten a las
preferencias del lector. De lo cual se podría concluir que las herramientas de
síntesis de voz tienen un impacto positivo en la motivación y el interés por la
lectura, al facilitar el acceso al contenido escrito y mejorar la experiencia
lectora.
La comprensión lectora es una
habilidad fundamental para el aprendizaje y el desarrollo personal. Sin
embargo, muchos estudiantes de secundaria y superior presentan dificultades
para leer y comprender textos de diferentes disciplinas. Una posible solución a
este problema es el uso de herramientas de síntesis de voz (TTS) que permiten
escuchar el texto mientras se lee, facilitando así la atención, la memoria y la
comprensión. El objetivo de esta investigación de grado es indagar si el uso de
herramientas de síntesis de voz TTS para la lectura de textos mejora la
comprensión lectora de estudiantes de secundaria y superior. Para ello, se
realizará un estudio experimental con dos grupos: uno que leerá los textos con
ayuda de TTS y otro que los leerá sin TTS. Se medirá el nivel de comprensión
lectora antes y después de la intervención con pruebas estandarizadas. Se
espera que los resultados muestren una mejora significativa en el grupo que usó
TTS, lo que apoyaría la hipótesis de que esta herramienta puede ser beneficiosa
para el desarrollo de la comprensión lectora.
II.2 Marco teórico:
2.2.1 COMPRENSIÓN LECTORA
1. Procesos
cognitivos involucrados en la comprensión lectora:
McKee (2012), ofrece una visión
general del conocimiento adquirido sobre la comprensión lectora desde 1995
hasta la actualidad. Describe la comprensión lectora como una actividad
compleja que involucra múltiples variables. Examina las estrategias de lectura
y su relación con la comprensión lectora. Además, aborda la preocupación acerca
de cómo medir la comprensión lectora, y revisa la investigación que aborda esta
cuestión. Asimismo, presenta sugerencias para mejorar la comprensión lectora.
La lectura es fundamental para el
crecimiento personal y educativo, pero la comprensión lectora es aún más
crucial. Implica desglosar, analizar y reorganizar ideas e información, así
como comprender el mensaje del autor. La comprensión lectora abarca procesos de
nivel inferior (reconocimiento de palabras) y de nivel superior (sintácticos,
semánticos, entre otros). Para comprender lo que se lee, es necesario tener
familiaridad con la estructura y el tema del texto, así como utilizar
estrategias de lectura. El reconocimiento de palabras es clave y los buenos
lectores lo hacen de manera rápida y precisa. Por otro lado, los lectores menos
hábiles tienen dificultades con textos más complejos.
La lectura va más allá del
reconocimiento de letras, ya que implica comprender el significado y el
contexto. A medida que leemos, organizamos la información en patrones
reconocibles y establecemos conexiones directas o indirectas, lo que contribuye
a la comprensión. Según Norris (1998), existen dos tipos de procesamiento de
información visual: perceptual y conceptual. Los procesadores perceptuales
reciben información individual o agrupada, como letras, pasajes, fonemas y
formas de palabras, y la procesan asignando significado mediante el uso de
conocimientos previos, estructura del discurso y contexto. La comprensión
lectora, según Numan (2003), es un proceso fluido que combina la información
del texto con el conocimiento existente para llegar a un significado.
La comprensión lectora no se
limita solo a habilidades lingüísticas, sino que es una habilidad cognitiva
general. El Marco de Construcción de Estructuras (SBF) de Gernsbacher,
utilizado por Walter (2007), describe tres procesos automáticos e inconscientes:
establecer una base para una estructura mental, mapear nueva información en la
estructura en desarrollo y cambiar para construir una nueva subestructura.
Estos procesos se activan mediante la información de entrada, el conocimiento
del mundo del lector y el conocimiento del lenguaje del lector, utilizando
"nodos de memoria" como bloques de construcción para la comprensión.
La primera fase, conocida como
establecimiento de la base, comienza cuando se lee. A medida que el lector
avanza a través de frases, oraciones y párrafos, va desarrollando la
comprensión del material. El segundo proceso implica mapear nueva información en
una estructura ya existente. ¿Hay coherencia entre las dos estructuras? La
coherencia se logra cuando la nueva información se alinea con la información
previa en términos de tiempo, referencia y causa. Los elementos que se pueden
alinear requieren menos tiempo para procesar y recordar en comparación con los
que no se pueden alinear. El tercer proceso, llamado cambio, ocurre cuando lo
que se ha leído no es coherente con el conocimiento actual del lector. Esta
falta de coherencia activa otros nodos de memoria, lo que da lugar al
desarrollo de una nueva subestructura. La comprensión está relacionada con la
facilidad de recuperación de la información por parte del lector, que a su vez
está relacionada con el nivel de activación de la información.
Otro factor que se ha identificado
como influyente en la comprensión lectora es el tamaño del vocabulario del
lector. Según Hsueh-Chao y Nation (2000), un lector debe conocer
aproximadamente el 98% de las palabras de un texto para comprenderlo sin necesidad
de ayuda adicional. Además, la exposición repetida a nuevas palabras es
necesaria para desarrollar la comprensión. Se requieren al menos diez
exposiciones para que un lector adquiera una nueva palabra. Babayiğit
(2011:172) afirma que el conocimiento del vocabulario puede influir en la
comprensión lectora de dos formas: directamente, al afectar el significado del
texto, e indirectamente, al influir en las habilidades de lectura de palabras.
Grabe y Stoller (2002) sostienen que la habilidad de lectura va más allá de la
conciencia fonémica y las habilidades fonéticas, y que los maestros deben
abordar el tamaño del vocabulario.
La lectura y comprensión implican
la interacción de diversos procesos cognitivos, como la decodificación, la
comprensión de la estructura de las oraciones y el conocimiento previo. Según
Hudson (1996), estas habilidades incluyen el reconocimiento automático de
palabras y oraciones, la comprensión del contenido y esquema, las estrategias y
habilidades metacognitivas, así como el propósito y contexto de lectura. Sin
embargo, medir la comprensión lectora es un desafío debido a la diversidad de
enfoques y formatos de evaluación (Koda, 2005). Además, la naturaleza y
organización del texto influyen en la comprensión, siendo los textos
expositivos más difíciles de procesar que los narrativos (Feng, 2011).
La metacognición desempeña un
papel importante en la comprensión de lectura, ya que involucra el conocimiento
y la regulación de los procesos cognitivos. Carrell et al. (1998) identificaron
estrategias metacognitivas específicas, como establecer objetivos de lectura,
evaluar el material, corregir conceptos erróneos, analizar la estructura del
texto y ajustar la velocidad de lectura. Además, la comprensión lectora se ve
influenciada por factores internos del lector, como habilidades cognitivas,
conocimiento previo y características afectivas, así como por factores
externos, como el tipo y características del texto (Sadeghi, 2007).
Por último, se destaca la
importancia del tamaño del vocabulario en la comprensión lectora. Los lectores
deben conocer aproximadamente el 98% de las palabras de un texto para
comprenderlo sin ayuda adicional, y la exposición repetida a nuevas palabras es
necesaria para su adquisición (Hsueh-Chao y Nation, 2000). Los maestros deben
abordar el tamaño del vocabulario para promover una mejor comprensión lectora
(Grabe y Stoller, 2002). En resumen, la comprensión lectora es un proceso
complejo que involucra una variedad de habilidades y factores, y su medición
requiere un enfoque integral que considere tanto los aspectos cognitivos como
los contextuales.
2. Estrategias
y enfoques utilizados para mejorar la comprensión lectora
La mayoría de las personas tienen
estrategias personales que desarrollan como formas de entender lo que leen. Las
estrategias de lectura a menudo son enseñadas por los profesores y utilizadas
por los estudiantes para mejorar la comprensión lectora. Farrell (2001) afirmó
que los estudiantes pueden beneficiarse al aprender estrategias de lectura y
que estas estrategias pueden ser enseñadas. Yang (2006) determinó que el
procesamiento y la utilización de estrategias de monitoreo de la comprensión
brindan a los lectores una mayor ayuda en la comprensión del material. ¿Cuáles
son algunas de estas estrategias y en qué medida mejoran la comprensión
lectora?
La estrategia se define como un
plan o método diseñado para alcanzar un objetivo. Puede incluir comportamientos
deliberados y conscientes, así como comportamientos inconscientes. Una
estrategia de lectura se define además como "un proceso físico o mental
utilizado de manera consciente o inconsciente con la intención de facilitar la
comprensión y/o el aprendizaje del texto" (Davies, 1995). Las estrategias
están orientadas al lector y generalmente son una respuesta a un problema o
preocupación. Pueden haber obstáculos para utilizar estrategias de lectura en
cuanto a comprensión y entendimiento. Algunos lectores no procesarán
estrategias adecuadas para una situación particular o les faltará el
conocimiento de cómo utilizar la estrategia (Gerstein y otros, 2001).
Hopkins y Mackay (1997)
encontraron que los buenos lectores tenían más y variadas estrategias de
lectura que los lectores menos hábiles. Los buenos lectores son capaces de
resolver la incertidumbre asociada con palabras desconocidas o discurso más
extenso. Las estrategias generales de lectura incluyen cosas como predecir el
contenido, plantear preguntas, reconocer la estructura del texto, integrar
información, reflexionar, monitorear la comprensión, utilizar conocimientos
generales y reaccionar al texto (Yang, 2006). Los buenos lectores también son
capaces de codificar inferencias basadas en el conocimiento que los lectores
menos hábiles no logran codificar y, por lo tanto, son capaces de construir
representaciones consistentes con el tema del texto (Long y otros, 1996).
Otras estrategias comúnmente
utilizadas incluyen la capacidad de identificar los puntos clave del texto, ver
la conexión y organización de las ideas, y construir significado a partir de
estos puntos. Algunas estrategias adicionales incluyen SQ3R, esquematización,
subrayado y mapas de conocimiento (Baker, 2004; Mokhtari y Richard, 2002). Los
cinco pasos de las estrategias SQ3R son: examinar, cuestionar, leer,
recitar/recuperar y revisar. Un mapa de conocimiento funciona como su nombre
indica, es una representación de cómo se relaciona la información del texto. En
el estudio de Hayati (2009), se determinó que el subrayado era una estrategia
efectiva para ayudar en la comprensión lectora.
Otra estrategia es la toma de
apuntes, que fue definida por O'Malley y Chamot (1995:138) como "escribir
las palabras clave y conceptos en forma verbal, gráfica o numérica abreviada
para ayudar en la realización de una tarea de lenguaje". Fajardo (1996)
considera la toma de apuntes como una actividad compleja que combina la
lectura, la escucha, el resumen y la escritura. Un aspecto clave de la toma de
apuntes y la comprensión es que los estudiantes deben revisar sus apuntes
(Robinson y otros, 2006). Otra preocupación con respecto a la toma de apuntes
es que los estudiantes suelen ser malos tomando apuntes, registrando menos del
cincuenta por ciento del material crítico (Katayama y Robinson, 2000).
Rahmani (2011) encontró que los
estudiantes que utilizaron una estrategia de toma de apuntes con organizadores
gráficos tuvieron un rendimiento considerablemente mejor que los estudiantes
que utilizaron sus apuntes convencionales. Los apuntes gráficos y la
esquematización organizan las ideas y los puntos clave, mostrando sus
relaciones. Esto proporciona un mapa para que los estudiantes lo sigan al
revisar sus apuntes.
El Informe Nacional de Lectura
(2000) identificó varias estrategias de comprensión. Estas estrategias
incluyen: predicción/conocimientos previos, pensamiento en voz alta, estructura
del texto, representaciones visuales, resumen, preguntas/cuestionamiento,
monitoreo de la comprensión y aprendizaje cooperativo. Estas estrategias han
demostrado ser efectivas para ayudar a los lectores a comprender mejor lo que
están leyendo.
Duke y Pearson (2008)
identificaron dieciséis características o estrategias que utilizan los buenos
lectores. Estas estrategias incluyen la construcción, revisión y
cuestionamiento de los significados
2.2.2 SÍNTESIS DE VOZ TTS
SÍNTESIS
DE VOZ
Síntesis de voz
TTS
Tecnología de síntesis de voz TTS:
La síntesis de
voz se refiere a la capacidad de una computadora para generar un mensaje
hablado a partir de un texto escrito. Cuando el mensaje tiene un vocabulario
limitado, se puede lograr la síntesis de voz reproduciendo mensajes pregrabados
o combinando frases. En otras palabras, si el conjunto de palabras necesarias
para expresar el mensaje es reducido, se pueden utilizar grabaciones previas o
unir diferentes frases para crear el mensaje hablado. Esto permite a la
computadora "hablar" el texto de manera comprensible para el oyente.
Durante el proceso de diseño del sistema, se crea una colección de frases
pregrabadas que representan partes de oraciones. Por ejemplo, para un reloj
parlante, se puede construir una audioteca que contenga la frase "La hora
es ahora" y las pronunciaciones de los números del 0 al 20, 30, 40 y 50.
Esta biblioteca sería suficiente para permitir que la computadora pueda indicar
la hora en horas y minutos. Tomemos como ejemplo el caso de un reloj que
anuncia la hora. Si son las 21:37 horas, el reloj puede generar el mensaje
hablado uniendo la frase "La hora es ahora" con las palabras
"veinte", "uno", "treinta" y "siete".
En situaciones en las que los mensajes de salida están limitados en su
estructura y el número de mensajes es reducido, un sistema de concatenación de
frases bien diseñado puede ofrecer una calidad alta a un costo bajo. Sin
embargo, si se desea cambiar el vocabulario utilizado en los mensajes,
normalmente se requeriría una remodelación completa, a menos que se cuente con
la disponibilidad del hablante original que contribuyó con las grabaciones, y
se pueda recrear el entorno de grabación de manera precisa.
La calidad de un
sistema TTS dependerá tanto del procesamiento lingüístico como de la síntesis
de voz. El procesamiento lingüístico básico garantizará, por ejemplo, que los
números y las abreviaciones se interpreten y pronuncien correctamente, lo cual
es un factor importante en la evaluación general de calidad. Sin embargo, las
estrategias de evaluación más comunes para TTS hacen hincapié en la naturalidad
y la inteligibilidad. La inteligibilidad se mide a menudo mediante la capacidad
de los oyentes humanos para identificar correctamente el contenido fonético de
palabras sin sentido o de oraciones semánticamente impredecibles. Por otro
lado, la naturalidad se suele medir utilizando técnicas desarrolladas para
evaluar algoritmos de compresión de voz, como una evaluación subjetiva de la
calidad mediante comparación en parejas o una puntuación de opinión media
(MOS).
Historia de TTS
En el siglo
XVIII, se hicieron los primeros intentos de construir máquinas capaces de
hablar imitando el sistema vocal humano. Wolfgang von Kempelen desarrolló una
"máquina parlante" que era una ingeniosa representación mecánica del
aparato vocal. Utilizaba componentes como un fuelle para simular los pulmones,
una lengüeta para imitar las cuerdas vocales y un tubo de goma flexible que se
podía ajustar para producir los sonidos adecuados del "tracto vocal".
En 1939, Homer
Dudley presentó una versión electrónica de la máquina de von Kempelen en una
exposición. Su dispositivo, llamado VODER, permitía a los usuarios controlar
las resonancias del tracto vocal, lo que afectaba las características del
sonido, y también se podía controlar la fonación y la entonación mediante
palancas y pedales. Hacer que el VODER hablara era similar a tocar un
instrumento musical. Aunque tanto el VODER como la máquina parlante de von
Kempelen demostraron que era posible generar un habla bastante comprensible,
este proceso aún requería una interacción manual y no se podía lograr de manera
automática.
En los años 50,
se hizo el primer intento de automatizar el proceso mediante la creación de una
máquina de reproducción de patrones. Esta máquina generaba un patrón de sonido
siguiendo un espectrograma. En los primeros esfuerzos para desarrollar máquinas
parlantes, se puso más énfasis en la producción de sonido que en el análisis de
texto. Este enfoque se ha mantenido hasta hoy en día. Sin embargo, la calidad
del análisis lingüístico del texto es fundamental para determinar el nivel
máximo de calidad que se puede alcanzar en un sistema TTS completo. Este
análisis incluye la normalización del texto, la resolución de ambigüedades
entre homógrafos, el análisis del estrés y la conversión de grafemas a fonemas.
Es importante destacar que el análisis de texto está evolucionando desde un
enfoque tradicional basado en reglas hacia la integración de enfoques basados
en datos. Por ejemplo, se están utilizando métodos estadísticos para inferir
reglas generales a partir de ejemplos.
Desde sus
inicios, existieron dos enfoques competidores en la síntesis de voz. Uno se
centraba en detallar la representación de los articuladores involucrados en la
producción del habla, conocido como síntesis articulatoria. El otro enfoque se
centraba en modelar directamente la señal de habla utilizando un modelo de
fuente-filtro, también conocido como síntesis terminal-analógica. Este último
enfoque, más sencillo en términos de modelado, fue predominante en el
desarrollo de sintetizadores, como los basados en formantes y en la predicción
lineal. Sin embargo, la síntesis articulatoria sigue siendo un campo de
investigación activo.
El sintetizador
de formantes se basa en reglas para controlar parámetros de voz como la
sonoridad, duraciones y frecuencias. Se dividen en categorías de fuente y
filtro. Las reglas se extraen a partir de datos de habla parametrizados y su
extracción y refinamiento pueden ser procesos complejos. Un ejemplo destacado
de sintetizadores de formantes es el Klattalk de Dennis Klatt, que más tarde se
comercializó como DECtalk. La fortaleza de la síntesis basada en reglas radica
en su capacidad para ajustar las características del hablante y el estilo de
habla sin necesidad de realizar cambios significativos en el sintetizador. Sin
embargo, es importante tener en cuenta que, incluso en los sistemas más
avanzados, la voz sintética tiene limitaciones en términos de su naturalidad.
El sintetizador
predictivo lineal es un ejemplo de síntesis concatenativa de habla. A
diferencia de la síntesis basada en reglas, este enfoque tiene un conocimiento
limitado y la información se encuentra en los segmentos a concatenar. Los
parámetros del filtro se generan a partir del análisis de las trayectorias
reales del filtro de los segmentos de habla. Se utiliza el dífono como unidad
básica de síntesis para capturar las transiciones entre fonemas de manera
perceptualmente importante. Este modelo es sencillo de ajustar para modificar
la prosodia mediante cambios en la excitación o interpolación de los parámetros
del filtro. Sin embargo, tiene limitaciones en la calidad del habla sintética.
Se han introducido mejores modelos de producción, como el LPC con excitación de
múltiples pulsos, para mejorar la calidad, pero esto puede dificultar el
control prosódico.
El siguiente
avance importante fue la técnica de Solapamiento y Adición Pitch-Sincrónica
(PSOLA). Esta técnica permite manipular las características prosódicas de los
dífonos almacenados y la concatenación de los segmentos alterados
prosódicamente se realiza utilizando el mismo enfoque. En teoría, es posible
generar cualquier secuencia deseada de fonemas con la prosodia deseada
utilizando un inventario limitado de dífonos. Sin embargo, existe un límite en
cuanto a qué grado se puede manipular la prosodia antes de que se produzca una
distorsión audible. Además, esta técnica no resuelve directamente los problemas
asociados con las discontinuidades espectrales o de fase en los puntos de
concatenación. A pesar de ello, la técnica de PSOLA representó un gran avance
en términos de mejorar la naturalidad del habla sintética. Las técnicas basadas
en dífonos de PSOLA dependen de las características prosódicas predichas y la
calidad del habla sintética es vulnerable a las discontinuidades en las uniones
de los segmentos de dífono.
La síntesis
basada en selección de unidades busca evitar estas desventajas al eliminar o
reducir en gran medida la necesidad de manipular las formas de onda
almacenadas. En lugar de contar con un inventario cuidadosamente diseñado de
dífonos con una única versión neutral de cada uno, la síntesis basada en
selección de unidades se basa en una extensa base de datos de habla que captura
la mayoría de las variaciones prosódicas naturales. La idea fundamental es que
si se encuentra en la base de datos un contexto fonético y prosódico deseado,
nada suena más natural que eso. El enfoque consiste en buscar en la base de
datos (previamente procesada y etiquetada) una secuencia de unidades que
coincida mejor con la secuencia predicha a través del análisis del texto en el
motor TTS. Esta búsqueda se realiza utilizando programación dinámica. El costo
de utilizar una unidad específica de la base de datos se compone de dos partes:
el costo objetivo, que mide la similitud entre la unidad de la base de datos y
la unidad deseada, y el costo de concatenación, que evalúa la distorsión que se
producirá al unir la unidad con la unidad anterior de la base de datos.
Establecer el costo de concatenación en cero para las unidades de la base de
datos que se hablan consecutivamente favorece las secuencias de unidades que
ocurren naturalmente. Esto reduce las discontinuidades espectrales y tiende a
imitar las estructuras prosódicas presentes en la base de datos. La síntesis
basada en selección de unidades puede producir habla muy natural, aunque puede
tener dificultades si la base de datos no contiene buenas coincidencias. Los
críticos de esta técnica resaltan el problema de la cobertura de datos como el
principal desafío: debido a las enormes variaciones en el habla, resulta
imposible recopilar (y utilizar) una base de datos que abarque todas las
posibles variaciones fonéticas y prosódicas. Sin embargo, permitir una
manipulación prosódica limitada pero de alta calidad de las unidades de la base
de datos puede mitigar este inconveniente.
Aplicaciones de Síntesis de Voz: Avances y Desarrollos
El empleo de tecnologías de
síntesis de voz ha experimentado un notable crecimiento en diversos ámbitos,
gracias a los avances en la inteligibilidad de los sintetizadores. Estas
tecnologías han sido aplicadas principalmente en el ámbito de la accesibilidad,
brindando apoyo a personas con dificultades para acceder a la información
escrita o para comunicarse verbalmente. Además, se han explorado aplicaciones
educativas, como el aprendizaje de idiomas extranjeros y sistemas de traducción
de texto a voz para personas con dislexia. Asimismo, se han desarrollado
aplicaciones innovadoras en el campo de la multimedia y las telecomunicaciones.
Estos avances han impulsado la formación de grupos de investigación en
universidades y centros reconocidos a nivel internacional, quienes han
colaborado en proyectos interinstitucionales e internacionales enfocados en la
creación de sistemas de síntesis de voz multilingües. Estos desarrollos
reflejan el creciente interés en el desarrollo y aplicación de tecnologías de
síntesis de voz en diversos contextos (Cevallos Bone, 2023).
En el ámbito específico de la
síntesis de voz en español, se han llevado a cabo investigaciones
significativas en México. Se han desarrollado sintetizadores de voz utilizando
diferentes enfoques, como la síntesis de formantes y la síntesis concatenativa.
Estos trabajos han demostrado mejoras en la calidad de la voz generada e
incluyen reglas para la traducción de texto a voz. Además, se ha trabajado en
la creación de bases de datos de voz en español, con el propósito de analizar y
segmentar la voz para futuras aplicaciones. En la Universidad de las Américas
de Puebla, el Grupo de Tecnologías del Habla Tlatoa ha llevado a cabo
investigaciones en síntesis y reconocimiento de voz, desarrollando herramientas
y metodologías para la síntesis de voz en español mexicano, haciendo uso de
tecnologías de reconocimiento, producción y diálogo. Estos avances han
contribuido a la creación de sistemas y productos de síntesis de voz con alta
inteligibilidad en español (Cevallos Bone, 2023).
Es importante destacar que a nivel
internacional también se han desarrollado numerosos sistemas y productos de
síntesis de voz que ofrecen una excelente inteligibilidad en español. Estos
proyectos se realizan mediante la colaboración entre diferentes centros de
investigación y universidades de todo el mundo, con el respaldo de empresas y
organizaciones especializadas en recursos lingüísticos. La tendencia actual es
el desarrollo de sistemas de síntesis de voz multilingües basados en corpus, lo
que ha permitido lograr avances significativos en la calidad y diversidad de
las voces sintéticas disponibles en español (Cevallos Bone, 2023).
En resumen, el uso de tecnologías
de síntesis de voz ha encontrado aplicaciones en diversos campos, desde la
accesibilidad hasta la educación y la comunicación. Las investigaciones
realizadas en México y a nivel internacional han contribuido al desarrollo de
sistemas de síntesis de voz con mayor calidad y comprensibilidad en español.
Estos avances han sido posibles gracias a la colaboración entre diferentes
instituciones y la inversión en investigación y desarrollo en el ámbito de la
síntesis de voz (Cevallos Bone, 2023).
II.3 Formulación del problema
¿Cuál es la
efectividad del uso de herramientas tecnológicas síntesis de voz en la mejora
de la comprensión lectora en estudiantes de escuela secundaria o superior?
2.2.2 Objetivos
Objetivo general:
Evaluar la
efectividad del uso de herramientas tecnológicas de síntesis de voz TTS en la
mejora de la comprensión lectora en estudiantes de escuela secundaria y
superior.
Objetivos específicos:
⮚
Analizar el impacto del uso de herramientas de
procesamiento de lenguaje natural en la comprensión lectora de estudiantes de
escuela secundaria y superior.
⮚
Investigar las preferencias y la aceptación de
las herramientas tecnológicas de procesamiento de lenguaje natural y síntesis
de voz en los usuarios objetivo.
⮚
Identificar las limitaciones y desafíos asociados
con la implementación de estas herramientas en entornos educativos y clínicos.
⮚
Proponer recomendaciones para optimizar la
integración y el uso de las herramientas tecnológicas de procesamiento de
lenguaje natural y síntesis de voz en la mejora de la comprensión lectora.
2.3. Matriz de consistencia
|
PROLEMA |
OBJETIVOS |
HIPÓTESIS |
INDICADORES |
|
¿Cuál es la efectividad del uso de herramientas tecnológicas síntesis
de voz en la comprensión lectora en estudiantes universitarios? |
Evaluar la efectividad del uso de herramientas de tecnología de
síntesis de voz TTS, en la comprensión lectora en estudiantes universitarios. |
El uso de herramientas de tecnología de síntesis de voz TTS,
mejorarían la comprensión lectora en estudiantes universitarios. |
Variable independiente: Uso de tecnologías de síntesis de voz TTS. Indicadores de V.I.: -
Frecuencia de uso de las herramientas: -
Nivel de interacción con las herramientas: -
|
|
PE1 ¿De qué manera impacta el uso de la síntesis de voz TTS en la
comprensión lectora del estudiante? |
OB1: Examinar de qué manera impacta el uso de la síntesis de voz TTS
en la comprensión lectora del estudiante. |
El uso de la síntesis de voz TTS influyen positivamente en la
comprensión lectora del estudiante. |
Variable dependiente: Comprensión lectora de estudiantes universitarios. Indicadores de V.D.: -
Mejora en resultados de evaluaciones de comprensión lectora. -
Ortografía -
Percepción y satisfacción del estudiante |
|
PE2 ¿Qué factores de la experiencia del usuario influyen en la
efectividad del uso de TTS para la lectura y comprensión lectora estudiantes
de …? |
OB2: Determinar qué factores de la experiencia del usuario influyen
en la efectividad del uso de TTS para la comprensión de textos en estudiantes
de … |
Hay factores particulares de la experiencia de usuario que determinan
la efectividad del uso de TTS para la comprensión lectora de estudiantes de …
|
|
II.4
Operacionalización
de variables
|
VARIABLE |
DEFINICIÓN OPERACIONAL |
DEFINICIÓN CONCEPTUAL |
DIMENSIONES |
INDICADORES |
ITEMS |
|
Variable Dependiente: “Comprensión lectora de estudiantes” |
|
|
Nivel literal |
●
Identificación de información explícita en el texto. ●
Responder preguntas de opción múltiple o verdadero/falso sobre
detalles específicos del texto. ●
Relatar hechos o eventos presentes en el texto. |
|
|
Variable Dependiente: “Comprensión lectora de estudiantes” |
|
- Según Aliaga (2000) citado por Oré (2012), la
comprensión lectora es un proceso más complejo que implica elementos
adicionales además de relacionar el conocimiento nuevo con el ya obtenido. - Solé (2004) citado por Oré (2012) señala que la
comprensión lectora involucra tanto el texto, su forma y su contenido, como
las expectativas y conocimientos previos del lector. Además, destaca que la
lectura requiere decodificar y aportar al texto los objetivos, ideas y
experiencias previas, y que implica un proceso continuo de predicción e
inferencia basado en la información del texto y en la experiencia y
conocimiento previo del lector. |
Nivel inferencial |
●
Realizar inferencias sobre información implícita en el texto. ●
Identificar el propósito o la intención del autor. ●
Hacer predicciones o extraer conclusiones basadas en la
información proporcionada. |
|
|
Nivel crítico |
●
Evaluar la validez o confiabilidad de la información presentada
en el texto. ●
Expresar opiniones fundamentadas sobre el tema o el argumento
presentado. ●
Identificar sesgos o falacias en la argumentación del autor. |
|
|||
|
|
|
|
|
|
|
|
Variable Independiente: “Uso de síntesis de voz para la lectura de textos” |
|
|
Preferencias |
●
Comparación del uso de TTS con otros métodos de lectura
tradicionales. ●
Preferencia personal por el uso de TTS en situaciones
específicas de lectura. ●
Evaluación de la comodidad y facilidad de uso del TTS en
comparación con otros enfoques. |
|
|
Variable Independiente: “Uso de síntesis de voz para la lectura de textos” |
|
Según Sandoval de los Ríos (2020): El Text-to-Speech
(TTS) es una tecnología que permite reproducir habla humana de forma
artificial. Esta tecnología puede recibir texto y sintetizarlo en una voz
artificial (…) El proceso de conversión de texto a voz implica la
normalización del texto, la asignación de fonemas y la división prosódica
para formar proposiciones o frases. |
Validez social |
●
Percepción de aceptación social del uso de TTS por parte de
compañeros y profesores. ●
Opiniones sobre la utilidad y relevancia del TTS en el entorno
educativo. ●
Actitudes positivas o negativas hacia el uso de TTS por parte de
la sociedad en general. |
|
|
Prosodia |
●
Evaluación de la naturalidad y fluidez de la voz sintetizada del
TTS. ●
Percepción de la entonación, acentuación y ritmo del habla
generada por el TTS. ●
Detección de cambios en la prosodia para expresar emociones,
énfasis o intención comunicativa. |
|
II.5 Formulación de la hipótesis
Hay una mejora significativa en la comprensión lectora de los
estudiantes universitarios mediante el uso de herramientas de tecnología de
síntesis de voz TTS.
II.6 Diseño de la investigación
Cuasiexperimental pretest-postest con grupo de control. Este diseño
permitiría evaluar la efectividad del uso de herramientas tecnológicas de
síntesis de voz TTS en la mejora de la comprensión lectora al comparar un grupo
experimental que utiliza estas herramientas con un grupo de control que no las
utiliza.
Cronología de observaciones: Se realizaría una medición inicial (pretest) para
evaluar el nivel de comprensión lectora de los participantes antes de la
intervención. Luego, se implementaría la intervención utilizando las
herramientas tecnológicas de síntesis de voz TTS en el grupo experimental
durante un período determinado. Después de la intervención, se realizaría una
medición final (postest) para evaluar el impacto de las herramientas en la
comprensión lectora de ambos grupos.
Número de mediciones: Se realizarían al menos dos mediciones: una antes de la
intervención (pretest) y otra después de la intervención (postest). Sin
embargo, también podrían incluirse mediciones adicionales durante la
intervención para evaluar el progreso a lo largo del tiempo.
2.4.1
Objeto de estudio
Estudiantes de escuela
secundaria y/o superior.
Población objetivo: Estudiantes de escuela secundaria y superior
disponibles y accesibles en un contexto determinado.
Muestra: Una selección de estudiantes de escuela secundaria y
superior que estén convenientemente disponibles para participar en el estudio.
En un muestreo no probabilístico por conveniencia, la muestra
se selecciona basándose en la conveniencia y accesibilidad de los
participantes, en lugar de utilizar métodos de selección aleatoria o
estratificada. Esto implica que la muestra puede no ser representativa de la
población objetivo en su totalidad, y los resultados obtenidos pueden tener
limitaciones en términos de generalización a otras poblaciones o contextos.
2.4.2
Instrumentación (para la
recolección datos por el autor) i/o fuentes de datos (no recolectados por el
autor)
Instituciones educativas (escuelas secundarias y superiores)
donde se llevará a cabo la investigación, así como los usuarios objetivo
(estudiantes) y los docentes o profesionales involucrados en el uso de las
herramientas tecnológicas. También podrías considerar el uso de literatura
científica previa, estudios relacionados y bancos de datos existentes sobre la
comprensión lectora y el uso de herramientas tecnológicas en la educación.
2.4.3
Métodos y técnicas
Técnicas e instrumentos de recolección de datos:
Cuestionarios: Cuestionarios para recopilar
información sobre las preferencias y la aceptación de las herramientas
tecnológicas de síntesis de voz en los estudiantes. Estos cuestionarios pueden
incluir preguntas cerradas y abiertas para obtener una visión más completa de
las opiniones y experiencias de los participantes.
Pruebas de comprensión
lectora:
Pruebas estandarizadas de comprensión lectora antes y después de la
intervención con las herramientas de síntesis de voz. Esto permitirá evaluar la
mejora en la comprensión lectora de los estudiantes.
Observación: Observaciones en el aula
para recopilar información cualitativa sobre el uso de las herramientas
tecnológicas y su impacto en los estudiantes. Esto puede proporcionar una
perspectiva más detallada sobre las experiencias y comportamientos de los
participantes.
2.5 Referencias bibliográficas
García-Mata, C.L.,
Rodríguez-Cabrera, O., y Rodríguez-Aguilar, Y. (2000). Revisión de la tecnología de síntesis de voz y recursos lingüísticos
existentes para el idioma Español. En HAVOL 2000. 1er. Taller Internacional
de Tratamiento del Habla, Procesamiento de Voz y el Lenguaje (pp. 150-163).
México: Secretaría de Educación Pública-CONACULTA.
Beutnagel, M., Conkie, A.,
Schroeter, J., Stylianou, Y., y Syrdal, A. (1999). The AT&T Next-Gen TTS System. En Joint Meeting of ASA EAA and DAGA
(pp. 18-24). Berlín: Acoustical Society of America.
Portele,
T., Heuft, B., y Widera, A. (1997). HADIFIX: A German Text-to-Speech System for Telephone Applications. En EUROSPEECH'97 (pp.
2359-2362). Rodas: ISCA.5. Tipos de herramientas tecnológicas de síntesis de
voz disponibles para mejorar la comprensión lectora.
Texto a voz - Generador de
texto a voz de IA realista | Microsoft Azure. (n.d.).
Retrieved July 7, 2023, from
https://azure.microsoft.com/es-es/products/cognitive-services/text-to-speech/
TTSReader | Lector de textos
con voz . Online. Preciso. Gratis. (n.d.). Retrieved July 7,
2023, from https://ttsreader.com/es/
Aplicaciones y herramientas para leer absolutamente toda
clase de texto en voz alta - Web del Maestro CMF. (n.d.).
Retrieved July 7, 2023, from https://webdelmaestrocmf.com/portal/aplicaciones-y-herramientas-para-leer-absolutamente-toda-clase-de-texto-en-voz-alta/
(Wood, S. G.,
Moxley, J. H., Tighe, E. L., & Wagner, R. K. (2018). Does Use of Text-to-Speech and Related Read-Aloud Tools Improve
Reading Comprehension for Students With Reading Disabilities? A Meta-Analysis.
Journal of Learning Disabilities, 51(1), 73–84. https://doi.org/10.1177/0022219416688170)
Muñoz, C., Valenzuela, J.,
Avendaño, C., & Núñez, C. (2016).
Mejora en la motivación por la Lectura Académica: la mirada de estudiantes
motivados. Ocnos: Revista de Estudios sobre Lectura, 15, 52-68.
https://www.revistaocnos.com/index.php/ocnos/article/view/323
Fuente: Speechify (2021). El mejor lector de textos con voz gratuito. Recuperado
de https://speechify.com/es/
Mckee,
S. (2012). Reading comprehension, what we
know: A review of research 1995 to 2011. Language Testing in
Asia, 2(1), 45. 2229-0443-2-1-45.pdf (springer.com)
Cevallos Bone, S.R. (2023).
Técnicas y Estrategias para la Comprensión Lectora: una Propuesta Didáctica.
Revista Científica Hallazgos21, 8 (2), 191-208. http://revistas.pucese.edu.ec/hallazgos21/
Heggtveit, P. O.
(2003). An overview of text-to-speech synthesis. TELEKTRONIKK, 99(2), 30-44.
Firma
del autor
VºBº
Asesor
Comentarios
Publicar un comentario