Tres
[29 de Octubre de 2003, Piscataway, New Jersey; mis reuniones con el grupo de investigación]
Mi campo de investigación es la computación gráfica, la interacción humano-computadora y los agentes conversacionales (un agente conversacional es una figura animada con comportamiento “humano”, un pésimo ejemplo es “Clippy”, el difunto asistente de MS Office con forma de clip). La investigación sobre AC mezcla varias disciplinas: computación gráfica, animación, bio-mecánica, linguística, teoría del conocimiento. Lo sorprendente es lo poco que se sabe respecto a cómo los humanos interactuamos en una conversación y eso hace imposible reproducirla eficientemente. Las dificultades abundan. Los reconocedores de voz tienen que ser entrenados extensamente, las animaciones son duras y robóticas (si son “interactivas”) y la generación de habla es metálica (si es sintetizada) o fragmentada (si se arma a partir de grabaciones de unidades de habla, como los anuncios automatizados en el subte). A esto agréguese la capa de complejidad que los gestos agregan a la comunicación: no sólo complementan el discurso sino que pueden cambiar radicalmente su significado. Tanto reconocer los gestos como generarlos o sincronizarlos adecuadamente (con el discurso del interlocutor o con el propio discurso) es arduo y muchas veces imposible.
(more…)