Aspectes ètics i legals en la construcció d'un corpus oral de conversa conflictiva
##plugins.themes.bootstrap3.article.main##
Resum
La creació d'un corpus oral, definit com una col·lecció d'enregistraments de parla natural disposats per al tractament computacional, presenta diversos desafiaments que han de ser considerats amb cura per garantir-ne la qualitat i la utilitat. En un corpus de les característiques del que es presenta a continuació, el corpus ESPRINT de conversa conflictiva entre persones amb una relació íntima, el repte principal té a veure amb atendre els principis ètico-legals que implica tant la seva recopilació com el posterior processament per a l'anàlisi lingüística. En tot cas, cal garantir el dret a la privadesa dels participants i el seu anonimat. El corpus ESPRINT presenta una doble naturalesa, d'una banda conversacional (ESPRINT-Conversa), de l'altra, terapèutica (ESPRINT-Teràpies), fet que implica dos modes de recollida, així com de tractament de les dades, de gestió de la privadesa i de l'emmagatzematge i anàlisi, ja que les teràpies s'enregistren en un context clínic sociosanitari amb especificitats quant a l'accés a les dades, que obliga a un estricte protocol d'emmagatzematge i una política clara sobre qui pot accedir al corpus, amb quins fins i baix quines condicions, respectant els drets d'intimitat i els acords de consentiment. A més, en ambdós casos, cal extremar les precaucions atès el contingut sensible dels enregistraments. Les actuacions dutes a terme des de la direcció del corpus ESPRINT en matèria de protecció de dades garanteixen el compliment dels preceptes legals, així com la salvaguarda del dret a la intimitat i el tractament ètic de les dades.
Descàrregues
##plugins.themes.bootstrap3.article.details##

Aquesta obra està sota una llicència internacional Creative Commons Reconeixement-CompartirIgual 4.0.
S'utilitza una llicència de drets d'autor CREATIVE COMMONS d'accés obert. Aquells autors les obres dels quals siguin publicades per aquesta revista, accepten els termes següents:
- a. Els autors conservaran els seus drets d'autor i garantiran a la revista el dret a publicar primer la seva obra, que estarà simultàniament subjecta a la Llicència de Reconeixement Creative Commons CC BY SA que permet a tercers compartir l'obra sempre que s'indiqui el seu autor i la seva primera publicació.
- b. Els autors podran adoptar altres contractes de llicència no exclusius per a la distribució de la versió publicada de l'obra (per exemple, dipositar-la en un arxiu telemàtic institucional o publicar-la en un volum monogràfic) sempre que s'indiqui la publicació inicial en aquesta revista.
- Els autors poden -i es recomana- difondre la seva obra a través d'Internet (per exemple, en arxius telemàtics institucionals o a la seva pàgina web) abans i durant el procés de presentació, la qual cosa pot produir intercanvis interessants i augmentar les citacions de l'obra publicada.
##plugins.generic.funding.fundingData##
-
Ministerio de Ciencia e Innovación
##plugins.generic.funding.funderGrants## MCIN/AEI /10.13039/501100011033
Referències
Adolphs, Svenja y Knight, Dawn (2010). Building a spoken corpus. What are the basics? En Anne O’Keeffe y Michael J. McCarthy (Eds.), The Routledge Handbook of Corpus Linguistics, pp. 38-52, Routledge.
Agencia Española de Protección de Datos. (2016). Orientaciones y garantías en los procedimientos de anonimización de datos personales. En línea, https://datos.gob.es/es/documentacion/orientaciones-y-garantias-en-los-procedimientos-de-anonimizacion-de-datos-personales
Agencia de los Derechos Fundamentales de la Unión Europea y Consejo de Europa, (2014). Manual de legislación europea en materia de la protección de datos, Oficina de Publicaciones de la Unión Europea.
Albelda, Marta y Estellés, Maria (coords.) (En línea). Corpus Ameresco, Universitat de València, ISSN: 2659-8337, en línea, www.corpusameresco.com
Briz Gómez, Antonio (2012). Los déficits de los corpus orales del español (y de algunos análisis). En Jiménez, Tomás et al. (coord.), Cum corde et in nova grammatica: estudios ofrecidos a Guillermo Rojo, pp. 115-137, Universidade de Santiago de Compostela.
Briz Gómez, Antonio y Albelda Marco Marta (2009). Estado actual de los corpus de lengua española hablada y escrita: I+D. En Anuario del Instituto Cervantes, El español en el mundo, pp. 165-226, Instituto Cervantes.
Briz Gómez, Antonio y Carcelén Guerrero, Andrea (2019). El futuro iberoamericano del español: la investigación del español oral y en español. En El español en el mundo 2019, Instituto Cervantes, 189-217, Bala Perdida.
Briz Gómez, Antonio et al. (2019). Protocolo de trabajo para los equipos Ameresco. En línea https://esvaratenuacion.es/protocolo-de-trabajo (versión actualizada enero de 2020).
Carcelén Guerrero, Andrea (2024). Bases teórico-metodológicas para la construcción de un corpus multidialectal de conversación coloquial: el corpus Ameresco. [Tesis doctoral, Universitat de València]. Repositorio institucional Roderic https://hdl.handle.net/10550/92265
Carcelén Guerrero, Andrea (en prensa). ¿Es posible elaborar corpus orales espontáneos y cumplir legislación? El modelo en tres fases del corpus Ameresco. Revista Española de Lingüística Aplicada.
Carcelén Guerrero, Andrea y Uclés Ramada, Gloria (2019). Diseño y construcción de un corpus oral multidialectal. El corpus Ameresco. Normas: Revista de Estudios Lingüísticos Hispánicos, 9 (1), pp. 17-36.
Childs, Becky, Van Herk, Gerard y Thorburn, Jennifer (2011). Safe harbour: Ethics and accesibility in sociolinguistic corpus building. Corpus Linguistics and Linguistic Theory (7-1), pp. 163-180.
D’Arcy, Alexandra y Bender, Emily (2023). Ethics in Linguistics, Annual Review of Linguistics, 9 (1), pp. 49-69.
ELAN (Version 6.7) [Software informático]. (2023). Nijmegen: Max Planck Institute for Psycholinguistics, The Language Archive. Obtenido de https://
archive.mpi.nl/tla/elan
Enghels, Renata, Vanderschueren, Clara y Bouzouita, Miriam (2015). Panorama de los corpus y textos del español peninsular contemporáneo. En Maria Iliescu y Eugeen Roegiest (Ed.), Manuel des anthologies, corpus et textes romans, pp. 147-170, De Gruyter.
Ley Orgánica 1/1982, de 5 de mayo, de Protección civil y derecho al honor, la intimidad personal y a la propia imagen.
Ley Orgánica 10/1995, de 23 de noviembre, del Código Penal.
Ley Orgánica 3/2018, de 5 de diciembre, de Protección de datos personales y garantía de los derechos digitales.
Llisterri, Joaquín (2021). Corpus para investigar sobre el componente fónico en español como LE/L2. En Mar Cruz y Javier Muñoz (Eds.), e-Research y español LE/L2.: investigar en la era digital, pp. 164-196, Routledge.
McEnery, Tony, y Hardie, Andrew (2011). Corpus Linguistics: Method, Theory and Practice, Cambridge University Press.
Moreno Fernández, Francisco (2005), Corpora of Spoken Spanish Language. The Representativeness Issue. En Yuji Kawaguchi et al. (Eds.), Linguistic Informatics, State of the Art and the Future, pp. 120-144, John Benjamins.
Parodi, Giovanni y Burdiles, Gina (2019). Corpus y bases de datos (Corpora and databases). En Javier Muñoz et al. (coord.), The Routledge Handbook of Spanish Language Teaching: metodologías, contextos y recursos para la enseñanza del español, pp. 596-612, Routledge.
Pons Bordería, Salvador (dir.) (En línea). Corpus Val.Es.Co 3.0. http://www.valesco.es
Rock, Frances (2001). Policy and Practice in the Anonymisation of Linguistic Data, International Journal of Corpus Linguistics 6(1), pp.1-26.
Rojo, Guillermo (2016), Citius, maius, melius. Del CREA al CORPES XXI. En Johannes Kabatek, Carlota de Benito Moreno (coords.), Lingüística de corpus y lingüística histórica iberorrománica, pp. 197-212, De Gruyter.
Schneider, Klaus P. (2018). Methods and ethics of data collection. En Andreas H. Jucker, Klaus P. Schneider y Wolfram Bublitz (ed.), Methods in Pragmatics, pp. 37-93, De Gruyter.
Solís García, Inmaculada (2018). Corpus españoles dialógicos para el análisis de la conversación. CHIMERA: Romance Corpora and Linguistic Studies, 5 (1), pp. 117-129.
Vázquez, Victoria y Recalde, Monserrat (2009). Problemas metodológicos en la formación de corpus orales. En Pascual Cantos y Aquilino Sánchez (Eds.), A survey of corpus-based research, pp. 51-64. Recurso electrónico https://www.um.es/lacell/aelinco/contenido/index.html